freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

論基于股票時間序列數據的關聯(lián)規(guī)則挖掘研究(已修改)

2025-07-05 00:22 本頁面
 

【正文】 南昌大學2003級碩士學位論文文獻綜述報告基于股票時間序列數據的關聯(lián)規(guī)則挖掘研究Study on Mining Association Rules from Stock Time Series Data 系 別: 計算機科學與技術系專 業(yè): 計算機應用技術研究方向: 人工智能研 究 生: 汪廷華導 師: 程從從(教授)2005年03月一.引言隨著計算機信息系統(tǒng)的日益普及,大容量存儲技術的發(fā)展以及條形碼等數據獲取技術的廣泛應用,人們在日常事務處理和科學研究中積累了大量的各種類型的數據。在這些數據中,有很大一部分是呈現時間序列(time series)類型的數據。所謂時間序列數據就是按時間先后順序排列各個觀測記錄的數據集[1],如金融證券市場中每天的股票價格變化;商業(yè)零售行業(yè)中,某項商品每天的銷售額;氣象預報研究中,某一地區(qū)的每天氣溫與氣壓的讀數;以及在生物醫(yī)學中,某一癥狀病人在每個時刻的心跳變化等等。然而,我們應該注意到:時間序列數據不僅僅是歷史事件的記錄,更重要的是蘊藏這些數據其中不顯現的、有趣的模式。隨著時間推移和時間序列數據的大規(guī)模增長,如何對這些海量數據進行分析處理,挖掘其背后蘊藏的價值信息,對于我們揭示事物發(fā)展規(guī)律變化的內部規(guī)律,發(fā)現不同事物之間的相互關系,為人們正確認識事物和科學決策提供依據具有重要的實際意義。時間序列數據分析按照不同的任務有各種不同的方法,一般包括趨勢分析、相似性搜索、與時間有關數據的序列模式挖掘、周期模式挖掘等[2]。本綜述是針對證券業(yè)中股票時間序列分析的,試圖通過列舉、分析有關證券業(yè)中股票時間序列數據分析的原理、方法與技術,著重探討數據挖掘中基于股票時間序列數據的關聯(lián)規(guī)則挖掘的概念、原理技術、實施過程及存在的障礙和問題,以期能有新的發(fā)現和領悟。二.股票時間序列傳統(tǒng)研究方法概述隨著我國市場經濟建設的發(fā)展,人們的金融意識和投資意識日益增強。股票市場作為市場經濟的重要組成部分,正越來越多地受到投資者的關注。目前股票投資已經是眾多個人理財中的一種重要方式。不言而喻,如果投資者能正確預測股票價格、選準買賣時機,無疑會給投資者帶來豐厚的收益。于是,在股票的預測和分析方面出現了大量的決策分析方法和工具,以期能有效地指導投資者的投資決策。目前,我國股市用得較多的方法概括起來有兩類[3]:一類是基本分析和技術分析,另一類是經濟統(tǒng)計分析。1.基本分析和技術分析在股票市場上,當投資者考慮是否投資于股票或購買什么股票時,一般可以運用基本分析的方法對股市和股票進行分析;而在買賣股票的時機把握上,一般可以運用技術分析的方法[4]?;痉治鲋傅氖峭ㄟ^對影響股票市場供求關系的基本因素(如宏觀政治經濟形勢、金融政策、行業(yè)變動、公司運營財務狀況等)進行分析,來確定股票的真正價值,判斷未來股市走勢,是長期投資者不可或缺的有效分析手段。技術分析是完全根據股市行情變化而加以分析的方法,它通過對歷史資料(成交價和成交量)進行分析,來判斷大盤和個股價格的未來變化趨勢,探討股市里投資行為的可能轉折,從而給投資者買賣股票的信號,適合于投資者作短期投資。目前技術分析常用的工具是各種各樣的走勢圖(K線圖、分時圖)和技術指標(MA、RSI、OBV等)。2.經濟統(tǒng)計學分析主要針對時間序列數據進行數學建模和分析。傳統(tǒng)的時間序列數據分析已經是一個發(fā)展得相當成熟的學科,有著一整套分析理論和工具,是目前時間序列數據分析的主要方法,它主要用經濟統(tǒng)計學的理論和方法對經濟變量進行描述、分析和推算。傳統(tǒng)時間序列數據分析的研究目的在于[5]:●分析特定的數據集合,建立數學模型,進行模式結構分析和實證研究;●預測時間序列的未來發(fā)展情況。傳統(tǒng)的時間序列數據分析最基本的理論是40年代分別由Norbor Wiener和Andrei Kolmogomor提出的。20世紀70年代,《時間序列分析:預測和控制》,對平穩(wěn)時間序列數據提出了自回歸滑動平均模型(ARMA),以及一整套的建模、估計、檢驗和控制方法,使得時序數據分析得以廣泛運用于各種工程領域。其基本思想是根據各隨機變量間的依存關系或自相關性,從而由時間序列的過去值及現在值來預測出未來的值。該模型以證券市場為非有效市場為前提,當期的股票價格變化不僅受當期隨機因素的沖擊,而且受前期影響。換句話說,就是歷史信息會對當前的股票價格產生一定程度的影響。采用的方法一般是在連續(xù)的時間流中截取一個時間窗口(一個時間段),窗口內的數據作為一個數據單元,然后讓這個時間窗口在時間流上滑動,以獲得建立模型所需要的訓練集[6]。[7]基于股票時間序列是一種混沌時間序列的認知,提出一種新穎的非線性時間序列預測模型,即滑動窗口二次自回歸(MWDAR)模型,該模型使用部分的歷史數據及其二次項構造自回歸模型,模型參數用最小二乘法估計。其基本理論基礎是:一個線性模型不能描述混沌時間序列的全局性特征,但在一個小的時間間隔內,系統(tǒng)的行為卻可以用某種線性模型近似。[8]則提出了一種基于嵌入理論和確定集上的預測誤差的混沌時間序列預測方法,并探討了在股票價格預測上的應用。可以看出,經濟統(tǒng)計學為問題的探索解決方案提供了有用而實際的框架;模型是經濟統(tǒng)計學的核心,模型的選擇和計算往往被認為是次要的,是建立模型的枝節(jié)。經濟統(tǒng)計學本質上是從事“確定性”分析的,可以說統(tǒng)計方法是“目標驅動”的。但是,在大量數據集中往往存在一些未被人們預期到但又具有價值的信息,人們?yōu)榘l(fā)現大量數據中隱藏的規(guī)律和模式,就需要新的具有“探索性”的分析工具。顯然,數據挖掘就是這樣的一門工具。三.數據挖掘技術應用于股票時間序列分析的研究現狀數據挖掘(DM,Data Mining),也稱為數據庫中的知識發(fā)現(KDD,Knowledge Discovery in Database)是數據庫技術和機器學習等人工智能技術相結合的產物,是一門新興的數據智能分析技術[9]。20世紀80年代末,隨著數據庫、互聯(lián)網技術的迅速發(fā)展以及管理信息系統(tǒng)(MIS)和網絡數據中心(IDC)的推廣應用,數據的存取、查詢、描述統(tǒng)計等技術已日臻完善,但高層次的決策分析、知識發(fā)現等實用技術還很不成熟,導致了“信息爆炸”但“知識貧乏”的現象。到了90年代,人們提出在數據庫基礎上建立數據倉庫,應用機器學習和統(tǒng)計分析相結合的方法處理數據,這兩者的結合促成了數據挖掘技術的誕生。所謂數據挖掘,簡單地說,就是從大量數據中提取或挖掘知識[2];詳細一點可以描述為主要利用某些特定的知識發(fā)現算法,在一定的運算效率的限制下,從大量的數據中抽取出潛在的、有價值的知識(模型、規(guī)則和趨勢)的過程。挖掘算法的好壞直接影響到知識發(fā)現的質量和效率,因此目前大多數研究都集中于數據挖掘算法及其應用上。1.相關技術介紹(1)關聯(lián)規(guī)則挖掘關聯(lián)規(guī)則是美國IBM Almaden Research Center的 Rakesh Agrawal等人于1993年首先提出來的KDD研究的一個重要課題[10]。關聯(lián)規(guī)則挖掘本質是從大量的數據中或對象間抽取關聯(lián)性,它可以揭示數據間的依賴關系,根據這種關聯(lián)性就可以從某一數據對象的信息來推
點擊復制文檔內容
語文相關推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1