freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第5章利用關(guān)聯(lián)規(guī)則挖掘股票之間的關(guān)系-中山大學(xué)信息科學(xué)與技術(shù)-文庫吧資料

2024-11-15 13:57本頁面
  

【正文】 當(dāng)于對 y[n]作了數(shù)字濾波處理,得到了 M[n]之后接下來是如何與基本的形 17 態(tài)模式匹配的問題。選用何種指標(biāo)作為其時(shí)序數(shù)據(jù)的表示是要考慮的問題,由于主要是對其中 線的趨勢感興趣,同時(shí)股票的短期波動是有一定的隨機(jī)性,所以采用其 5天的平均價(jià)來描述數(shù)據(jù)序列。 當(dāng)收盤價(jià)大于開盤價(jià)時(shí)為陽線,收盤價(jià)小于開盤價(jià)時(shí)為陰線,其差價(jià)構(gòu)成實(shí)體的大小。分別計(jì)算其斜率: 圖 2 斜率的計(jì)算 得到 K[n]作為其邏輯表述形式,如上升三角形的示意。其他的方法有用離散傅立葉變換 (DFT)將其變換到頻域,然后取其前幾位系數(shù) (fc),作為基本形態(tài)子序列的邏輯表示,但表示和計(jì)算都較復(fù)雜,該文采用一種簡潔方便的方法 ── 趨勢線段斜率方法作為其邏輯表示法。根據(jù)先驗(yàn)的知識,將這些形態(tài)選出來,作為基本的形態(tài),以便用來分析序列模式。針對股票價(jià)格的實(shí)際情形,采用以下手段進(jìn)行分析:首先選定子序列的形式,然后建立模式的相關(guān)的表現(xiàn)方法,通過對子序列模式相似性的計(jì)算,最終將序列分解表述為各種子模式的組合。 [10] 以下簡單介紹 一種基于時(shí)序模式關(guān)聯(lián)規(guī)則 在股票技術(shù)分 析中的一種比較常見的應(yīng)用。 [9]技術(shù)分析的 主要內(nèi)容有圖表解析與技術(shù)指標(biāo)兩大類。而技術(shù)分析則是透過圖表或技術(shù)指標(biāo)的記錄,研究市場過去及現(xiàn)在的行為反應(yīng),以推測未來價(jià)格的變動趨勢。 所謂股價(jià)的技術(shù)分析,是相對于基本分析而言的。結(jié)果如下: 2 1, 8 1, 9 1 五糧液、深發(fā)展 A、浦發(fā)銀行 4 1, 8 1, 9 1 申能股份、深發(fā)展 A、浦發(fā)銀行 5 1, 8 1, 9 1 深圳能源、深發(fā)展 A、浦發(fā)銀行 6 1, 8 1, 9 1 格力電器、深發(fā)展 A、浦發(fā)銀行 7 1, 8 1, 9 1 美的電器、深發(fā)展 A、浦發(fā)銀行 結(jié)果再次證明深發(fā)展 A 和浦發(fā)銀行這兩只股票對大市的影響相當(dāng)之大。這也不難理解,因?yàn)閮芍还善痹跍顑墒惺潜容^重要的股票,它們的走向?qū)Υ笫杏斜容^大的影響。另外, 三組同一行業(yè)的股票都有聯(lián)系,但云南白藥與同仁堂,格力電器與美的電器的走勢卻沒有什么聯(lián)系。 將支持度設(shè)定為 20%,程序生成了 2頻繁項(xiàng)集之后便停止了,證明沒有 3項(xiàng)的支持度可以超過 20%。其中有些是滬市深市各選一只,另外的是來自同一股票市場的。 源程序 見附錄 2 結(jié)果分析 被選入數(shù)據(jù)庫的十只股票分別是: 000538(云南白藥)、 600085(同仁堂)、 000858(五糧液)、 600779(水 井坊)、 600642(申能股份)、 000027(深圳能源)、 000651(格力電器)、 000527(美的電器)、 000001(深發(fā)展 A)、 600000(浦發(fā)銀行)。 但 一旦支持度設(shè)定高了,那么單只股票的升跌趨勢也有可能不屬于頻繁項(xiàng)集。 另外,在上實(shí)驗(yàn)里 所提到的股票增發(fā)、拆分等引起股價(jià)異常變動的情況在本實(shí)驗(yàn)依然存在,但考慮到影響亦不大,所以不作特殊處理。另一種處理就是只取所有股票都有交易數(shù)據(jù)的日期。一般可以用兩種方法處理,一種是所有日期都錄入,如某些日期某一股票因故停牌等就作缺失處理。 在這個(gè)實(shí)驗(yàn)里, T1 , T2 , T3 , T4 繼續(xù)沿用上個(gè)實(shí)驗(yàn)的 , , , 。本文中只考慮股票之間在同一天之內(nèi)的漲跌情況,而且將漲跌如第一個(gè)應(yīng)用里一樣再細(xì)分成幾種情況,希望得到進(jìn)一步的結(jié)論。 在筆者所查閱的參考文獻(xiàn)里面,比較普遍的做法是利用關(guān)聯(lián)規(guī)則研究傾向同時(shí)漲跌的股票,對股票的預(yù)處理簡單地分為漲和跌。由于 上市公司之間由于存在合作、競爭等關(guān)系 , 因此某些股票價(jià)格在一定時(shí)間內(nèi)會出現(xiàn)相似或相反的趨勢 。 將 600050(中國聯(lián)通)和上證指數(shù) 000001 比較,得出以下結(jié)果: 表 42 中國聯(lián)通和上證指數(shù)關(guān)聯(lián)分析結(jié)果 0 支持度 1 支持度 2 支持度 3 支持度 4 支持度 0 17 % 18 % 3 % 1 % 0 0% 1 1 % 23 % 4 % 2 % 0 0% 2 4 % 214 % 38 % 15 % 3 % 3 0 0% 162 % 219 % 144 % 5 % 11 4 0 0% 30 % 63 % 190 % 14 % 5 0 0% 10 % 8 % 39 % 13 % 6 1 % 0 0% 0 0% 26 % 12 % 得到以下強(qiáng)規(guī)則: 2 1 上證指數(shù)小幅跌,中國聯(lián)通小幅跌 4 3 上證指數(shù)持平,中國聯(lián)通微揚(yáng) 6 3 上證指數(shù)急升,中國聯(lián)通微揚(yáng) 可見中國聯(lián)通表現(xiàn)平平,從上證指數(shù)急升,中國聯(lián)通微揚(yáng)可以得知在大市急升的時(shí)候中國聯(lián)通很少被當(dāng)作炒作的對象。于是,關(guān)聯(lián)規(guī)則階段只需挖掘出 1項(xiàng)集中的頻繁項(xiàng)集,并找出強(qiáng)規(guī)則即可。因此,我們直接將股票指數(shù)和股票的各種漲跌情況聯(lián)系起來,當(dāng) 作1項(xiàng)集。 關(guān)聯(lián)規(guī)則挖掘 經(jīng)過數(shù)據(jù)預(yù)處理后,得到的是一個(gè)股票指數(shù)與股票交易數(shù)據(jù)時(shí)間上一一對應(yīng)的行情趨勢集。 有一個(gè)值得注意的問題,就是股票有時(shí)候會因?yàn)橥E?,開股東大會等原因停止交易,導(dǎo)致當(dāng)天沒有交易數(shù)據(jù),所以在預(yù)處理數(shù)據(jù)的時(shí)候要確保股票數(shù)據(jù) 的日期和股票指數(shù)的日期相一致,將缺失交易數(shù)據(jù)的天數(shù)剔除掉。而由于股票 指數(shù)沒有漲跌幅限制的說法,而且波動有可能會很大,所以我們定義跌一百點(diǎn)以上為暴跌,跌一百到五十點(diǎn)為下挫,跌五十點(diǎn)到十點(diǎn)為小幅跌,漲跌十點(diǎn)以內(nèi)為持平,漲十點(diǎn)到五十點(diǎn)為微揚(yáng),漲五十點(diǎn)到一百點(diǎn)為上揚(yáng),漲一百點(diǎn)以上為急升。 [3] 在我們的實(shí)驗(yàn)里,由于股票有每天漲跌幅百分之十的限制,所以我們定義股票跌百分之五以上為暴跌,跌百分之五到千分之五為小幅跌,跌千分之五到漲千分之五為持平,升千分之五到升百分之五為微揚(yáng),升百分之五以上為上揚(yáng)。 T1 , T2 , T3 , T4 , T5 , T6可以根據(jù)實(shí)際情況進(jìn)行調(diào)節(jié)。若 Kj ∈ ( T3 , T4) ,則 Aj = d 。若 Kj ∈ ( T1 , T2) ,則 Aj = b。其中 Aj∈ { a , b , c , d , e , f , g} 代表了趨勢狀況 , ( a , b , c , d , e , f , g ) 分別代表暴跌、下挫、小幅跌、持平、微揚(yáng)、上揚(yáng)和急升。 Index = { R1 , R2 , R3 , ? ,Rm} , Rj 為該指數(shù)在第 j 個(gè)時(shí)刻的 行情 (1 ≤ j ≤ n) ,可以包括時(shí)間、開盤點(diǎn)數(shù)、收盤點(diǎn)數(shù)、最高點(diǎn)數(shù)、最低點(diǎn)數(shù)、漲幅、成交量與成交額等內(nèi)容 (本實(shí)驗(yàn)取收盤點(diǎn)數(shù)) 。 [2] 對于股票指數(shù),我們采取類似的處理方法,但考慮到股票每天點(diǎn)數(shù)的變化可以很大,不像股票般有漲跌幅限制,所以有必要為股票指數(shù)的漲跌情況多分幾種情況。若 Kj T4 ,則 Aj = e。若 Kj ∈ ( T2 , T3) ,則 Aj = c 。則交易行情記錄集 Si 可以按照下列原則映射到交易行情走勢集 Ai : 設(shè) Kj = ( Rj +1 Rj) / Rj ,若 Kj ≤ T1 ,則 Aj = a 。 [2] 定義 2 設(shè)交易行情趨勢集 P = { A1 , A2 , A3 ,? , Am} , 表示當(dāng)前交易價(jià)格與前一個(gè)記錄時(shí)刻的交易價(jià)格的比較 ,并將行情映射到若干趨勢狀況區(qū)間中。 數(shù)據(jù)預(yù)處理 為便于研究分析 ,首先需要將股票數(shù)據(jù)庫中 股票的與股票指數(shù) 的數(shù)值型屬性序 8 列處理成交易行情趨勢序列 ,為此引入以下定義 : 定義 1 設(shè) S 記錄了一只股票在 m 個(gè)時(shí)間點(diǎn)的歷史行情記錄。 然而事實(shí)上,一般應(yīng)用關(guān)聯(lián)規(guī)則股票進(jìn)行數(shù)據(jù)挖掘的論文都集中研究股票與股票之間的關(guān)系,幾乎沒有考慮股票與股票指數(shù)的關(guān)系。投資者據(jù)此就可以檢驗(yàn)自己投資的效果,并用以預(yù)測股票市場的動向。對于具體某一種股票的價(jià)格變化,投資者容易了解,而對于多種股 票的價(jià)格變化,要逐一了解,既不容易,也不勝其煩。 股市指數(shù),它 是由證券交易所或金融服務(wù)機(jī)構(gòu)編制的表明股票行市變動的一種供參考的指示數(shù)字。但這一事實(shí)仍然成立:大多數(shù)股票都傾向于同步波動(不用說,它們現(xiàn)在這樣,并且將永遠(yuǎn)如此)。 銀行家與商人早已熟知以下事實(shí):大多數(shù)上市公司的股票價(jià)格都傾向于同時(shí)漲跌;而那些與金融總體趨勢相反的特例則很少, 而那些與金融總體趨勢相反的特例很少,并且一般來說它們不會持續(xù)這種相反的走勢超過幾天或幾周的時(shí)間 。 7 第四章 利用關(guān)聯(lián)規(guī)則研究股票與大盤走勢的關(guān)系 概述 下面我們開始探討關(guān)聯(lián)規(guī)則在股票分析中的幾種應(yīng)用。為壓縮 Ck,可以用以下辦法使用Apriori 性質(zhì):任何非頻繁的 (k1)子集不在 Lk1中,則該候選也不可能是頻繁的,從而可以由 Ck中刪除。掃描數(shù)據(jù)庫,確定 Ck中每個(gè)候選的計(jì)數(shù),從而確定Lk(即根據(jù)定義,計(jì)數(shù)值不小于最小支持度計(jì)數(shù)的所有候選是頻繁的,從而屬于 Lk)。 ( 2)剪枝步: Ck是 Lk的超集。條件 ( l1[k1] l2[k1])是簡單地保證不產(chǎn)生重復(fù)。執(zhí)行連接 Lk1 ≯≮ Lk1,其中 Lk1的元素是可連接的,如果它們前 (k2)個(gè)項(xiàng)相同。記號 li[j]表示 li的第 j項(xiàng)。該候選項(xiàng)集的集合記作 Ck。它由連接和剪枝兩步組成。稱它為反單調(diào),是因?yàn)樵谕ú贿^測試的意義下,該性質(zhì)是單調(diào)的。因此, I∪ A 也不是頻繁的,即 P(I∪ A) min_sup。 Apriori 性質(zhì)基于如下觀察:根據(jù)定義,如果項(xiàng)集 I 不滿足最小支持度閥值 min_sup,則 I不是頻繁的,即 P(I) min_sup。 為提高頻繁項(xiàng)集逐層產(chǎn)生的效率,一種稱作 Apriori 性質(zhì)的重要性質(zhì)用于壓縮搜索空間。 L1用于找頻繁 2項(xiàng)集的集合 L2,而 L2用于找L3,如此下去,直到不能找到頻繁 k項(xiàng)集。首先,找出頻繁 1項(xiàng)集的集合。算法的名字基于這樣的事實(shí):算法使用頻繁項(xiàng)集性質(zhì)的先驗(yàn)知識,正如我們將看到的。挖掘關(guān)聯(lián)規(guī)則的總體性能由第一步?jīng)Q定。 如果愿意,也可以使用附加的興趣度度量。 “如何由大型數(shù)據(jù)庫挖掘關(guān)聯(lián)規(guī)則?”關(guān)聯(lián)規(guī)則的挖掘是一個(gè)兩步的過程: ( 1)找出所有頻繁項(xiàng)集:根據(jù)定義,這些項(xiàng)集出現(xiàn)的頻率性至少和預(yù)定義的最小支持計(jì)數(shù)一樣。如果項(xiàng)集滿足最小支持度,則稱它為頻繁項(xiàng)集 (frequent itemset)。項(xiàng)集的出現(xiàn)頻率是包含項(xiàng)集的事務(wù)數(shù),簡稱為項(xiàng)集的頻率、支持計(jì)數(shù)或計(jì)數(shù)。包含 k 個(gè)項(xiàng)的項(xiàng)集稱為 k項(xiàng)集。即是 support(A=B) = P(A∪ B ( ) confidence(A=B) = P(B|A) ( ) 同時(shí)滿足最小支持度閥值 (min_sup)和最小置信度閥值 (min_conf)的規(guī)則稱作強(qiáng)規(guī)則。規(guī)則 A=B 在事務(wù)集 D 中具有置信度 c,如果 D 中包含事務(wù) A 的事務(wù)同時(shí)也包含 B 的 5 百分比是 c。規(guī)則 A=B 在事務(wù)集 D 中成立,具有支持度 s,其中 s是 D中事務(wù)包含 A∪ B(即 A和 B二者)的百分比。設(shè) A 是一個(gè)項(xiàng)集,事務(wù) T包括 A 當(dāng)且僅當(dāng) A ? T。設(shè)任務(wù)相關(guān)的數(shù)據(jù) D 是數(shù)據(jù)庫事務(wù)的集合,其中每個(gè)事務(wù) T 是項(xiàng)的集合,使得 T ? I。這些閥值可以由用戶或領(lǐng)域?qū)<以O(shè)定。考慮到即使 A, B 這一事件組合發(fā)生頻繁,但如果這一事件組合的發(fā)生次數(shù)比上 A 事件的所有發(fā)生次數(shù)的值過低,低于預(yù)先給定的臨界值的話,說明 A的發(fā)生不足以導(dǎo)致 B的發(fā)生。我們稱以上的這個(gè)概率為“支持度”。拿 A=B 這個(gè)例子來說,如果 A, B 這一事件組合在總事務(wù)記錄中出現(xiàn)概率過低,低于預(yù)先給定的臨界值,則說明這一事件組合發(fā)生的次數(shù)太少,少到我們沒有必要關(guān)注它的程度。 [1] 規(guī)則的支持度和置信度是兩個(gè)規(guī)則興趣的度量,它們分別反映發(fā)現(xiàn)規(guī)則的有用性和確定性。隨著大量數(shù)據(jù)不停地收集 和存儲,許多業(yè)界人士對于從他們的數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則越來越感興趣。本 文著重探討關(guān)聯(lián)規(guī)則在股票分析中的應(yīng)用,下面先對關(guān)聯(lián)規(guī)則的有關(guān)知識作一個(gè)介紹。 在經(jīng)濟(jì)全球化的今天 , 對數(shù)據(jù)的深層次分析可以對一個(gè)國家的發(fā)展起著舉足輕重的作用 。 此外 , 對此類數(shù)據(jù)的分析還包括對個(gè)別用戶的非正常行為的監(jiān)測 。 用戶信息的數(shù)據(jù)挖掘:股票交易庫中保存有用戶交易的歷史數(shù)據(jù) , 從這些數(shù)據(jù)我們可以采用聚類方法對用戶進(jìn)行分類 ,對不同層次用戶的行為進(jìn)行分析 。 3 相似性的發(fā)現(xiàn):運(yùn)用模式識別的方法分析二維的股票走勢圖 , 通過對二維曲線的除噪、放大、平移等操作 , 找出能在局部或整體相互匹配的股票序列 。 用戶需指定事務(wù)相關(guān)的天數(shù) , 最小支持度和最小可信度 。 周期事件的發(fā)現(xiàn):發(fā)現(xiàn)單支股票的周期規(guī)律 , 如“股標(biāo) A 通常在每周三會上漲”之類的信息 , 用戶需指定時(shí)間段的劃分個(gè)數(shù) , 最小支持度和最小可信度 。 多維關(guān)系的發(fā)現(xiàn):與一維關(guān)系的不同之處是通過查詢不同的事務(wù)交易集產(chǎn)生類似“在 IBM 和 SUN 的股標(biāo)價(jià)格上漲時(shí) , 在大多數(shù)情況下 Microsoft 的股票會在第二天上漲”的關(guān)聯(lián)規(guī)則 。 對股票數(shù)據(jù)庫中的數(shù)據(jù)資源 , 一般可以從如下幾個(gè)方面進(jìn)行挖掘: [6] 一維關(guān)系的發(fā)現(xiàn):由于上市公司之間存在直接或間接合作、競爭等關(guān)系 , 因此某些股標(biāo)在一段時(shí)間內(nèi)會出現(xiàn)相似或相反的走勢。 對經(jīng)濟(jì)學(xué)家分析不同層次用戶的投資行為和各種股票之間的關(guān)系 , 以及及時(shí)發(fā)現(xiàn)股市中的非正常行為 。 [8] 數(shù)據(jù)挖掘在股票分析中有相當(dāng)廣泛 的應(yīng)用。與 數(shù)據(jù)挖掘相近的同義詞有數(shù)據(jù)融合、數(shù)據(jù)分析和決策支持等。通過實(shí)驗(yàn)將這些應(yīng)用用在中國股市近幾年的交易數(shù)據(jù),得出一些結(jié)論, 藉此對數(shù)據(jù)挖掘在股票分析中的應(yīng)用做一個(gè)
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1