freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

論基于股票時間序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘研究-文庫吧資料

2025-06-29 00:22本頁面
  

【正文】 分向前階段與向后階段的目的與實現(xiàn)均與 AprioriAll 算法不同。AprioriAll算法采用哈希樹儲存候選序列,將所有的候選序列均儲存在哈希樹的葉子節(jié)點中;將候選序列的記數(shù)劃分為向前及向后兩階段:向前階段跳躍性地產(chǎn)生所有特定長度的頻繁序列,而向后階段找出在向前階段未考慮的頻繁序列。換句話說,關(guān)聯(lián)規(guī)則僅僅發(fā)現(xiàn)事務(wù)內(nèi)部(intratransaction)的模式,而序列模式則是發(fā)現(xiàn)事務(wù)之間(intertransaction)的模式。序列模式就是在上述顧客序列數(shù)據(jù)庫中滿足用戶指定最小支持度的最長序列。如果某序列s包含在某顧客的CS序列中,那么稱該顧客支持(Support)該序列s。一般地,令某顧客的各次交易時間為t1,t2,t3,…,tn,該顧客在交易時間ti購買的物品集記為itemset(i),于是該顧客的CS序列為itemset(t1), itemset(t2), itemset(t3),…, itemset(tn)。這里,顧客、交易時間和所購物品分別以Customer_ID、Transaction_Time和Itemset標(biāo)識。(2)序列模式挖掘序列模式(Sequential Pattern)[34]。理論從實踐中來,但最終是為了指導(dǎo)實踐。如[29]分別討論了關(guān)聯(lián)規(guī)則的客觀評價指標(biāo)(支持度、可信度和相關(guān)強度)和主觀評價指標(biāo)(新穎性、用戶感興趣性和簡潔性),在此基礎(chǔ)上給出了一種關(guān)聯(lián)規(guī)則的綜合自動評價方法??梢钥闯鐾ㄟ^引入其他領(lǐng)域的先進理論,豐富了關(guān)聯(lián)規(guī)則研究的內(nèi)容,提高了算法的有效性。(3)結(jié)合其它理論(如軟計算理論)對關(guān)聯(lián)規(guī)則進行研究。在基本關(guān)聯(lián)規(guī)則的基礎(chǔ)上提出了布爾型加權(quán)關(guān)聯(lián)規(guī)則和廣義模糊型加權(quán)關(guān)聯(lián)規(guī)則算法[24],由單層的關(guān)聯(lián)規(guī)則擴展為多層次關(guān)聯(lián)規(guī)則的研究[25]等等。關(guān)聯(lián)規(guī)則最早是由購物籃分析開始的,但是隨著研究的擴展和深入,關(guān)聯(lián)規(guī)則的應(yīng)用范圍不斷擴大,因此出現(xiàn)了多種形式關(guān)聯(lián)規(guī)則的研究。這方面包括對原有算法的進一步改進[17,18];提出一些并行挖掘算法[19,20]、增量算法[21]以及帶約束的關(guān)聯(lián)規(guī)則挖掘策略(元規(guī)則制導(dǎo)關(guān)聯(lián)規(guī)則挖掘)[22,23]。除了上述關(guān)聯(lián)規(guī)則挖掘的經(jīng)典算法之外,人們著重在以下幾個方面對關(guān)聯(lián)規(guī)則進行了研究?!坝袥]有這樣的算法,挖掘全部的頻繁項集而不產(chǎn)生候選?” 1999年Han等人提出FPGrowth算法[15],以及 Agrawal等人提出的樹-投影(Tree Project)[16]關(guān)聯(lián)規(guī)則挖掘算法就是這樣的算法,它們在性能上均獲得了突破,與Apriori算法相比,挖掘效率有了數(shù)量級的提高。[14]是結(jié)合Apriori和AprioriTid兩種算法,提出了一種混合挖掘算法AprioriHybrid,其基本思想是在掃描的早期使用Apriori算法,當(dāng)候選模式集中記錄條數(shù)小到可以放進內(nèi)存時就轉(zhuǎn)向AprioriTid算法。該算法的本質(zhì)是壓縮進一步迭代掃描的事務(wù)數(shù)。如[12]提出了稱為AprioriTid的改進算法,該算法提出了在每一步(第一步除外)計算候選頻繁項集的支持度時不需要瀏覽整個事務(wù)數(shù)據(jù)庫。雖然Apriori算法能最終挖掘出所有的關(guān)聯(lián)規(guī)則,但由于處理的數(shù)據(jù)量非常大,因而算法的效率顯得十分重要?;谶@樣的先驗知識,Apriori使用一種“逐層搜索“的迭代方法,k項集用于探索(k+1)項集。識別或發(fā)現(xiàn)所有的頻繁項集是關(guān)聯(lián)規(guī)則挖掘算法的核心,也是計算量最大的部分。第二步是從頻繁項集中構(gòu)造可信度不低于用戶要求的規(guī)則。該問題分兩步來求解:第一步是找出事務(wù)數(shù)據(jù)庫D中所有滿足條件的具有用戶指定最小支持度的項目集。這樣,就用蘊含式、支持度和可信度唯一標(biāo)識了每一個挖掘出來的關(guān)聯(lián)規(guī)則。從語義的角度來分析,規(guī)則的可信度表示這條規(guī)則的正確程度;支持度表示用這條規(guī)則可以推出百分之幾的目標(biāo),即這一規(guī)則對于整體數(shù)據(jù)的重要程度。(1) 稱關(guān)聯(lián)規(guī)則X→Y在事務(wù)數(shù)據(jù)庫D中具有大小為s的支持度,如果物品集X∪Y的支持度為s%,即support(X→Y)=P(X U Y)。I,Y205。T。I。它可以做如下形式化定義:設(shè)I = {i1,i2,...,im}是一組項的集合(例如一個商場的物品),D是一組事務(wù)集(稱之為事務(wù)數(shù)據(jù)庫)。1.相關(guān)技術(shù)介紹(1)關(guān)聯(lián)規(guī)則挖掘關(guān)聯(lián)規(guī)則是美國IBM Almaden Research Center的 Rakesh Agrawal等人于1993年首先提出來的KDD研究的一個重要課題[10]。所謂數(shù)據(jù)挖掘,簡單地說,就是從大量數(shù)據(jù)中提取或挖掘知識[2];詳細一點可以描述為主要利用某些特定的知識發(fā)現(xiàn)算法,在一定的運算效率的限制下,從大量的數(shù)據(jù)中抽取出潛在的、有價值的知識(模型、規(guī)則和趨勢)的過程。20世紀80年代末,隨著數(shù)據(jù)庫、互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展以及管理信息系統(tǒng)(MIS)和網(wǎng)絡(luò)數(shù)據(jù)中心(IDC)的推廣應(yīng)用,數(shù)據(jù)的存取、查詢、描述統(tǒng)計等技術(shù)已日臻完善,但高層次的決策分析、知識發(fā)現(xiàn)等實用技術(shù)還很不成熟,導(dǎo)致了“信息爆炸”但“知識貧乏”的現(xiàn)象。顯然,數(shù)據(jù)挖掘就是這樣的一門工具。經(jīng)濟統(tǒng)計學(xué)本質(zhì)上是從事“確定性”分析的,可以說統(tǒng)計方法是“目標(biāo)驅(qū)動”的。[8]則提出了一種基于嵌入理論和確定集上的預(yù)測誤差的混沌時間序列預(yù)測方法,并探討了在股票價格預(yù)測上的應(yīng)用。[7]基于股票時間序列是一種混沌時間序列的認知,提出一種新穎的非線性時間序列預(yù)測模型,即滑動窗口二次自回歸(MWDAR)模型,該模型使用部分的歷史數(shù)據(jù)及其二次項構(gòu)造自回歸模型,模型參數(shù)用最小二乘法估計。換句話說,就是歷史信息會對當(dāng)前的股票價格產(chǎn)生一定程度的影響。其基本思想是根據(jù)各隨機變量間的依存關(guān)系或自相關(guān)性,從而由時間序列的過去值及現(xiàn)在值來預(yù)測出未來的值。傳統(tǒng)的時間序列數(shù)據(jù)分析最基本的理論是40年代分別由Norbor Wiener和Andrei Kolmogomor提出的。傳統(tǒng)的時間序列數(shù)據(jù)分析已經(jīng)是一個發(fā)展得相當(dāng)成熟的學(xué)科,有著一整套分析理論和工具,是目前時間序列數(shù)據(jù)分析的主要方法,它主要用經(jīng)濟統(tǒng)計學(xué)的理論和方法對經(jīng)濟變量進行描述、分析和推算。目前技術(shù)分析常用的工具是各種各樣的走勢圖(K線圖、分時圖)和技術(shù)指標(biāo)(MA、RSI、OBV等)。基本分析指的是通過對影響股票市場供求關(guān)系的基本因素(如宏觀政治經(jīng)濟形勢、金融政策、行業(yè)變動、公司運營財務(wù)狀況等)進行分析,來確定股票的真正價值,判斷未來股市走勢,是長期投資者不可或缺的有效分析手段。目前,我國股市用得較多的方法概括起來有兩類[3]:一類是基本分析和技術(shù)分析,另一類是經(jīng)濟統(tǒng)計分析。不言而喻,如果投資者能正確預(yù)測股票價格、選準買賣時機,無疑會給投資者帶來豐厚的收益。股票市場作為市場經(jīng)濟的重要組成部分,正越來越多地受到投資者的關(guān)注。本綜述是針對證券業(yè)中股票時間序列分析的,試圖通過列舉、分析有關(guān)證券業(yè)中股票時間序列數(shù)據(jù)分析的原理、方法與技術(shù),著重探討數(shù)據(jù)挖掘中基于股票時間序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘的概念、原理技術(shù)、實施過程及存在的障礙和問題,以期能有新的發(fā)現(xiàn)和領(lǐng)悟。隨著時間推移和時間序列數(shù)據(jù)的大規(guī)模增長,如何對這些海量數(shù)據(jù)進行分析處理,挖掘其背后蘊藏的價值信息,對于我們揭示事物發(fā)展規(guī)律變化的內(nèi)部規(guī)律,發(fā)現(xiàn)不同事物之間的相互關(guān)系,為人們正確認識事物和科學(xué)決策提供依據(jù)具有重要的實際意義。所
點擊復(fù)制文檔內(nèi)容
語文相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1