freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

《數(shù)據(jù)挖掘期中論》word版-預覽頁

2025-01-31 16:13 上一頁面

下一頁面
 

【正文】 法,并且做了一系列的習題,經(jīng)過了溫磊老師的講解后,我們通過算法對關(guān)聯(lián)規(guī)則有了更深一步的了解,為了加深我們的印象,老師讓我們在課下收集關(guān)于關(guān)聯(lián)規(guī)則的其他算法,下面我將對幾種其他的書中沒有介紹過的算法進行詳細的講述。這里分塊的大小選擇要使得每個分塊可以被放 入主存,每個階段只需被掃描一次。通常這里的通信過程是算法執(zhí) 行時間的主要瓶頸;而另一方面,每個獨立的處理器生成頻集的時間也是一個瓶頸。采樣算法很大程度上減少了掃描數(shù)據(jù)庫的時間開銷,但它最大的缺點就是可能產(chǎn)生數(shù)據(jù)扭曲導致結(jié)果不精確。對于數(shù)據(jù)扭曲現(xiàn)象,有人討論了反扭曲算法來挖掘關(guān)聯(lián)規(guī)則,可以使得掃描數(shù)據(jù)集的次數(shù)少于 2 次。 FUP 算法主要是針對在最小支持度和最小置信度不變的情況下,數(shù)據(jù)庫 DB被添加、刪除或修改時,如何生成更新后的數(shù)據(jù)庫的關(guān)聯(lián)規(guī)則。 IUAR 算法主要考慮在最小支持度和最小置信度和數(shù)據(jù)庫 DB 同時發(fā)生變化時,如何生成更新后的關(guān)聯(lián)規(guī)則。但它的缺點是通信量和 候選頻繁項集都比較大。 PDM 算法類似于 CD 算法,所有處 理器含有相同的雜湊表和候選集。 例 1:設(shè) I ={ il, i2, ?, im}是 m個不同項目的集合 .給定事務(wù)數(shù)據(jù)庫 D,對于項目集 X∈ I在 D中的支持數(shù)是指 D中包含 X的事務(wù)數(shù),記為 . X在 D中的支持度是指 D中包含 X事務(wù)的百分比,記為X .supD . 如果 X的支持度不小于用戶給定的最小支持度閾值 s,則稱 X 為頻繁項目集,如果 X 包含 I個項目,那么又稱 X為頻繁 I項目集,頻繁 l項目集簡稱頻繁項目 .挖掘出所有頻繁項目集是關(guān)聯(lián)規(guī)則挖掘的核心問題,占據(jù)整個計算量的大部分。為 D中頻繁項目集的集合 . 當最小支持度發(fā)生改變時,可分為兩種情況:( l) s s39。) then{ 調(diào)用 AdjUstFPtree(FPtree, Ln1) 得到 FPtree39。 一般情況下,經(jīng)過 1, 2步的處理后, Cnk中項目集的個數(shù)是較 少的,因此如何有效地利用已有的一切信息來求 Cnk中各項目集在 D 中的支持數(shù)將是更新算法 FIUA2的核心問題 .對于 D 中的任何一條事務(wù) t,設(shè) t1 = t∩ L1, t2 =t∩ Ln1,顯然, t1∩ t2 = 216。 每個處理機讀取和分析大致相同數(shù)量的數(shù)據(jù) 。這個過程如表 1所示 。 當一個處理機收到從另外處理機發(fā)過來的頻繁項字符串后 , 將收到的字符串和自身的字符串合并為一個字符串作為自己的字符串 , 并按圖 1所示策略繼續(xù)傳給另外的處理機。直到最后 processor 0 獲得最后字符串,這個字符串就代表了所有局部頻繁項及其支持度的匯總。 挖掘過程類似于 FPgrowth。而這個順序即是全局降序,即 FPgrowth*所有頻繁子樹的構(gòu)造都是按全局降序構(gòu)造的。 Header table H(head_table, Minimum support thresholdξ 輸出:結(jié)果樹 T(result tree) 方法:調(diào)用 PFP_growth(Tfp_tree,Hhead_table,null,Tresult tree)。i) {HeaderTableItemHcurheaditem=Hheadtable→ GetAt(i)。 PFP_growth(Tfptree,Hnewheadtable,Icuritemset)。通過合并接收到的字符串和自己的字符串產(chǎn)生一個新的字符串。
點擊復制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1