freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘期中論word版(已修改)

2025-01-19 16:13 本頁面
 

【正文】 課程設(shè)計(jì)報(bào)告 ( 20222022 年度第二學(xué)期 ) 名 稱: 數(shù)據(jù)倉庫與挖掘論文 院 系: 經(jīng)濟(jì)管理系 班 級: 信管 1101 學(xué)生姓名: 聶麟鵬 學(xué) 號: 202206040110 指導(dǎo)教師: 王立軍 日期: 2022 年 6 月 溫磊老師在數(shù)據(jù)倉庫與挖掘的課程中,為我們詳細(xì)的講述了關(guān)聯(lián)規(guī)則的挖掘,并且介紹了兩個(gè)算法,一種是 Apriori 算法,另一種是 FP— Tree 算法,并且做了一系列的習(xí)題,經(jīng)過了溫磊老師的講解后,我們通過算法對關(guān)聯(lián)規(guī)則有了更深一步的了解,為了加深我們的印象,老師讓我們在課下收集關(guān)于關(guān)聯(lián)規(guī)則的其他算法,下面我將對幾種其他的書中沒有介紹過的算法進(jìn)行詳細(xì)的講述。 數(shù)據(jù)集 劃分算法 Savasere 設(shè)計(jì)了一個(gè)基于劃分的算法。這個(gè)算法先把數(shù)據(jù)庫從邏輯上分成幾個(gè)互不相交的塊,每次單獨(dú)考慮一個(gè)分塊并對它生成所有的頻集,然后把產(chǎn)生的頻集合并,用來生成所有可能的頻集,最后計(jì)算這些項(xiàng)集的支持度。這里分塊的大小選擇要使得每個(gè)分塊可以被放 入主存,每個(gè)階段只需被掃描一次。而算法的正確性是由每一個(gè)可能的頻集至少在某一個(gè)分塊中是頻集保證的。該算法是可以高度并行的,可以把每一分塊分別分配給某一個(gè)處理器生成頻集。產(chǎn)生頻集的每一個(gè)循環(huán)結(jié)束后,處理器之間進(jìn)行通信來產(chǎn)生全局的候選 k項(xiàng)集。通常這里的通信過程是算法執(zhí) 行時(shí)間的主要瓶頸;而另一方面,每個(gè)獨(dú)立的處理器生成頻集的時(shí)間也是一個(gè)瓶頸。 采樣算法 采樣算法包括由 Park 等人提出的可調(diào)精度的挖掘算法、 Toivonen 提出的 Sampling 算法等。 Sampling 算法是從數(shù)據(jù)庫 D 中隨機(jī)抽取一個(gè)可以調(diào)入內(nèi)存的數(shù)據(jù)庫子集 D’ ,然后求出數(shù)據(jù)庫子集 D’ 中可能在數(shù)據(jù)庫 D 中成立的所有規(guī)則,再用數(shù)據(jù)庫 D 中剩余部分( DD’ )來驗(yàn)證結(jié)果的正確性。它適用于挖掘準(zhǔn)確性不太高而挖掘效率較高的環(huán)境。采樣算法很大程度上減少了掃描數(shù)據(jù)庫的時(shí)間開銷,但它最大的缺點(diǎn)就是可能產(chǎn)生數(shù)據(jù)扭曲導(dǎo)致結(jié)果不精確。如果頻繁項(xiàng)集包含了數(shù)據(jù)庫 D 中的所有頻繁項(xiàng)集,則只需要掃描一次 D。否則,為了減少這個(gè)問題帶來的影響,可以使用更小的支持度閾值在隨機(jī)樣本上做第二次掃描數(shù)據(jù)庫再次產(chǎn)生頻繁項(xiàng)集,找出在第一次掃描中遺漏的頻繁項(xiàng)集。通過對數(shù)據(jù) 庫多次掃描來減少頻繁項(xiàng)集的遺漏。對于數(shù)據(jù)扭曲現(xiàn)象,有人討論了反扭曲算法來挖掘關(guān)聯(lián)規(guī)則,可以使得掃描數(shù)據(jù)集的次數(shù)少于 2 次。 增量式更新算法 增量式更新算法是利用已挖掘的關(guān)聯(lián)規(guī)則在變化了的數(shù)據(jù)庫或參數(shù)上發(fā)現(xiàn)新的關(guān)聯(lián)規(guī)則、刪除過時(shí)的關(guān)聯(lián)規(guī)則來維護(hù)數(shù)據(jù)集更新的問題。目前大多數(shù)的增量式更新算法都是以 Apriori算法為核心進(jìn)行的改進(jìn)與演化,包括 等人提出的 FUP 和 FUP2 算法,馮玉才等人提出的 IUA 和 PIUA 算法,高峰 等人提出的 IUAR 算法等等。 FUP 算法是 Apriori 算法的改進(jìn),也是解決增量更新問題的一種經(jīng)典算法。 FUP 算法主要是針對在最小支持度和最小置信度不變
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1