freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

weka關(guān)聯(lián)規(guī)則解析ppt課件(已修改)

2025-05-28 01:10 本頁面
 

【正文】 Weka系統(tǒng)中的關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則的基本概念 ? 設(shè) I={i1 ,i2 ,…,im} 是所有數(shù)據(jù)項(xiàng)的集合,相當(dāng)于商品的所有種類的集合。設(shè)任務(wù)相關(guān)的數(shù)據(jù) D是數(shù)據(jù)庫所有事務(wù)的集合,其中每個(gè)事務(wù) T是數(shù)據(jù)項(xiàng)的集合,使得。每一個(gè)事務(wù)有一個(gè)標(biāo)識(shí)符,稱作 TID。設(shè) A是一個(gè)項(xiàng)集,事務(wù) T包含 A當(dāng)且僅當(dāng)。關(guān)聯(lián)規(guī)則是形如的蘊(yùn)涵式,其中,并且。規(guī)則在事務(wù)集 D中成立,具有支持度 s,其中 s是 D中事務(wù)包含(即 A和 B二者)的百分比。它是概率 P()。規(guī)則在事務(wù)集 D中具置信度 c,如果 D中包含 A的事務(wù)同時(shí)也包含 B的百分比是 c。這是條件概率 P( B|A)。即是 Support (A=B)=P(AUB) Confidence (A=B)=P(B|A)。 同時(shí)滿足最小支持度閾值( min_sup)和最小置信度閾值( min_conf)的規(guī)則稱作強(qiáng)關(guān)聯(lián)規(guī)則。 Apriori算法綜述 ? 經(jīng)典的頻集算法 Agrawal等于 1994年提出了一個(gè)挖掘顧客交易數(shù)據(jù)庫中項(xiàng)集間的關(guān)聯(lián)規(guī)則的重要方法,其核心是基于兩個(gè)階段頻繁集思想的遞推算法。所有支持度大于最小支持度的項(xiàng)集稱為頻繁項(xiàng)集,簡稱頻集。 ? 算法的基本思想 首先找出所有的頻繁集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣。然后由頻繁集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿足最小支持度和最小可信度。 Apriori核心算法分析 為生成所有頻繁集,使用了遞推的方法。其核心思想簡要描述如下: 輸入:交易數(shù)據(jù)庫 D,最小支持閾值 min _sup; 輸出: Li, D中的頻繁項(xiàng)集; 方法: (1) L1=find_frequent_1_itemset(D)。 //發(fā)現(xiàn) 1項(xiàng)集 (2) For (k=2。Lk1≠248。 。k++){ (3) Ck=apriori_gen(Lk1,min_sup)。 //根據(jù)頻繁 (k1)項(xiàng)集產(chǎn)生候選 k項(xiàng)集 (4) For each t∈ D { //掃描數(shù)據(jù)庫,確定每個(gè)候選集的支持頻度 (5) Ct=subset (Ck, t)。 //獲得 t所包含的候選項(xiàng)集 (6) For each c∈ Ct c. count++。 (7) } (8) L k={ c∈ Ct | c. count min _sup}。 (9) Return L=U k L k。 Procedure apriori_gen(Lk1,min_sup) (1) for each l1∈ Lk1 (2) for each l2∈ Lk1 (3) if(l1[1]= l2[1])∧ … ∧ (l1[k2]= l2[k
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1