【文章內(nèi)容簡介】
o Medium yes fair yes Medium No excellent No ine student Credit class High No fair yes Low yes excellent yes Medium No excellent yes High yes fair yes ine student Credit class High No fair No High No excellent No Medium No fair No Low yes fair yes Medium yes excellent yes age? 30 葉子節(jié)點(diǎn): yes 25 26 27 ?Apriori算法:使用候選項(xiàng)集找頻繁項(xiàng)集 ?由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則 28 ?Apriori算法:使用候選項(xiàng)集找頻繁項(xiàng)集 ?由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則 29 設(shè) A=足球服, B=足球鞋, C=足球。某網(wǎng)上商城的銷售情況如下: ?不 關(guān)心商品的 銷量 ,只關(guān)心商品間的關(guān)聯(lián)度 客戶號 客戶 商品 數(shù)量 C1 李鳴 足球服 A 10 C1 李鳴 足球鞋 B 8 C1 李鳴 足球 C 60 C2 金珊 足球 C 20 C3 馮君 足球服 A 50 C3 馮君 足球鞋 B 60 C4 丁貝 足球鞋 B 20 C5 陳騁 足球服 A 30 30 設(shè) A=足球服, B=足球鞋, C=足球。某網(wǎng)上商城的銷售情況如下: ?支持度 設(shè) W 中有 s %的事務(wù) 同時支持 物品集 A 和 B, s %稱為關(guān)聯(lián)規(guī)則 A→B 的支持度。 客戶號 客戶 商品 C1 李鳴 足球服 A C1 李鳴 足球鞋 B C1 李鳴 足球 C C2 金珊 足球 C C3 馮君 足球服 A C3 馮君 足球鞋 B C4 丁貝 足球鞋 B C5 陳騁 足球服 A 31 客戶號 客戶 商品 C1 李鳴 足球服 A C1 李鳴 足球鞋 B C1 李鳴 足球 C C2 金珊 足球 C C3 馮君 足球服 A C3 馮君 足球鞋 B C4 丁貝 足球鞋 B C5 陳騁 足球服 A A的支持度 =60% A→B 的支持度 = 40% A的支持度? A→B 的支持度 ? 32 Apriori算法:找頻繁項(xiàng)集 ? 在第一輪循環(huán)中,所有 1項(xiàng)目(只有 1項(xiàng))集是候選項(xiàng)目集,從中篩選出 ? 支持度 最小支持度 的項(xiàng)目放入頻繁項(xiàng)目集 ? 在第二輪循環(huán)中,只有 頻繁 1項(xiàng)目 組成的 2項(xiàng)目才是候選項(xiàng)目,從中篩選出 ? 支持度 最小支持度 的 2項(xiàng)目放入頻繁項(xiàng)目集。 ? 繼續(xù)循環(huán),直至 n輪循環(huán),所有的頻繁項(xiàng)目選出,頻繁項(xiàng)目集形成。 33 客戶號 客戶 商品 C1 李鳴 足球服 A C1 李鳴 足球鞋 B C1 李鳴 足球 C C2 金珊 足球 C C3 馮君 足球服 A C3 馮君 足球鞋 B C4 丁貝 足球鞋 B C5 陳騁 足球服 A 設(shè)最小支持度為 30% ( 1) 1項(xiàng)目候選項(xiàng): A 、 B 、 C 支持度: 60% 60% 40% 所以頻繁項(xiàng)目集: 進(jìn)入下一輪單項(xiàng): {A 、 B、 C} {A 、 B、 C} 34 客戶號 客戶 商品 C1 李鳴 足球服 A C1 李鳴 足球鞋 B C1 李鳴 足球 C C2 金珊 足球 C C3 馮君 足球服 A C3 馮君 足球鞋 B C4 丁貝 足球鞋 B C5 陳騁 足球服 A 設(shè)最小支持度為 30% ( 1) 2項(xiàng)目候選項(xiàng): AB 、 BC、 AC 支持度: 40% 20% 20% 所以頻繁項(xiàng)目集: 進(jìn)入下一輪單項(xiàng): {A 、 B、 C、 AB} {A, B} 35 客戶號 客戶 商品 C1 李鳴 足球服 A C1 李鳴 足球鞋 B C1 李鳴 足球 C C2 金珊 足球 C C3 馮君 足球服 A C3 馮君 足球鞋 B C4 丁貝 足球鞋 B C5 陳騁 足球服 A 設(shè)最小支持度為 30% ( 1) 3項(xiàng)目候選項(xiàng):無 算法終止 所以頻繁項(xiàng)目集: {A 、 B、 C、 AB} 36 ?Apriori算法:使用候選項(xiàng)集找頻繁項(xiàng)集 ?由頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則 37 頻繁項(xiàng)目 支持度 頻繁項(xiàng)目 支持度 A 60% C 40% B 60% A和 B 40% 38 分析結(jié)果: 可信度:它是針對規(guī)則而言的。指在出現(xiàn)了物品集 A 的事務(wù) T 中,物品集 B 也同時出現(xiàn)的概率有多大。 可信度 =p( condition and result) /p( condition) 。 規(guī)則 1: if A THEN B , 可信度? 可信度 = ( A和 B) / A = 40% / 60% = 67% 設(shè) A=足球服, B=足球鞋, C=足球。 頻繁項(xiàng)目 支持度 頻繁項(xiàng)目 支持度 A 60% C 40% B 60% A和 B 40% 39 分析結(jié)果: 可信度:它是針對規(guī)則而言的。