freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

[理學(xué)]數(shù)據(jù)挖掘第三節(jié)——關(guān)聯(lián)規(guī)則挖掘(參考版)

2024-12-11 00:53本頁(yè)面
  

【正文】 連鎖藥店的工作人員通過(guò)這些數(shù)據(jù)可以大體了解顧客的消費(fèi)心理 ,在采購(gòu)的時(shí)候可以把顧客購(gòu)買(mǎi)頻率較高的藥品多進(jìn)些貨 ,充足自己商店的貨源 。在購(gòu)買(mǎi)感冒通的顧客中有 86%的人會(huì)同時(shí)購(gòu)買(mǎi)克感敏或板藍(lán)根 ,26%的人會(huì)同時(shí)購(gòu)買(mǎi)金蓮 。并在開(kāi)始將表單和主界面相連。 其界面如下所示: 2. 設(shè)計(jì)主菜單界面 3. 建立數(shù)據(jù)庫(kù) 在此將各個(gè)藥品用相應(yīng)的字母來(lái)表示: C1:克感敏(一種降燒藥); C2:感冒通; C3:板藍(lán)根; C4:魚(yú)腥草;C5:金蓮; 然后通過(guò) Delphi中的 Database Desktop中的向?qū)?lái)制作表單。 然后再列出定貨清單進(jìn)貨 。 為了能更好的幫助藥店選擇適當(dāng)?shù)乃幉倪M(jìn)貨 , 利用關(guān)聯(lián)規(guī)則挖掘來(lái)設(shè)計(jì)該系統(tǒng) 。不過(guò),要是通過(guò)數(shù)據(jù)挖掘找出 “ 刮胡刀 → 抽水馬桶 → 鉆石戒指 ” 這樣的模式,估計(jì)企業(yè)客戶服務(wù)部門(mén)就要忙乎一陣搞明白其中潛在的聯(lián)系了。 橫向關(guān)聯(lián) 次序關(guān)聯(lián)分析的側(cè)重點(diǎn)在于分析事件的前后序列關(guān)系,發(fā)現(xiàn)諸如 “ 在購(gòu)買(mǎi) A商品后,一段時(shí)間里顧客會(huì)接著購(gòu)買(mǎi)商品 B,而后購(gòu)買(mǎi)商品 C”的知識(shí),形成一個(gè)客戶行為的“ A→B→C ”模式。 關(guān)聯(lián)規(guī)則挖掘在 CRM中的應(yīng)用類(lèi)別 主要類(lèi)別: ? 橫向關(guān)聯(lián) ? 次序關(guān)聯(lián) 橫向關(guān)聯(lián)是挖掘表面看似獨(dú)立的事件間的相互關(guān)系,例如 “ 90%的顧客在一次購(gòu)買(mǎi)活動(dòng)中購(gòu)買(mǎi)商品 A的同時(shí)購(gòu)買(mǎi)商品B”之類(lèi)的知識(shí)。 在 CRM中,必不可少的要素是將海量的、復(fù)雜的客戶行為數(shù)據(jù)集中起來(lái)的,形成整合的、結(jié)構(gòu)化的數(shù)據(jù)倉(cāng)庫(kù)( Data Wearhouse),這是數(shù)據(jù)挖掘的基礎(chǔ)。 ( 3)客戶關(guān)注點(diǎn): ( 4)客戶忠誠(chéng)度: 得出客戶持久性、牢固性及穩(wěn)定性分析。同樣的廣告內(nèi)容,根據(jù)客戶不同的行為習(xí)慣,有的人會(huì)接到電話,有的人就可能收到信函;同一個(gè)企業(yè),會(huì)給他們的客戶發(fā)送不同的信息,而這些信息往往就是顧客感興趣的方面。如果你不幸發(fā)現(xiàn)自己受到的待遇比別人低,很有可能別人是“ 黃金 ” ,而你是 “ 白銀 ” 或者 “ 黑鐵 ” 。所以,不要期待在 CRM時(shí)代繼續(xù)人人平等。針對(duì)不同的客戶檔次,確定相應(yīng)的營(yíng)銷(xiāo)投入。也由于這個(gè)原因,在談到 CRM的時(shí)候,個(gè)人隱私便成為一個(gè)敏感話題。 數(shù)據(jù)挖掘的第一步就是挖出顧客的特征描述。 ? 在挖出大量信息之后,企業(yè)就可以根據(jù)這些規(guī)律或用這些信息設(shè)計(jì)數(shù)學(xué)模型,對(duì)未發(fā)生行為做出結(jié)果預(yù)測(cè),為企業(yè)的綜合經(jīng)營(yíng)決策、市場(chǎng)策劃提供依據(jù)。 ? 為了實(shí)現(xiàn)這個(gè)目標(biāo) , 企業(yè)就需要盡可能地了解客戶的行為 , 但這種了解不可能通過(guò)與客戶接觸直接獲得 , 因?yàn)槠髽I(yè)不可能挨個(gè)與客戶交談 , 而且他們所需要的信息單個(gè)客戶往往無(wú)法提供 。 在競(jìng)爭(zhēng)激烈的商業(yè)時(shí)代 , 資源占有成為決定企業(yè)生死成敗的關(guān)鍵 。 企業(yè)一方面在挖空心思爭(zhēng)取新客戶 , 另一面卻不斷失去老客戶 。 ? 在客戶關(guān)系管理 ( CRM) 理論中有一個(gè)經(jīng)典的 2/8原則 , 即 80%利潤(rùn)來(lái)自 20%客戶 。 ? 在 7個(gè)候選中再應(yīng)用 AprioriGen算法 , 將每一個(gè)項(xiàng)目集與另外一個(gè)與之具有一個(gè)公共成員的項(xiàng)目集進(jìn)行連接運(yùn)算 , 第三趟掃描后得到 4個(gè)大項(xiàng)目集 。 AprioriGen算法實(shí)例:一個(gè)女士服裝店在一天中有 20個(gè)收款機(jī)事務(wù)記錄,如表: 衣服事務(wù)樣本 事務(wù) 項(xiàng)目 事務(wù) 項(xiàng)目 t1 罩衣 t11 T恤 t2 鞋,裙子, T恤 t12 罩衣,牛仔褲,鞋,裙子, T恤 t3 牛仔褲, T恤 t13 牛仔褲,鞋,短褲, T恤 t4 牛仔褲,鞋, T恤 t14 鞋,裙子, T恤 t5 牛仔褲,短褲 t15 牛仔褲, T恤 t6 鞋, T恤 t16 裙子, T恤 t7 牛仔褲,裙子 t17 罩衣,牛仔褲,裙子 t8 牛仔褲,鞋,短褲, T恤 t18 牛仔褲,鞋,短褲, T恤 t9 牛仔褲 t19 牛仔褲 t10 牛仔褲,鞋, T恤 t20 牛仔褲,鞋,短褲, T恤 AprioriGen實(shí)例 掃描 候選集 大項(xiàng)目集 1 {罩衣 }, {牛仔褲 }, {鞋 }, {短褲 }, {裙子 }, {T恤 } {牛仔褲 }, {鞋 }, {短褲 }, {裙子 }, {T恤 } 2 {牛仔褲,鞋 }, {牛仔褲,短褲 }, {牛仔褲,裙子 }, {牛仔褲, T恤 }, {鞋,短褲 }, {鞋,裙子 }, {鞋, T恤 }, {短褲,裙子 }, {短褲, T恤 }, {裙子, T恤 } {牛仔褲,鞋 }, {牛仔褲,短褲 }, {牛仔褲, T恤 }, {鞋,短褲 }, {鞋, T恤 }, {短褲, T恤 }, {裙子, T恤 } 3 {牛仔褲,鞋,短褲 }, {牛仔褲,鞋, T恤 } , {牛仔褲,短褲, T恤 }, {牛仔褲,裙子, T恤 }, {鞋,短褲, T恤 } , {鞋,裙子, T恤 }, {短褲, 裙子, T恤 } {牛仔褲,鞋,短褲 }, {牛仔褲,鞋, T恤 } , {牛仔褲,短褲, T恤 }, {鞋,短褲, T恤 } 4 {牛仔褲,鞋,短褲, T恤 } {牛仔褲,鞋,短褲, T恤 } 5 ? ? AprioriGen算法處理過(guò)程: ? 第一趟掃描得到 6個(gè)候選項(xiàng)目集 , 其中 5個(gè)候選是大的 。 ? 前一趟發(fā)現(xiàn)的大項(xiàng)目集的集合 Li1與自身進(jìn)行連接運(yùn)算以確定候選 。 一個(gè)稱為 AprioriGen的算法: ? 用于生成除第一趟之外的每一趟掃描的候選項(xiàng)目集 。 為壓縮Ck, 可以用以下辦法使用 Apriori性質(zhì):任何非頻繁的( k1) 項(xiàng)集都不可能是頻繁 k項(xiàng)集的子集 。 掃描數(shù)據(jù)庫(kù) , 確定 Ck中每個(gè)候選的計(jì)數(shù) , 從而確定 Lk。 連接 l1和 l2產(chǎn)生的結(jié)果的項(xiàng)集是 l1[1]l1[2]…… l1[k1]l2[k1]。 設(shè) l1和 l2是 Lk1中的項(xiàng)集 , 記號(hào) li[j]表示 li的第 j項(xiàng) 。 因?yàn)橹挥幸粋€(gè)大小為 2的大項(xiàng)目集,所以沒(méi)有大小為 3的候選 Apriori算法中的關(guān)鍵步驟 Apriori算法中的關(guān)鍵步驟是由 Lk1找 Lk, 該步驟可分為兩步: ? 第 1步 ( 連接 ) :為找 Lk, 通過(guò) Lk1與自己連接產(chǎn)生候選 K項(xiàng)集的集合 。因此得到 1后件的集合 {1}, {3},然后再以 {1, 3}作為后件 2— 1, 3 置信度 =3/5不滿足要求,所以對(duì)于 3頻繁項(xiàng)目集生成的強(qiáng)關(guān)聯(lián)規(guī)則為:( 1, 2) — 3和( 2, 3) — 1。在生成過(guò)程中,若得到的頻繁項(xiàng)目集個(gè)數(shù)小于 2,生成過(guò)程也可以結(jié)束了。 到此頻繁項(xiàng)目集生成過(guò)程結(jié)束。同理可以對(duì) {2, 3}, {2, 4}求并集得到 {2, 3, 4} ,但是 {2, 3, 4}的支持度不滿足要求,所以需要剔除掉。但是由于 {1, 3, 4}的子集{3, 4}不在 2頻繁項(xiàng)目集中,所以需要把 {1, 3, 4}剔除掉。 ? 表示: Lk*Lk = {X?Y 其中 X, Y? Lk, |X?Y|=k – 1} 例:對(duì)表 43進(jìn)行演算 , 其中 s=30%, ? =50% ? 假如有項(xiàng)目集合 I={1, 2, 3, 4, 5},有事務(wù)集 T: ? 1,2,3 ? 1,2,4 ? 1,3,4 ? 1,2,3,5 ? 1,3,5 ? 2,4,5 ? 1,2,3,4 ? 設(shè)定 minsup=3/7, misconf=5/7。 ? 只有一個(gè)項(xiàng)目集的所有子集都是大的 , 它才被認(rèn)為是候選 。 216。 A B D C AB AC AD BC BD CD 216。 ? 頻繁項(xiàng)集的 Apriori性質(zhì)用于壓縮搜索空間 ( 剪枝 ) ,以提高逐層產(chǎn)生頻繁項(xiàng)集的效率 。 如果將項(xiàng) A添加到 I, 則結(jié)果項(xiàng)集 ( 即 I∪A ) 不可能比 I更頻繁出現(xiàn) 。 ? 其逆命題:如果知道一個(gè)項(xiàng)目集是小的 , 就不需要生成它的任何超集來(lái)作為它的候選集 , 因?yàn)樗鼈円惨欢ㄊ切〉?。 實(shí)例 Database TDB 1st scan C1 L1 L2 C2 C2 2nd scan C3 L3 3rd scan Tid Items 10 A, C, D 20 B, C, E 30 A, B, C, E 40 B, E Itemset sup {A} 2 {B} 3 {C} 3 {D} 1 {E} 3 Itemset
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1