freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘基礎第6章關聯(lián)規(guī)則(趙志升)(完整版)

2025-04-02 09:11上一頁面

下一頁面
  

【正文】 例如,按照前例的事務數(shù)據(jù)庫,設數(shù)據(jù)包含頻繁項集 l={I1, I2, I5},則 l的非空子集有:{I1, I2}, {I1, I5} , {I2, I5} , {I1} , {I2} , {I5}。對于某用戶代表普遍意義的知識,對另一用戶可能是新穎的??疾煲恍┗谥С侄?置信度框架的方法。 計算機 [support=10%] 臺式機 [support=4%] 筆記本 [support=6%] 層 1 min_sup=12% 層 2 min_sup=3% 第三節(jié) 挖掘事務數(shù)據(jù)庫的多層關聯(lián)規(guī)則 挖掘多層關聯(lián)規(guī)則的方法 ? 層交叉單項過濾:一個第 i層的項被考察,當且僅當它在第( i1)層的父節(jié)點是頻繁的。 前面所討論的 5種方法屬于發(fā)現(xiàn)的頻繁項集的所有項都屬于同一概念層 1層。 第四節(jié) 挖掘關系數(shù)據(jù)庫和數(shù)據(jù)倉庫的多維關聯(lián)規(guī)則 多維關聯(lián)規(guī)則 關系數(shù)據(jù)庫和數(shù)據(jù)倉庫中的數(shù)據(jù)的存儲是多維的。 量化屬性 是數(shù)值的,并在值之間具有一個隱含的序,如( age, ine, price)。 第四節(jié) 挖掘關系數(shù)據(jù)庫和數(shù)據(jù)倉庫的多維關聯(lián)規(guī)則 挖掘基于距離的關聯(lián)規(guī)則 通常使用一個兩遍算法挖掘基于距離的關聯(lián)規(guī)則。 第五節(jié) 關聯(lián)挖掘到關聯(lián)分析 強關聯(lián)規(guī)則不一定是有趣的 將發(fā)現(xiàn)以下關聯(lián)規(guī)則: buys( X,” puter games”) ? buys( X,” videos”) [support=40%, confidence=66%] 該規(guī)則為強關聯(lián)規(guī)則,滿足最小支持度和最小置信度閾值。 舉例說明冰山查詢的實現(xiàn)過程? 多層關聯(lián)規(guī)則的挖掘方法主要有哪些? 什么是多維關聯(lián)規(guī)則,其基本挖掘技術主要有哪些? 關聯(lián)分析與相關分析有何差異? 演講完畢,謝謝觀看! 。 第五節(jié) 關聯(lián)挖掘到關聯(lián)分析 由關聯(lián)分析到相關分析 當 A的出現(xiàn)并不蘊涵 B的出現(xiàn)時,識別出規(guī)則A?B是有趣的。 第五節(jié) 關聯(lián)挖掘到關聯(lián)分析 問題:挖掘了關聯(lián)規(guī)則后,數(shù)據(jù)挖掘系統(tǒng)如何指出哪些規(guī)則是用戶感興趣的? 大部分關聯(lián)規(guī)則挖掘算法使用支持度 置信度框架。 第四節(jié) 挖掘關系數(shù)據(jù)庫和數(shù)據(jù)倉庫的多維關聯(lián)規(guī)則 使用量化屬性挖掘多維關聯(lián)規(guī)則 ( age) ( buys) ( ine) ( age, ine) ( age, buys) ( ine, buys) ( age, ine, buys) () 0D 頂點方體 1D 方體 2D 方體 3D 基本方體 第四節(jié) 挖掘關系數(shù)據(jù)庫和數(shù)據(jù)倉庫的多維關聯(lián)規(guī)則 挖掘量化關聯(lián)規(guī)則 量化關聯(lián)規(guī)則是多維關聯(lián)規(guī)則,其中數(shù)值屬性動態(tài)離散化,以滿足某種挖掘標準,如最大挖掘規(guī)則的置信度。將數(shù)據(jù)庫的每個屬性或數(shù)據(jù)倉庫的每個維看作一個謂詞,這樣就可以挖掘多維關聯(lián)規(guī)則,如 age( X,” 23…33 ”) ? occupation ( X,” teacher”) ?buys ( X,” laptop”) 涉及兩個以上維或謂詞的關聯(lián)規(guī)則稱為 多維關聯(lián)規(guī)則 。然而,當挖掘多層關聯(lián)規(guī)則時,由于項之間的“祖先”關系,有些發(fā)現(xiàn)的規(guī)則將是冗余的。 計算機 [support=10%] 臺式機 (未考察) 筆記本 (未考察) 層 1 min_sup=12% 層 2 min_sup=3% 第三節(jié) 挖掘事務數(shù)據(jù)庫的多層關聯(lián)規(guī)則 挖掘多層關聯(lián)規(guī)則的方法 ? 層交叉 k項集過濾:一個第 i層的 k項集被考察,當且僅當它在第( i1)層的對應父節(jié)點 k項集是頻繁的。如整個使用最小支持度閾值 5%。 第三節(jié) 挖掘事務數(shù)據(jù)庫的多層關聯(lián)規(guī)則 多層關聯(lián)規(guī)則 例如,給定某事務的任務相關數(shù)據(jù)集 D,它是計算機部的銷售數(shù)據(jù),對每個事務 TID給出了購買的商品。 規(guī)則編號 關聯(lián)規(guī)則 置信度 1 I1?I2?I5 Conf=2/4=50% 2 I1?I5?I2 Conf=2/2=100% 3 I2?I5?I1 Conf=2/2=100% 4 I1 ? I2? I5 Conf=2/6=33% 5 I2 ? I1? I5 Conf=2/7=29% 6 I5 ? I1? I2 Conf=2/2=100% 第二節(jié) 挖掘事務數(shù)據(jù)庫的單維布爾關聯(lián)規(guī)則 冰山查詢 冰山查詢在數(shù)據(jù)挖掘中經(jīng)常使用,特別是對購物籃分析, apriori算法可以用來提高冰山查詢的效率。 TID 項 ID的列表 T100 I1, I2, I5 T200 I2, I4 T300 I2, I3 T400 I1, I2, I4 T500 I1, I3 T600 I2, I3 T700 I1, I3 T800 I1, I2, I3, I5 T900 I1, I2, I3 第二節(jié) 挖掘事務數(shù)據(jù)庫的單維布爾關聯(lián)規(guī)則 Apriori算法 項集 支持度計數(shù) {I1} 6 {I2} 7 {I3} 6 {I4} 2 {I5} 2 項集 支持度計數(shù) {I1} 6 {I2} 7 {I3} 6 {I4} 2 {I5} 2 侯選集 C1 頻繁集 L1 掃描 D,對每個侯選 1項集計數(shù) 比較侯選支持度計數(shù)與最小支持度計數(shù) 設最小事務支持度計數(shù)為 2,2/9=22% 第二節(jié) 挖掘事務數(shù)據(jù)庫的單維布爾關聯(lián)規(guī)則 A
點擊復制文檔內(nèi)容
范文總結(jié)相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1