freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘挖掘頻繁模式關聯(lián)和相關-在線瀏覽

2024-10-12 09:44本頁面
  

【正文】 , 2 2 1 , 4 1 3 }2020/9/15 數(shù)據(jù)挖掘:概念和技術 28 挖掘多層關聯(lián)規(guī)則 ? 自上而下,深度優(yōu)先的方法: ? 先找高層的“強”規(guī)則: 牛奶 174。 黃面包 [6%, 50%]. ? 多層關聯(lián)規(guī)則的變種 1 支持度不變 : 在各層之間使用統(tǒng)一的支持度 ( 164頁圖 612) ? + 一個最小支持度閾值 . 如果一個項集的父項集不具有最小支持度,那他本身也不可能滿足最小支持度。 ? 例子 ? 奶制品 ? 白面包 [support = 8%, confidence = 70%] ? 酸奶 ? 白面包 [support = 2%, confidence = 72%] ? 酸奶占 奶制品 25% ? 我們稱第一個規(guī)則是第二個規(guī)則的祖先 ? 參考規(guī)則的祖先,如果他的支持度與我們“預期”的支持度近似的話,我們就說這條規(guī)則是冗余的。 Han, SSD’95). 2020/9/15 數(shù)據(jù)挖掘:概念和技術 34 第 6章:從大數(shù)據(jù)庫中挖掘關聯(lián)規(guī)則 ? 關聯(lián)規(guī)則挖掘 ? ? ? ? ? ? 2020/9/15 數(shù)據(jù)挖掘:概念和技術 35 多維關聯(lián)規(guī)則: 概念 ? 單維規(guī)則: buys(X, ―milk‖) ? buys(X, ―bread‖) ? 多維規(guī)則: 2個以上維 /謂詞 ? 維間關聯(lián)規(guī)則 (維詞 不重復 ) age(X,‖1925‖) ? occupation(X,―student‖) ? buys(X,―coke‖) ? 混合維關聯(lián)規(guī)則 (維詞重復 ) age(X,‖1925‖) ? buys(X, ―popcorn‖) ? buys(X, ―coke‖) ? 類別屬性 ? 有限個值 , 值之間無順序關系 ? 數(shù)量屬性 ? 數(shù)字的,值之間隱含了順序關系 2020/9/15 數(shù)據(jù)挖掘:概念和技術 36 挖掘多維關聯(lián)的技術 ? 搜索頻繁 k維詞集合 : ? 如 : {age, occupation, buys} 是一個 3維詞集合。 2. 帶數(shù)量的關聯(lián)規(guī)則 ? 根據(jù)數(shù)據(jù)的分布,動態(tài)的把數(shù)值屬性離散化到不同的“箱” 。 ? 適宜使用數(shù)據(jù)立方體 ? N維立方體的每個單元 對應一個維詞集合 ? 使用數(shù)據(jù)立方體速度更快 (ine) (age) () (buys) (age, ine) (age,buys) (ine,buys) (age,ine,buys) 2020/9/15 數(shù)據(jù)挖掘:概念和技術 38 帶數(shù)量的關聯(lián)規(guī)則 age(X,”3034”) ? ine(X,”24K 48K”) ? buys(X,”high resolution TV”) ? 動態(tài) 離散化數(shù)值屬性 使?jié)M足某種挖掘標準,如最大化挖掘規(guī)則的置信度緊湊性 . ? 2維數(shù)量關聯(lián)規(guī)則: Aquan1 ? Aquan2 ? Acat ? 用 2維表格把“鄰近”的 關聯(lián)規(guī)則組合起來 ? 例子 2020/9/15 數(shù)據(jù)挖掘:概念和技術 39 ARCS (關聯(lián)規(guī)則聚集系統(tǒng) ) ( 170頁圖 618) ARCS 流程 1. 分箱 2. 查找頻繁維詞 集合 3. 關聯(lián)規(guī)則聚類 4. 優(yōu)化 2020/9/15 數(shù)據(jù)挖掘:概念和技術 40 ARCS的局限性 ? 數(shù)值屬性只能出現(xiàn)在規(guī)則的左側 ? 左側只能有兩個屬性 (2維 ) ? ARCS 的改進 ? 不用基于柵格的方法 ? 等深分箱 ? 基于 局部完整性 測度的聚集 ? ―Mining Quantitative Association Rules in Large Relational Tables‖ by R. Srikant and R. Agrawal. 2020/9/15 數(shù)據(jù)挖掘:概念和技術 41 挖掘基于距離的關聯(lián)規(guī)則 ? 分箱的方法沒有體現(xiàn)數(shù)據(jù)間隔的語義 ? 基于距離的分割是更有“意義”的離散化方法,考慮 : ? 區(qū)間內(nèi)密度或點的個數(shù) ? 區(qū)間內(nèi)點的“緊密程度 價格( $ )等寬( 寬度 $10)等深( 深度 2) 基于距離7 [ 0 , 1 0 ] [ 7 , 2 0 ] [ 7 , 7 ]20 [ 1 1 , 2 0 ] [ 2 2 , 5 0 ] [ 2 0 , 2 2 ]22 [ 2 1 , 3 0 ] [ 5 1 , 5 3 ] [ 5 0 , 5 3 ]50 [ 3 1 , 4 0 ]51 [ 4 1 , 5 0 ]53 [ 5 1 , 6 0 ]2020/9/15 數(shù)據(jù)挖掘:概念和技術 42 第 6章:從大數(shù)據(jù)庫中挖掘關聯(lián)規(guī)則 ? 關聯(lián)規(guī)則挖掘 ? ? ? ? ? ? 2020/9/15 數(shù)據(jù)挖掘:概念和技術 43 ? 強關聯(lián)規(guī)則不一定是有趣的( 168例 ) ? 由關聯(lián)分析到相關分析 項集 A與項集 B獨立 P(AB)=P(A)P(B) 項集 A、 B的相關性 提升度 corrAB=P(AB)/P(A)P(B)( 169頁例 ) 卡方分析 卡方值 ( 169頁例 ) 全置信度 余弦度量 比較四種相關度量 ( 170頁例 ) 2020/9/15 數(shù)據(jù)挖掘:概念和技術 44 第 6章:從大數(shù)據(jù)庫中挖掘關聯(lián)規(guī)則 ? 關聯(lián)規(guī)則挖掘 ? ? ? ? ? ? 2020/9/15 數(shù)據(jù)挖掘:概念和技術 45 基于約束的挖掘 ? 使用約束的必要性 ? 在數(shù)據(jù)挖掘中常使用的幾種約束: ? 知識類型約束: 指定要挖掘的知識類型 如關聯(lián)規(guī)則 ? 數(shù)據(jù)約束: 指定與任務相關的數(shù)據(jù)集 ? Find product pairs sold together in Vancouver in Dec.’98. ? 維 /層次約束 :指定所用的維或概念結構中的層 ? in relevance to region, price, brand, customer category. ? 規(guī)則約束: 指定 要挖掘的規(guī)則形式 (如規(guī)則模板 ) ? 單價 (price $10)的交易項目可能引發(fā)購買總額 (sum $200). ? 興趣度約束: 指定規(guī)則興趣度閾值或統(tǒng)計度量 ? 如 (min_support ? 3%, min_confidence ? 60%). 2020/9/15 數(shù)據(jù)挖掘:概念和技術 46 ? 假定 AllElectronics的一個銷售多維數(shù)據(jù)庫有如下關系 (176頁 ) ? Sales(customer_name,item_name,transaction_id) ? Lives(customer_name,region,city) ? Items(item_name,category, price) ? Transaction(transaction_id,day,month,year) (1) mine associations as (2)lives(C,_,”Pudong”)^sales(C,{I},{S})=sales(C,{J}{T}) (3) from sales (4)where =1999 amp。=1999 amp。= (5)group by C, (6)having sum(=100)amp。min()=500 (7)with support threshold=1% (8)with confidence threshold=50% Lives(C,_,”Pudong”)^Sales(C,”Census_CD”,_)^Sales(C,”MS/Office”,_)=Sales(C,”MS/SQLSever”,_) [%,65%] 2020/9/15 數(shù)據(jù)挖掘:概念和技術 47 約束的分類 ? 單調(diào)性約束 (monotone constraint) ? 反單調(diào)性約束 (antimonotone constraint) ? 可轉(zhuǎn)變的約束 (convertibale constraint) ? 簡潔性約束 (succinct constraint
點擊復制文檔內(nèi)容
試題試卷相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1