freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘基于約束的挖掘(完整版)

2024-10-18 09:03上一頁面

下一頁面
  

【正文】 用 2維表格把“鄰近”的 關(guān)聯(lián)規(guī)則組合起來 ? 例子 ARCS (關(guān)聯(lián)規(guī)則聚集系統(tǒng) ) ARCS 流程 1. 分箱 2. 查找頻繁維詞 集合 3. 關(guān)聯(lián)規(guī)則聚類 4. 優(yōu)化 ARCS的局限性 ? 數(shù)值屬性只能出現(xiàn)在規(guī)則的左側(cè) ? 左側(cè)只能有兩個屬性 (2維 ) ? ARCS 的改進(jìn) ? 不用基于柵格的方法 ? 等深分箱 ? 基于 局部完整性 測度的聚集 ? “ Mining Quantitative Association Rules in Large Relational Tables‖ by R. Srikant and R. Agrawal. 挖掘基于距離的關(guān)聯(lián)規(guī)則 ? 分箱的方法沒有體現(xiàn)數(shù)據(jù)間隔的語義 ? 基于距離的分割是更有“意義”的離散化方法,考慮: ? 區(qū)間內(nèi)密度或點的個數(shù) ? 區(qū)間內(nèi)點的“緊密程度 價格( $ )等寬( 寬度 $10)等深( 深度 2) 基于距離7 [ 0 , 1 0 ] [ 7 , 2 0 ] [ 7 , 7 ]20 [ 1 1 , 2 0 ] [ 2 2 , 5 0 ] [ 2 0 , 2 2 ]22 [ 2 1 , 3 0 ] [ 5 1 , 5 3 ] [ 5 0 , 5 3 ]50 [ 3 1 , 4 0 ]51 [ 4 1 , 5 0 ]53 [ 5 1 , 6 0 ]第 6章:從大數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則 ? 關(guān)聯(lián)規(guī)則挖掘 ? ? ? 聯(lián)規(guī)則 ? ? ? ? 強(qiáng)關(guān)聯(lián)規(guī)則不一定是有趣的( 168頁例) ? 由關(guān)聯(lián)分析到相關(guān)分析 項集 A與項集 B獨立 P(AB)=P(A)P(B) 項集 A、 B的相關(guān)性 corrAB=P(AB)/P(A)P(B) 第 6章:從大數(shù)據(jù)庫中挖掘關(guān)聯(lián)規(guī)則 ? 關(guān)聯(lián)規(guī)則挖掘 ? ? ? 聯(lián)規(guī)則 ? ? ? 基于約束的挖掘 ? 使用約束的必要性 ? 在數(shù)據(jù)挖掘中常使用的幾種約束: ? 知識類型約束: 指定要挖掘的知識類型 如關(guān)聯(lián)規(guī)則 ? 數(shù)據(jù)約束: 指定與任務(wù)相關(guān)的數(shù)據(jù)集 ? Find product pairs sold together in Vancouver in Dec.’98. ? 維 /層次約束 :指定所用的維或概念結(jié)構(gòu)中的層 ? in relevance to region, price, brand, customer category. ? 規(guī)則約束: 指定 要挖掘的規(guī)則形式 (如規(guī)則模板 ) ? 單價 (price $10)的交易項目可能引發(fā)購買總額 (sum $200). ? 興趣度約束: 指定規(guī)則興趣度閾值或統(tǒng)計度量 ? 如 (min_support ? 3%, min_confidence ? 60%). ? 假定 AllElectronics的一個銷售多維數(shù)據(jù)庫有如下關(guān)系(176頁 ) ? Sales(customer_name,item_name,transaction_id) ? Lives(customer_name,region,city) ? Items(item_name,category, price) ? Transaction(transaction_id,day,month,year) (1) mine associations as (2)lives(C,_,”Pudong”)^sales(C,{I},{S})=sales(C,{J}{T}) (3) from sales (4)where =1999 amp。 ? 滿意模式集 (satisfying pattern set) SATc(I)是指那些完全滿足約束 C的項目集的全體 ? 將約束條件用于頻繁集的查詢無非是找出那些滿足 C的頻繁集 單調(diào)和反單調(diào)的規(guī)則約束 ? 規(guī)則 Ca 是 反單調(diào)的 (antimonotone) iff 對于任給的不滿足 Ca的項集 (模式 ) S, 不存在S的超集能夠滿足 Ca : Ca : min(S)=v , v是 S的一個項集 ? 約束 Cm 是 單調(diào)的 Cm的項集(模式 ) S, 每一個 S的超集都能夠滿足 Cm : Cm : min(S)=v, v是 S的一個項集 。=1999 amp。 ? 例子 ? 奶制品 ? 白面包 [support = 8%, confidence = 70%] ? 酸奶 ? 白面包 [support = 2%, confidence = 72%] ? 酸奶占 奶制品 25% ? 我們稱第一個規(guī)則是第二個規(guī)則的祖先 ? 參考規(guī)則的祖先,如果他的支持度與我們“預(yù)期”的支持度近似的話,我們就說這條規(guī)則是冗余的。 : 在添加一個新的候選集之前,先估計一下是不是他的所有子集都是頻繁的。 k++) do begin Ck = candidates generated from Lk1。 TDB|b。 ? 滿意模式集 (satisfying pattern set) SATc(I)是指那些完全滿足約束 C的項目集的全體 ? 將約束條件用于頻繁集的查詢無非是找出那些滿足 C的頻繁集 單調(diào)和反單調(diào)的規(guī)則約束 ? 規(guī)則 Ca 是 反單調(diào)的 (antimonotone) iff 對于任給的不滿足 Ca的項集 (模式 ) S, 不存在 S的超集能夠滿足 Ca : Ca : min(S)=v , v是 S的一個項集 ? 約束 Cm 是 單調(diào)的 Cm的項集(模式 ) S, 每一個 S的超集都能夠滿足 Cm : Cm : min(S)=v, v是 S的一個項集 單調(diào) /反單調(diào)性約束描述 v ? S S ? V S ? V S ? V min(S) ? v min(S) ? v min(S) ? v max(S) ? v max(S) ? v max(S) ? v count(S) ? v count(S) ? v count(S) ? v sum(S) ? v sum(S) ? v sum(S) ? v avg(S) ? v, ? ? { ?, ?, ? } (frequent constraint) yes yes no partly yes no partly no yes partly no yes partly no yes partly convertible (no) no no yes partly no yes partly yes no partly yes no partly yes no partly convertible (yes) 反單調(diào) 單調(diào) 約束規(guī)則 可轉(zhuǎn)變的約束 1 ? 反單調(diào)可轉(zhuǎn)變
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1