freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘從大數(shù)據(jù)庫(kù)中挖掘關(guān)聯(lián)規(guī)則-資料下載頁(yè)

2025-08-22 09:03本頁(yè)面

【導(dǎo)讀】從交易數(shù)據(jù)庫(kù)中挖掘一維的布爾形關(guān)聯(lián)規(guī)則。在交易數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)中挖掘多維關(guān)聯(lián)規(guī)則。在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于。購(gòu)物籃分析、交叉銷(xiāo)售、產(chǎn)品目錄設(shè)計(jì)、loss-leader. analysis、聚集、分類(lèi)等。護(hù)理用品(商店應(yīng)該怎樣提高護(hù)理用品的銷(xiāo)售?*(其他商品的庫(kù)存有什么影響?在產(chǎn)品直銷(xiāo)中使用附加郵寄。Detecting―ping-pong‖ingofpatients,faulty―collisions‖。支持度,s,一次交易中包含??尚哦?c,包含{X、Y}的交。那個(gè)品種牌子的啤酒與那個(gè)牌子的尿布有關(guān)系?關(guān)聯(lián)并不一定意味著相關(guān)或因果。最大模式和閉合相集。如,哪些“小東西”的銷(xiāo)售促發(fā)了“大家伙”的買(mǎi)賣(mài)?用得到的頻繁集生成關(guān)聯(lián)規(guī)則。修剪:一個(gè)k-項(xiàng)集,如果他的一個(gè)k-1項(xiàng)集不是頻繁。假定Lk-1中的項(xiàng)按順序排列。第一步:自連接Lk-1

  

【正文】 牛奶 (15%), 面包 (10%) ? 再挖掘他們底層的相對(duì)較弱的頻繁項(xiàng): 酸奶 (5%), 白面包 (4%) ? 跨層時(shí)對(duì)支持度的不同處理方法,對(duì)應(yīng)了不同的算法 : ? 層之間支持度不變: 如果 t的祖先是非頻繁的,則不用考慮 t ? 支持度隨層遞減 : 則只考慮那些其祖先是頻繁的 /不可忽略的項(xiàng) 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 46 數(shù)據(jù)挖掘查詢(xún)的逐步精化 ? 為什么要逐步精化 ? 挖掘操作的代價(jià)可能高或低,結(jié)果可能細(xì)致或粗糙 ? 在速度和質(zhì)量之間折衷:逐步精化 ? 超集覆蓋特征 : ? 預(yù)存儲(chǔ)所有正面答案 —允許進(jìn)一步正確性驗(yàn)證,而不必驗(yàn)證已經(jīng)錯(cuò)誤的 ? 2或多步挖掘: ? 先執(zhí)行粗糙的、容易的操作 (超集覆蓋 ) ? 然后在減少后的候選集上進(jìn)行計(jì)算量大的算法 (Koperski amp。 Han, SSD’95). 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 47 逐步求精空間關(guān)聯(lián)規(guī)則挖掘 ?空間關(guān)系的層次: ?―g_close_to‖: 鄰近 , 接觸 , 交叉 , 包含 ?先搜索粗糙的關(guān)系然后再精化 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 48 逐步求精空間關(guān)聯(lián)規(guī)則挖掘 (2) ? 空間關(guān)聯(lián)規(guī)則的兩步算法 : ? 步驟 1: 粗糙空間計(jì)算 (用于過(guò)濾 ) ? 用 MBR 或 Rtree 做粗糙估計(jì) ? 步驟 2: 細(xì)致空間算法 (用于精化 ) ? 只計(jì)算已經(jīng)通過(guò)空間計(jì)算的對(duì)象 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 49 第 6章:從大數(shù)據(jù)庫(kù)中挖掘關(guān)聯(lián)規(guī)則 ? 關(guān)聯(lián)規(guī)則挖掘 ? 從交易數(shù)據(jù)庫(kù)中挖掘一維的布爾形關(guān)聯(lián)規(guī)則 ? 從交易數(shù)據(jù)庫(kù)中挖掘多層次關(guān)聯(lián)規(guī)則 ? 在交易數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)中挖掘多維關(guān)聯(lián)規(guī)則 ? 從關(guān)聯(lián)挖掘到相關(guān)性分析 ? 基于約束的關(guān)聯(lián)挖掘 ? 小結(jié) 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 50 多維關(guān)聯(lián)規(guī)則: 概念 ? 單維規(guī)則: buys(X, ―milk‖) ? buys(X, ―bread‖) ? 多維規(guī)則: 2個(gè)以上維 /謂詞 ? 維間關(guān)聯(lián)規(guī)則 (維詞 不重復(fù) ) age(X,‖1925‖) ? occupation(X,―student‖) ? buys(X,―coke‖) ? 混合維關(guān)聯(lián)規(guī)則 (維詞重復(fù) ) age(X,‖1925‖) ? buys(X, ―popcorn‖) ? buys(X, ―coke‖) ? 類(lèi)別屬性 ? 有限個(gè)值 , 值之間無(wú)順序關(guān)系 ? 數(shù)量屬性 ? 數(shù)字的,值之間隱含了順序關(guān)系 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 51 挖掘多維關(guān)聯(lián)的技術(shù) ? 搜索頻繁 k維詞集合 : ? 如 : {age, occupation, buys} 是一個(gè) 3維詞集合。 ? 按照對(duì) age 處理方式的不同,分為: 1. 用靜態(tài)方法把數(shù)值屬性離散化 ? 數(shù)值屬性可用預(yù)定義的概念層次加以離散化 。 2. 帶數(shù)量的關(guān)聯(lián)規(guī)則 ? 根據(jù)數(shù)據(jù)的分布動(dòng)態(tài)的把數(shù)值屬性離散化到不同的“箱” 。 3. 基于距離的關(guān)聯(lián)規(guī)則 ? 用數(shù)據(jù)點(diǎn)之間的距離動(dòng)態(tài)的離散化 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 52 數(shù)值屬性的靜態(tài)離散化 ? 在挖掘之前用概念層次先離散化 ? 數(shù)值被替換為區(qū)間范圍 ? 關(guān)系數(shù)據(jù)庫(kù)中,要找到所有頻繁 k維詞需要 k或 k+1次表掃描。 ? 適宜使用數(shù)據(jù)立方體 ? N維立方體的每個(gè)單元 對(duì)應(yīng)一個(gè)維詞集合 ? 使用數(shù)據(jù)立方體速度更快 (ine) (age) () (buys) (age, ine) (age,buys) (ine,buys) (age,ine,buys) 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 53 帶數(shù)量的關(guān)聯(lián)規(guī)則 age(X,”3034”) ? ine(X,”24K 48K”) ? buys(X,”high resolution TV”) ? 動(dòng)態(tài) 離散化數(shù)值屬性 ? Such that the confidence or pactness of the rules mined is maximized. ? 2維數(shù)量關(guān)聯(lián)規(guī)則: Aquan1 ? Aquan2 ? Acat ? 用 2維表格把“鄰近”的 關(guān)聯(lián)規(guī)則組合起來(lái) ? 例子 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 54 ARCS (關(guān)聯(lián)規(guī)則聚集系統(tǒng) ) ARCS 流程 1. 分箱 2. 查找頻繁維詞 集合 3. 聚集 4. 優(yōu)化 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 55 ARCS的局限性 ? 數(shù)值屬性只能出現(xiàn)在規(guī)則的左側(cè) ? 左側(cè)只能有兩個(gè)屬性 (2維 ) ? ARCS 的改進(jìn) ? 不用基于柵格的方法 ? 等深分箱 ? 基于 局部完整性 測(cè)度的聚集 ? ―Mining Quantitative Association Rules in Large Relational Tables‖ by R. Srikant and R. Agrawal. 2020116 數(shù)據(jù)挖掘:概念和技術(shù) 56 挖掘基于距離的關(guān)聯(lián)規(guī)則 ? 分箱的方法沒(méi)有體現(xiàn)數(shù)據(jù)間隔的語(yǔ)義 ? 基于距離的分割是更有“意義”的離散化方法,考慮 : ? 區(qū)間內(nèi)密度或點(diǎn)的個(gè)數(shù) ? 區(qū)間內(nèi)點(diǎn)的“緊密程度 價(jià)格( $ )等寬( 寬度 $10)等深( 深度 2) 基于距離7 [ 0 , 1 0 ] [ 7 , 2 0 ] [ 7 , 7 ]20 [ 1 1 , 2 0 ] [ 2 2 , 5 0 ] [ 2 0 , 2 2 ]22 [ 2 1 , 3 0 ] [ 5 1 , 5 3 ] [ 5 0 , 5 3 ]50 [ 3 1 , 4 0 ]51 [ 4 1 , 5 0 ]53 [ 5 1 , 6 0 ]
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1