freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)教案ppt(6-10章)-文庫吧資料

2025-03-13 12:39本頁面
  

【正文】 ing(LSH) EMAIL: 數(shù)據(jù)挖掘的關(guān)聯(lián)算法 多層和多維關(guān)聯(lián)規(guī)則的挖掘 ? 多層關(guān)聯(lián)規(guī)則 ? 多維關(guān)聯(lián)規(guī)則 ? 關(guān)聯(lián)規(guī)則價值衡量的方法 貨籃子分析存在的問題 ? 詳見課本 EMAIL: 數(shù)據(jù)挖掘的關(guān)聯(lián)算法 關(guān)聯(lián)分析的其他算法 ? 發(fā)現(xiàn)關(guān)聯(lián)的更好方法 ? 統(tǒng)計相關(guān)以外的 ? 理解關(guān)聯(lián) ? 有效可行的市場籃子分析 挖掘序列模式 ? 序列模式的概念及定義 ? 序列模式挖掘的主要算法 ? GSP算法描述 ? PrefixSpan算法 EMAIL: 關(guān)聯(lián)規(guī)則挖掘 —一個例子 交易 ID 購買商品2023 A ,B ,C1000 A ,C4000 A ,D5000 B ,E ,F頻繁項集 支持度{ A } 75%{ B } 50%{ C} 50%{ A ,C} 50%最小值尺度 50% 最小可信度 50% ? 對于 A ? C: ? support = support({A 、 C}) = 50% ? confidence = support({A 、 C})/support({A}) = % ? Apriori的基本思想 : ? 頻繁項集的任何子集也一定是頻繁的 EMAIL: 關(guān)鍵步驟:挖掘頻繁集 ?頻繁集 :是指滿足最小支持度的項目集合 ? 頻繁集的子集也一定是頻繁的 ?如 , 如果 {AB} 是頻繁集,則 {A} {B} 也一定是頻繁集 ? 從 1到 k( k頻繁集)遞歸查找頻繁集 ?用得到的頻繁集生成關(guān)聯(lián)規(guī)則 EMAIL: Apriori算法 ? 連接 : 用 Lk1自連接得到 Ck ? 修剪 : 一個 k項集,如果他的一個 k1項集(他的子集 )不是頻繁的,那他本身也不可能是頻繁的。Apriori性質(zhì)具有一個頻集的任一非空子集都是頻集。一般將最小支持度簡記為 minsup和最小置信度簡記為 minconf。 這也就是交易數(shù)據(jù)集 D中具有支持度 s,即 D中至少有 s%的事務(wù)包含 ,描述 為: support(X=Y)= 比如 Support(X=Y )=同時購買商品 X和 Y的交易數(shù) ?總交易數(shù) 同時交易數(shù)據(jù)集 D中具有置信度 c,即 D中包含 X的事務(wù)至少有 c%同時也包含 Y,描述為: confidence(X=Y)= 比如購買了商品 X,同時購買商品 Y可信度, confidence(X=Y)=同時購買商品 X和 Y的交易數(shù) ?購買了商品 X的交易數(shù) 一般稱滿足一定要求的規(guī)則為強規(guī)則。 EMAIL: 預(yù)測分析與趨勢分析規(guī)則 定量分析預(yù)測 ?時間序列法 ?回歸預(yù)測 ?非線性模型 ?灰色預(yù)測模型 GM( 1, 1) ?組合預(yù)測 EMAIL: 預(yù)測分析與趨勢分析規(guī)則 ? 預(yù)測的結(jié)果分析要考慮到的因素: ? 相反的預(yù)測結(jié)果 ? 勝出裕度 ? 成本收益分析 EMAIL: 預(yù)測分析與趨勢分析規(guī)則 趨勢分析挖掘 ?分析時間序列數(shù)據(jù)需要注意以下方面 : ? 長時間的走向 ? 周期的走向與周期的變化 ? 季節(jié)性的走向與變化 ? 不規(guī)則的隨機走向 EMAIL: 數(shù)據(jù)挖掘的關(guān)聯(lián)算法 關(guān)聯(lián)規(guī)則的概念及分類 ? 1.關(guān)聯(lián)規(guī)則的概念 定義 1 設(shè) I={i i i3, …, im}是由 m個不同的數(shù)據(jù)項目組成的集合,其中的元素稱為項 (item),項的集合稱為項集,包含 k個項的項集稱為 k項集 ,給定一個事務(wù)(交易) D,即交易數(shù)據(jù)庫,其中的每一個事務(wù)(交易) T是數(shù)據(jù)項 I的一個子集,即,T有一個惟一的標積符 TID;當(dāng)且僅當(dāng)時,稱交易 T包含項集 X;那么關(guān)聯(lián)規(guī)則就形如“ X=Y”的蘊涵式;其中, Ф,即表示滿足 X中條件的記錄也一定滿足Y。 ? 樸素貝葉斯分類: 假定有 m個類 C1, … Cm,對于數(shù)據(jù)樣本 X,分類法將預(yù)測 X屬于類Ci,當(dāng)且僅當(dāng) P(Ci|X) P(Cj|X), EMAIL: 預(yù)言的基本方法 ? 預(yù)言( prediction)是一門掌握對象變化動態(tài)的科學(xué),它是對對象變動趨勢的預(yù)見、分析和判斷,也是一種動態(tài)分析方法。 2)樹的修剪 ,SLIQ采用了 MDL(最小敘述長度)的方法來修剪樹。 EMAIL: 分類規(guī)則挖掘 決策樹 2.分類器 定義:輸入的數(shù)據(jù)含有千萬個記錄,每個記錄又有很多個屬性,其中有一個特別的屬性叫做類(例如信用程度的高,中,低)。 Cj∈ C={C1,C2,…, Cm}為 x的分類結(jié)果。 ? 步驟: 模型創(chuàng)建、模型使用 EMAIL: 分類規(guī)則挖掘 ? 4 評估分類方法 ? 要考慮的指標:預(yù)測準確率、速度、創(chuàng)建速度、使用速度、魯棒性、處理噪聲和丟失值、伸縮性、對磁盤駐留數(shù)據(jù)的處理能力、可解釋性、對模型的可理解程度、規(guī)則好壞的評價、決策樹的大小和分類規(guī)則的簡明性。 3 分類方法與步驟 ? 方法: 決策樹歸納、貝葉斯分類、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)。 EMAIL: 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù) Electronic Commerce 夏火松 EMAIL: ? Istitute Of MIS And LMS,wuse () EMAIL: 第 6章 數(shù)據(jù)挖掘基本算法 本章內(nèi)容: ? 分類規(guī)則挖掘 ? 預(yù)測分析與趨勢分析規(guī)則 ? 數(shù)據(jù)挖掘的關(guān)聯(lián)算法 ? 數(shù)據(jù)挖掘的聚類算法 ? 數(shù)據(jù)挖掘的統(tǒng)計分析算法 ? 數(shù)據(jù)挖掘的品種優(yōu)化算法 ? 數(shù)據(jù)挖掘的進化算法 EMAIL: 分類規(guī)則挖掘 1 分類 ? 為了理解事物特征并做出預(yù)測使用歷史數(shù)據(jù)建立一個分類模型(即分類器)的過程 。 ? 應(yīng)用于信用卡系統(tǒng)中的信用分級、市場調(diào)查、療效診斷、尋找店址等 ? 實踐應(yīng)用參照課本 EMAIL: 分類規(guī)則挖掘 2 估值 ? 估值( estimation)與分類類似,不同之處在于,分類描述的是離散型變量的輸出,而估值處理連續(xù)值的輸出;分類的類別是確定的數(shù)目,估值的量是不確定的 。還有 K最臨近分類、基于案例的推理、遺傳算法、粗糙集和模糊集方法 。 EMAIL: 分類規(guī)則挖掘 決策樹 父節(jié)點 子節(jié)點 子節(jié)點 葉節(jié)點 子節(jié)點 子節(jié)點 子節(jié)點 根節(jié)點 圖 一般決策樹結(jié)構(gòu) 葉節(jié)點 父節(jié)
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1