freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)教案ppt(6-10章)(已修改)

2025-03-17 12:39 本頁面
 

【正文】 EMAIL: 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù) Electronic Commerce 夏火松 EMAIL: ? Istitute Of MIS And LMS,wuse () EMAIL: 第 6章 數(shù)據(jù)挖掘基本算法 本章內(nèi)容: ? 分類規(guī)則挖掘 ? 預(yù)測分析與趨勢分析規(guī)則 ? 數(shù)據(jù)挖掘的關(guān)聯(lián)算法 ? 數(shù)據(jù)挖掘的聚類算法 ? 數(shù)據(jù)挖掘的統(tǒng)計分析算法 ? 數(shù)據(jù)挖掘的品種優(yōu)化算法 ? 數(shù)據(jù)挖掘的進化算法 EMAIL: 分類規(guī)則挖掘 1 分類 ? 為了理解事物特征并做出預(yù)測使用歷史數(shù)據(jù)建立一個分類模型(即分類器)的過程 。 ? 應(yīng)用于信用卡系統(tǒng)中的信用分級、市場調(diào)查、療效診斷、尋找店址等 ? 實踐應(yīng)用參照課本 EMAIL: 分類規(guī)則挖掘 2 估值 ? 估值( estimation)與分類類似,不同之處在于,分類描述的是離散型變量的輸出,而估值處理連續(xù)值的輸出;分類的類別是確定的數(shù)目,估值的量是不確定的 。 3 分類方法與步驟 ? 方法: 決策樹歸納、貝葉斯分類、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)。還有 K最臨近分類、基于案例的推理、遺傳算法、粗糙集和模糊集方法 。 ? 步驟: 模型創(chuàng)建、模型使用 EMAIL: 分類規(guī)則挖掘 ? 4 評估分類方法 ? 要考慮的指標(biāo):預(yù)測準(zhǔn)確率、速度、創(chuàng)建速度、使用速度、魯棒性、處理噪聲和丟失值、伸縮性、對磁盤駐留數(shù)據(jù)的處理能力、可解釋性、對模型的可理解程度、規(guī)則好壞的評價、決策樹的大小和分類規(guī)則的簡明性。 EMAIL: 分類規(guī)則挖掘 決策樹 父節(jié)點 子節(jié)點 子節(jié)點 葉節(jié)點 子節(jié)點 子節(jié)點 子節(jié)點 根節(jié)點 圖 一般決策樹結(jié)構(gòu) 葉節(jié)點 父節(jié)點 EMAIL: 分類規(guī)則挖掘 決策樹 ?1.決策樹的構(gòu)造過程 ID3算法應(yīng)用如下: )(log 21 pipmi i?? ),..,1(1 )/)..21(( smjjsImj ssm jjsjs?? ???)(log 21 pipi i?信息量計算公式: I(s1,s2,? sm)= ( ) 其中, pi為 si占整個類別的概率 利用屬性 A劃分當(dāng)前樣本集合所需要的信息(熵)的計算公式為: E( A) = () 信息增益公式: Gain( A) = I(s1,s2,? sm)E( A) ( ) 例如:一個銷售的顧客數(shù)據(jù)庫(訓(xùn)練樣本集合) ,對購買計算機的人員進行分類: 字段為:(年齡(取值: 30,30~40,40);收入 (高,中,低 );學(xué)生否( Y, N);信用(一般,很好);購買計算機否( Y, N)) 記錄為 14個,具體數(shù)據(jù)如下: X1=(30, 高 ,N, 一般 ,N); X2=(30, 高 ,N, 很好 ,N) X3=(30~40, 高 ,N, 一般 ,Y); X4=(40, 中 ,N, 一般 ,Y) X5=(40, 低 ,Y, 一般 ,Y); X6=(40, 低 ,Y, 很好 ,N) X7=(3040, 低 ,Y, 高 ,Y); X8=(30, 中 ,N, 一般 ,N) X9=(30, 低 ,Y, 一般 ,Y); X10=(40, 中 ,Y, 一般 ,Y) X11=(30,中 ,Y, 很好 ,Y); X12=(30~40,中 ,N, 很好 ,Y) X13=(30~40,高 ,Y, 一般 ,Y); X14=(40,中 ,N, 很好 ,N) EMAIL: 分類規(guī)則挖掘 決策樹 1.決策樹的構(gòu)造過程 決策樹的構(gòu)造算法: 決策樹的構(gòu)造算法可通過訓(xùn)練集 T完成,其中 T={x,cj},而x=(a1,a2,…, an)為一個訓(xùn)練實例,它有 n個屬性,分別列于屬性表(A1,A2,…, An)中,其中 ai表示屬性 Ai的取值。 Cj∈ C={C1,C2,…, Cm}為 x的分類結(jié)果。從屬性表中選擇屬性 Ai作為分類屬性;若屬性 Ai的取值有 ki個,則將 T劃分為 ki個子集, T1,…,T ki,其中 Tij={x,C|x,C}∈ T,且 x的屬性取值 A為第 i個值;接下來從屬性表中刪除屬性 Ai;對于每一個Tij(1≤j≤K1),令 T=Tij;如果屬性表非空,返回第 1步,否則輸出。 EMAIL: 分類規(guī)則挖掘 決策樹 2.分類器 定義:輸入的數(shù)據(jù)含有千萬個記錄,每個記錄又有很多個屬性,其中有一個特別的屬性叫做類(例如信用程度的高,中,低)。 具體步驟 : 1)樹的建立。 2)樹的修剪 ,SLIQ采用了 MDL(最小敘述長度)的方法來修剪樹。 EMAIL: 分類規(guī)則挖掘 決策樹 3.決策樹的可擴展性 4.基于決策樹方法的數(shù)據(jù)挖掘工具 KnowledgSEEKER EMAIL: 分類規(guī)則挖掘 貝葉斯分類 1.貝葉斯信任網(wǎng)絡(luò)如何工作 邊緣 主區(qū)域 手機呼叫 服務(wù)區(qū)域 no yes 外界 圖 簡單的貝葉斯網(wǎng)圖 EMAIL: 分類規(guī)則挖掘 貝葉斯分類 2.貝葉斯定理與樸素貝葉斯分類 ? 貝葉斯定理 : P(H|X)=P(X|H)P(H)/P(X) 其中, P(H|X)表示條件 X下 H的概率,也稱為條件概率或稱為后驗概率(posteriori probabilities)。 ? 樸素貝葉斯分類: 假定有 m個類 C1, … Cm,對于數(shù)據(jù)樣本 X,分類法將預(yù)測 X屬于類Ci,當(dāng)且僅當(dāng) P(Ci|X) P(Cj|X), EMAIL: 預(yù)言的基本方法 ? 預(yù)言( prediction)是一門掌握對象變化動態(tài)的科學(xué),它是對對象變動趨勢的預(yù)見、分析和判斷,也是一種動態(tài)分析方法。 ? 預(yù)測的基本步驟: ? 確定預(yù)測目標(biāo),包括預(yù)測對象、目的、對象范圍; ? 收集分析內(nèi)部和外部資料;
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1