freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

分類決策樹_id3算法(參考版)

2025-01-28 11:58本頁面
  

【正文】 、 150偶數(shù)行所有列的數(shù)據(jù)) 步驟 2:生成決策樹模型 model rpart(Species ~ + + + , data = , method=class)繪制決策樹 fancyRpartPlot(model)步驟 3:對測試集進行預測=predict(model, [,5], type=class) 注釋: [,5]的意思是去掉原測試集第 5列后的數(shù)據(jù)步驟 4:查看預測結(jié)果并對結(jié)果進行分析,計算出該決策樹的accuracy(分類正確的樣本數(shù)除以總樣本數(shù)) table([,5],) 注釋:[,5]的意思是取出測試集第 5列的數(shù)據(jù) R語言中使用 table(data)進行頻數(shù)統(tǒng)計 setosa versicolor virginica setosa 25 0 0 versicolor 0 24 1 virginica 0 3 22accuracy=( 25+24+22) /75=%步驟 5:生成規(guī)則 asRules(model) 。、 149奇數(shù)行行所有列的數(shù)據(jù)) 生成測試集 = iris[2*(1:75),] (意思是返回原數(shù)據(jù)集 步驟 1:生成訓練集和測試集 生成訓練集 =iris[2*(1:75)1,] (意思是返回原數(shù)據(jù)集 8。 表 2 轉(zhuǎn)化后的客戶信息表 年齡 學歷 職業(yè) 繳費方式 開戶時間 費用變化率 客戶流失 N3 W3 Z1 T1 H2 F1 NO N2 W2 Z2 T2 H2 F2 NO N1 W3 Z1 T3 H1 F2 YES N1 W3 Z1 T2 H1 F1 NO N1 W1 Z2 T2 H1 F1 NO N2 W2 Z3 T3 H1 F3 YES N3 W1 Z3 T1 H2 F1 NO 決策樹算法 ID3算法實際應用 在電信行業(yè)應用實例( 5) YES NO 年 齡 職 業(yè) YES 繳費方式 YES YES NO YSES NO NO 在網(wǎng)時長 NO F1 F2 F3 N1 N2 N3 T1 T2 T3 Z1 Z2 Z3 H1 H2 費用變化率 決策樹算法 ID3算法實際應用 在電信行業(yè)應用實例( 6) 在圖中, NO表示客戶不流失, YES表示客戶流失。 連續(xù)型屬性概化為區(qū)間值:表中年齡、費用變化率和在網(wǎng)時間為 連續(xù)型數(shù)據(jù),由于建立決策樹時,用離散型數(shù)據(jù)進行處理速度最 快,因此對連續(xù)型數(shù)據(jù)進行離散化處理,根據(jù)專家經(jīng)驗和實際計 算信息增益,在“在網(wǎng)時長”屬性中,通過檢測每個劃分,得到在 閾值為 5年時信息增益最大,從而確定最好的劃分是在 5年處,則 這個屬性的范圍就變?yōu)椋?=5,5: H1,H2}。 表 1 客戶信息表 年齡 學歷 職業(yè) 繳費方式 在網(wǎng)時長 費用變化率 客戶流失 58 大學 公務員 托收 13 10% NO 47 高中 工人 營業(yè)廳繳費 9 42% NO 26 研究生 公務員 充值卡 2 63% YES 28 大學 公務員 營業(yè)廳繳費 5 % NO 32 初中 工人 營業(yè)廳繳費 3 % NO 42 高中 無業(yè)人員 充值卡 2 100% YES 68 初中 無業(yè)人員 營業(yè)廳繳費 9 % NO 決策樹算法 ID3算法實際應用 在電信行業(yè)應用實例( 4) 屬性概化:用屬性概化閾值控制技術沿屬性概念分層上卷或下鉆 進行概化。 決策樹算法 ID3算法實際應用 在電信行業(yè)應用實例( 3) 屬性刪除:將有大量不同取值且無概化操作符的屬性或者可用其 它屬性來代替它的較高層概念的那些屬性刪除。 該公司經(jīng)過多年的電腦化管理,已有大量的客戶個人基本信息 (文中簡稱為客戶信息表 )。但往往不適合直接挖掘,需要做數(shù)據(jù)的預處理工作,一般 包括數(shù)據(jù)的選擇 (選擇相關的數(shù)據(jù) )、凈化 (消除冗余數(shù)據(jù) )、轉(zhuǎn)換、 歸約等。這種客戶是電信企業(yè)真正需要保住的客戶。 客戶流失可以相應分為四種類型:其中非財務原因主動流失 的客戶往往是高價值的客戶。三、 指客戶自然流失和被動流失。 電信運營商的客戶流失有三方面的含義:一是指客戶從一個 電信運營商轉(zhuǎn)網(wǎng)到其他電信運營商,這是流失分析的重點。此時,每個葉子節(jié)點對應的實例集中的實例屬于 同一類。 參考 Top 10 algorithms in data mining Knowledge Information System 2023 14:1–37 決策樹算法 ID3算法小結(jié) ID3算法是一種經(jīng)典的決策樹學習算法,由 Quinlan于 1979年 提出。 ( Binary Split)。然后信息增益的計算就可以采用和離散值 處理一樣的方法。實際應用中 屬性是連續(xù)的或者離散的情況都比較常見。 原始表 決策樹算法 計數(shù) 年齡 收入 學生 信譽 歸類:買計算機? 64 青 高 否 良 不買 64 青 高 否 優(yōu) 不買 128 中 高 否 良 買 60 老 中 否 良 買 64 老 低 是 良 買 64 老 低 是 優(yōu) 不買 64 中 低 是 優(yōu) 買 128 青 中 否 良 不買 64 青 低 是 良 買 。 。 決策樹算法 計數(shù) 年齡 收入 學生 信譽 歸類:買計算機? 64 青 高 否 良 不買 64 青 高 否 優(yōu) 不買 128 中 高 否 良 買 60 老 中 否 良 買 64 老 低 是 良 買 64 老 低 是 優(yōu) 不買 64 中 低 是 優(yōu) 買 128 青 中 否 良 不買 64 青 低 是 良 買 132 老 中 是 良 買 64 青 中 是 優(yōu) 買 32 中 中 否 優(yōu) 買 32 中 高 是 良 買 63 老 中 否 優(yōu) 不買 1 老 中 否 優(yōu) 買 第 21步計算年齡的熵 年齡共分三個組: 青年、中年、老年 青年買與不買比例為 128/256 S1(買 )=128 S2(不買) = 256 S=S1+S2=384 P1=128/384 P2=256/384 I(S1,S2)=I(128,256) =P1Log2P1P2Log2P2 =(P1Log2P1+P2Log2P2) = 決策樹算法 計數(shù) 年齡 收入 學生 信譽 歸類:買計算機? 64 青 高 否 良 不買 64 青 高 否 優(yōu) 不買 128 中 高 否 良 買 60 老 中 否 良 買 64 老 低 是 良 買 64 老 低 是 優(yōu) 不買 64 中 低 是 優(yōu) 買 128 青 中 否 良 不買 64 青 低 是 良 買 132 老 中 是 良 買 64 青 中 是 優(yōu) 買 32 中 中 否 優(yōu) 買 32 中 高 是 良 買 63 老 中 否 優(yōu) 不買 1 老 中 否 優(yōu) 買 第 22步計算年齡的熵 年齡共分三個組: 青年、中年、老年 中年買與不買比例為 256/0 S1(買 )=256 S2(不買) = 0 S=S1+S2=256 P1=256/256 P2=0/256 I(S1,S2)=I(256, 0) =P1Log2P1P2Log2P2 =(P1Log2P1+P2Log2P2) =0 決策
點擊復制文檔內(nèi)容
規(guī)章制度相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1