freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘之分類(lèi)和預(yù)測(cè)(編輯修改稿)

2025-02-10 23:15 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 編號(hào)n 假設(shè) S中有 m個(gè)類(lèi),總共 s個(gè)訓(xùn)練樣本,每個(gè)類(lèi)Ci有 si個(gè)樣本 (i= 1,2,3...m),那么任意一個(gè)樣本屬于類(lèi) Ci的概率是 si / s,那么用來(lái)分類(lèi)一個(gè)給定樣本的 期望信息 是:信息增益 (2)n 一個(gè)有 v個(gè)值的屬性 A{a1,a2,...,av}可以將 S分成 v個(gè)子集 {S1,S2,...,Sv},其中 Sj包含 S中屬性 A上的值為 aj的樣本。假設(shè) Sj包含類(lèi) Ci的 sij個(gè)樣本。根據(jù) A的這種劃分的期望信息稱(chēng)為 A的 熵n A上該劃分的獲得的信息增益定義為:n 具有高信息增益的屬性,是給定集合中具有高區(qū)分度的屬性。所以可以通過(guò)計(jì)算 S中樣本的每個(gè)屬性的信息增益,來(lái)得到一個(gè)屬性的相關(guān)性的排序。age ine student credit_rating buys_puteryouth high no fair noyouth high no excellent nomiddle_aged high no fair yessenior medium no fair yessenior low yes fair yessenior low yes excellent nomiddle_aged low yes excellent yesyouth medium no fair noyouth low yes fair yessenior medium yes fair yesyouth medium yes excellent yesmiddle_aged medium no excellent yesmiddle_aged high yes fair yessenior medium no excellent no判定歸納樹(shù)算法示例 (1)n 對(duì)于上述數(shù)據(jù),可以略過(guò)步驟 1, 2n 步驟 3,計(jì)算基于熵的度量 —— 信息增益,作為樣本劃分的根據(jù)q Gain(age)=q Gain(ine)=q Gain(student)=q Gain(credit_rating)=n 然后,對(duì)測(cè)試屬性每個(gè)已知的值,創(chuàng)建一個(gè)分支,并以此劃分樣本,得到第一次劃分判定歸納樹(shù)算法示例 (2)判定歸納樹(shù)算法示例 (3)age?overcaststudent? credit rating?no yes fairexcellentyouth seniorno noyes yesyesMiddle aged防止分類(lèi)中的過(guò)分適應(yīng)n 產(chǎn)生的決策樹(shù)會(huì)出現(xiàn)過(guò)分適應(yīng)數(shù)據(jù)的問(wèn)題q 由于數(shù)據(jù)中的噪聲和孤立點(diǎn),許多分枝反應(yīng)的是訓(xùn)練數(shù)據(jù)中的異常q 對(duì)新樣本的判定很不精確n 防止過(guò)分適應(yīng)的兩種方法q 先剪枝:通過(guò)提前停止樹(shù)的構(gòu)造 —— 如果在一個(gè)節(jié)點(diǎn)劃分樣本將導(dǎo)致低于預(yù)定義臨界值的分裂( . 使用信息增益度量)n 選擇一個(gè)合適的臨界值往往很困難q 后剪枝:由 “完全生長(zhǎng) ”的樹(shù)剪去分枝 —— 對(duì)于樹(shù)中的每個(gè)非樹(shù)葉節(jié)點(diǎn),計(jì)算該節(jié)點(diǎn)上的子樹(shù)被剪枝可能出現(xiàn)的期望錯(cuò)誤率n 使用一個(gè)獨(dú)立的測(cè)試集來(lái)評(píng)估每顆樹(shù)的準(zhǔn)確率,就能得到具有最小期望錯(cuò)誤率的決策樹(shù)由決策樹(shù)提取分類(lèi)規(guī)則n 可以提取決策樹(shù)表示的知識(shí),并以 IFTHEN形式的分類(lèi)規(guī)則表示n 對(duì)從根到樹(shù)葉的每條路徑創(chuàng)建
點(diǎn)擊復(fù)制文檔內(nèi)容
語(yǔ)文相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1