freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹(shù)學(xué)習(xí)講義-資料下載頁(yè)

2025-01-14 19:42本頁(yè)面
  

【正文】 ?通過(guò)計(jì)算與每個(gè)候選閾值關(guān)聯(lián)的信息增益評(píng)估這些候選值 ? 方法的擴(kuò)展 ?連續(xù)的屬性分割成多個(gè)區(qū)間,而不是單一閾值的兩個(gè)空間 屬性選擇的其他度量標(biāo)準(zhǔn) ? 信息增益度量存在一個(gè)內(nèi)在偏置, 偏向具有較多值的屬性 ? 避免方法,其他度量,比如增益比率 ? 增益比率通過(guò)加入一個(gè)被稱(chēng)作分裂信息的項(xiàng)來(lái)懲罰多值屬性,分裂信息用來(lái)衡量屬性分裂數(shù)據(jù)的廣度和均勻性 SplitInformation(S,A)= GainRatio(S,A)= ? 分裂信息項(xiàng)阻礙選擇值為均勻分布的屬性 ? 問(wèn)題,當(dāng)某個(gè) Si?S。解決方法:采用一些啟發(fā)式規(guī)則, 比如僅對(duì)增益高過(guò)平均值的屬性應(yīng)用增益比率測(cè)試 ???ciiiSSSS12 ||||log||||),(),(ASmati onSplitIn forASGain決策樹(shù)學(xué)習(xí)中的假設(shè)空間搜索 —屬性分段 ?觀察 ID3的搜索空間和搜索策略,認(rèn)識(shí)到這個(gè)算法的優(yōu)勢(shì) ?假設(shè)空間包含所有的決策樹(shù),它是關(guān)于現(xiàn)有屬性的有限離散值函數(shù)的一個(gè)完整空間 ?維護(hù)單一的當(dāng)前假設(shè) ,不進(jìn)行回溯,能收斂到局部最優(yōu) ?每一步使用所有的訓(xùn)練樣例,不同于基于單獨(dú)的訓(xùn)練樣例遞增作出決定,容錯(cuò)性增強(qiáng) 決策樹(shù)學(xué)習(xí)的歸納偏置 ? ID3的搜索策略 ?優(yōu)先選擇較短的樹(shù) ?選擇那些信息增益高的屬性離根節(jié)點(diǎn)較近的樹(shù) ?很難準(zhǔn)確刻畫(huà) ID3的歸納偏置 ? 近似的 ID3的歸納偏置 ?較短的樹(shù)比較長(zhǎng)的樹(shù)優(yōu)先 ?近似在于 ID3得到局部最優(yōu),而不一定是全局最優(yōu) ?一個(gè)精確具有這個(gè)歸納偏置的算法, BFSID3 ? 更貼切近似的歸納偏置 ?較短的樹(shù)比較長(zhǎng)的樹(shù)優(yōu)先,信息增益高的屬性更靠近根節(jié)點(diǎn)的樹(shù)優(yōu)先 為什么短的假設(shè)優(yōu)先 ? ID3的歸納偏置的直觀基礎(chǔ) ?奧坎姆剃刀 ?優(yōu)先選擇擬合數(shù)據(jù)的最簡(jiǎn)單的假設(shè) ?科學(xué)上的例子 ?物理學(xué)家優(yōu)先選擇行星運(yùn)動(dòng)的簡(jiǎn)單假設(shè) ?簡(jiǎn)單假設(shè)的數(shù)量遠(yuǎn)比復(fù)雜假設(shè)的數(shù)量少 ?簡(jiǎn)單假設(shè)對(duì)訓(xùn)練樣例的針對(duì)性更小,更像是泛化的規(guī)律,而不是訓(xùn)練樣例的另一種描述 屬性選擇的其他度量標(biāo)準(zhǔn) ? 基于距離的度量 ?定義了數(shù)據(jù)劃分間的一種距離尺度 ?計(jì)算每個(gè)屬性產(chǎn)生的劃分與理想劃分間的距離 ? Lopez de Mantaras定義了這個(gè)距離度量,證明了它不偏向有大量值的屬性 ? Mingers實(shí)驗(yàn),不同的屬性選擇度量對(duì)最終精度的影響小于后修剪的程度和方法的影響 缺少屬性值的訓(xùn)練樣例 ? 例子,醫(yī)學(xué)領(lǐng)域,很多待測(cè)屬性無(wú)法觀測(cè) ? 經(jīng)常需要根據(jù)此屬性值已知實(shí)例來(lái)估計(jì)這個(gè)缺少的屬性值 ?一種策略,給它節(jié)點(diǎn) n的訓(xùn)練樣例中該屬性的最常見(jiàn)值 ?另一種策略是賦給它節(jié)點(diǎn) n的被分類(lèi)為 c(x)的訓(xùn)練樣例中該屬性的最常見(jiàn)值 ?更復(fù)雜的策略,為 x的每個(gè)可能值賦予一個(gè)概率,而不是簡(jiǎn)單地將最常見(jiàn)的值賦給 x,決策樹(shù)與概率結(jié)合 處理不同代價(jià)的屬性 ? 實(shí)例的屬性可能與代價(jià)相關(guān) ? 優(yōu)先選擇盡可能使用低代價(jià)屬性的決策樹(shù),僅當(dāng)需要產(chǎn)生可靠的分類(lèi)時(shí)才依賴(lài)高代價(jià)屬性 ? 通過(guò)引入一個(gè)代價(jià)項(xiàng)到屬性選擇度量中,可以使 ID3算法考慮屬性代價(jià) ? 加權(quán)的方法 小結(jié) ?決策樹(shù)學(xué)習(xí)為離散值輸入提供了一個(gè)實(shí)用的方法 ? ID3算法 ?從根向下推斷決策樹(shù) ?搜索完整的假設(shè)空間 ?較小的樹(shù) ? ?過(guò)度擬合問(wèn)題 ?決策樹(shù)的其他問(wèn)題 本章作業(yè) 本章作業(yè):寫(xiě)出 “ 利用決策樹(shù)建立轉(zhuǎn)基因植物生物安全評(píng)價(jià)的讀書(shū)報(bào)告 ” 格式為 PPT或者 Word,素材見(jiàn)課程網(wǎng)站
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1