freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

模式識別——決策樹算法-資料下載頁

2025-01-08 09:24本頁面
  

【正文】 istInteger selatt) { Element ele = null。 @SuppressWarnings(unchecked) ListElement list = (// + name)。 IteratorElement iter = ()。 while (()) { ele = ()。 if ((value).equals(value)) break。 } if (infoPure(subset)) { (((0))[decatt])。 return。 模式識別 —— 決策樹算法 第 12 頁 共 14 頁 } int minIndex = 1。 double minEntropy = 。 for (int i = 0。 i ()。 i++) { if (i == decatt) continue。 double entropy = calNodeEntropy(subset, (i))。 if (entropy minEntropy) { minIndex = (i)。 minEntropy = entropy。 } } String nodeName = (minIndex)。 (new Integer(minIndex))。 ArrayListString attvalues = (minIndex)。 for (String val : attvalues) { (nodeName).addAttribute(value, val)。 ArrayListInteger al = new ArrayListInteger()。 for (int i = 0。 i ()。 i++) { if (((i))[minIndex].equals(val)) { ((i))。 } } buildDT(nodeName, val, al, selatt)。 } } // 把 xml寫入文件 public void writeXML(String filename) { try { File file = new File(filename)。 模式識別 —— 決策樹算法 第 13 頁 共 14 頁 if (!()) ()。 FileWriter fw = new FileWriter(file)。 OutputFormat format = ()。 // 美化格式 XMLWriter output = new XMLWriter(fw, format)。 (xmldoc)。 ()。 } catch (IOException e) { (())。 } } } 四 ID3 算法性能分析 1 優(yōu)勢 搜索空間是完全的假設(shè)空間,目標(biāo)函數(shù)必在搜索空間中,不存在無解的危險 ;全盤使用訓(xùn)練數(shù)據(jù),而不是像候選剪除算法一個一個地考慮訓(xùn)練例。這樣做的優(yōu)點是,可以利用全部訓(xùn)練例的統(tǒng)計性質(zhì)進(jìn)行決策,從而抵抗噪音。 2 弊端 以上介紹的基本算法對于樹的每一層,需要掃描一遍 D中的元組。在處理大型數(shù)據(jù)庫時,這可能導(dǎo)致很長的訓(xùn)練時間和內(nèi)存的不足。 對于非增量式學(xué)習(xí)任務(wù), ID3算法常常是建立決策樹的很好的選擇。但對于增量式學(xué)習(xí)任務(wù)來說,由于 ID3不能增量地接受訓(xùn)練例,這就使得每增加一次實例都必須拋棄原有決策樹,重新構(gòu)造新的決策樹,造成了極大的開銷。 。 搜索中只維持一個解,不 能像候選剪除算法那樣返回所有可能的與訓(xùn)練例集一致的假設(shè),并優(yōu)化地查詢新例以獲得收斂于目標(biāo)函數(shù)的解;其搜索無回溯。它可能收斂于局部最優(yōu)解而丟失全局最優(yōu)解,因為一個一個地考慮訓(xùn)練例,不容易像剪除算法那樣使用新例步進(jìn)式地改進(jìn)決策樹。 五 ID3 算法改進(jìn) 傳統(tǒng)的 ID3算法選擇屬件 A作為測試屬性的原則是使得其信息增益最大。研究表明這種方法存在一個弊端:算法往往偏向于選擇取值較多的屬性,因為加權(quán)和的方法使得實例集的分模式識別 —— 決策樹算法 第 14 頁 共 14 頁 類趨向于拋棄小數(shù)據(jù)量的數(shù)據(jù)元組,然而取值較多的屬性卻不總是最優(yōu)的屬性,即按照使熵值最小和信息增益最大的原 則被 ID3算法列為應(yīng)該首先選取的屬性在現(xiàn)實情況中卻并不那么重要,也就是說對這些屬性進(jìn)行測試不會提供太多的信息。 針 |對 ID3算法偏向于選擇取值較多但實際中并不總是最優(yōu)的屬件作為測試屬件的缺點,這里引人用戶興趣度:給定 0≤ ? ≤ 1, ? 稱為用戶對不確定知識的興趣度,其太小由決策者根據(jù)先驗知識或領(lǐng)域知識來確定。它是個模糊的概念,通常指關(guān)于某一事務(wù)的先驗知識,包括領(lǐng)域知識和專家建議,具體到?jīng)Q策樹學(xué)習(xí)中則是指在決策樹 訓(xùn)練過程中除了用于生成和修改決策樹的實例集之外的所有影響決策樹規(guī)則生成和選擇的因素。 改進(jìn)的 ID3算法是針對規(guī)則生成方法即屬性選擇標(biāo)準(zhǔn)算法進(jìn)行了改進(jìn),通過對式 (2)中加權(quán)和增加用戶興趣度,加強(qiáng)了屬性的標(biāo)注,降低了非重要屬性的標(biāo)注,把加權(quán)和轉(zhuǎn)換為加權(quán)和加用戶興趣度,使生成決策樹時數(shù)量少的數(shù)據(jù)元組不會被淹沒,最終使決策樹減少了對取值較多的屬性的依賴性,從而盡可能地減少大數(shù)據(jù)掩蓋小數(shù)據(jù)的現(xiàn)象發(fā)生。 利用用戶興趣度把( 2)修改為: 1||( ) ( ) ( )||v jAjjDIn fo D In fo DD ??? ? ?? 六、 附錄 —— 核心算法的主要源代 碼 模式識別 —— 決策樹算法 第 15 頁 共 14 頁 模式識別 —— 決策樹算法 第 16 頁 共 14 頁 模式識別 —— 決策樹算法 第 17 頁 共 14 頁 參考文獻(xiàn) [1] 張學(xué)工 . 模式識別 . 第 三 版 . 北京: 清華大學(xué) 出版社, 20228. [2] ID3 決策樹 eWl2mx7aXG2z_BIgPL1m513MXrZIwpZEXlio5KnGrzH00DE_XSRGwRyeoB1EK
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1