正文內(nèi)容

模式識別——決策樹算法-預(yù)覽頁

2025-02-01 09:24 上一頁面

下一頁面

　

【正文】 then 加一個樹葉到節(jié)點 N，標(biāo)記為 D 中的多數(shù)類； else 加一個由 Generate_decision_tree（ Dj， attribute_list）返回的節(jié)點到節(jié)點 N； end for 返回 N；上述算法基本策略中，用到三個參數(shù) D、 attribute_list和 Attribute_selection_method調(diào)用該算法。如果我們要根據(jù)分裂準(zhǔn)則的輸出將 D劃分成較小的劃分，理想地，每個劃分是“純”的，即，落在給定劃分的所有元組都屬于相同的類。設(shè)節(jié)點 N代表或存放劃分 D的元組。對于 D中的元組分類所需的期望信息由下式給出： 21( ) lo g ( )miiiIn fo D p p??? ? （ 1）其中， pi是 D中任意元組屬于類 Ci的概率，并用 |Ci,D|/|D|估計。 Info(D)又稱 D的熵。理想地，我們希望該劃分產(chǎn)生元組的準(zhǔn)確分類，即，每個劃分都是純的。信息增益定義為原來的信息需求（即僅基于類比例）與新的需求（即對 A劃分之后得到的）之間的差。三 ID3 算法 java 實現(xiàn) 1 實例假定某推銷員根據(jù)經(jīng)驗得知，學(xué)生是否會由家長接送，與學(xué)生的年齡、性別和家庭收入關(guān)系最大。有經(jīng)驗的同事告訴她，應(yīng)該先把年齡和收入情況分成幾個等級。對于表中數(shù)據(jù)，在不考慮任何特征時， 16 人中有 4 人需要家長接送， 12 人不需要家長接送，計算出此時的熵不純度為 ))1612(l og1612)164(l og164(Inf o(D ) 22 ???? 其中， Info(D)表示總共 16 個樣本中 4 個為一類， 12 個為另一類時的熵不純度?？偟撵夭患兌仁沁@兩組樣本上計算的不純度按照樣本比例的加權(quán)求和，即 (D )1610Info(D )166(D )Info A ??? 這樣，采用年齡作為根節(jié)點后，在下一級的熵不純度比上一級減少的量是 ( D )I n f oI n f o ( D )G a i n ( A ) A ?? 稱作不純度減少量，或信息增益（ information gain）。結(jié)果發(fā)現(xiàn)，對于男性組，采用年齡特征后不純度減少最大，為；對于女性組，則是采用月收入作為特征后不純度減少最多，為。模式識別 —— 決策樹算法第 7 頁共 14 頁 2 算法的 JAVA 實現(xiàn) import JAVA包。 // 原始數(shù)據(jù) int decatt。 public ID3() { xmldoc = ()。 (new File( D:\\newProject\\weka371\\weka371\\weka371\\data\\))。 i ()。 i ()。 return。 Pattern pattern = (patternString)。 ArrayListString al = new ArrayListString()。 String[] row = (,)。 } catch (IOException e1) { ()。 } decatt = n。 int sum = 0。 sum += arr[i]。 } public boolean infoPure(ArrayListInteger subset) { String value = ((0))[decatt]。 // equals表示對象內(nèi)容相同， ==表示兩個對象指向的是同一片內(nèi)存 if (!(next)) return false。 int[][] info = new int[(index).size()][]。模式識別 —— 決策樹算法第 11 頁共 14 頁 int[] count = new int[(index).size()]。 String nodevalue = (n)[index]。 int decind = (decatt).indexOf(decvalue)。 i++) { entropy += getEntropy(info[i]) * count[i] / sum。 IteratorElement iter = ()。 return。 i ()。 minEntropy = entropy。 for (String val : attvalues) { (nodeName).addAttribute(value, val)。 i++) { if (((i))[minIndex].equals(val)) { ((i))。 FileWriter fw = new FileWriter(file)。 ()。 2 弊端以上介紹的基本算法對于樹的每一層，需要掃描一遍 D中的元組。。研究表明這種方法存在一個弊端：算法往往偏向于選擇取值較多的屬性，因為加權(quán)和的方法使得實例集的分模式識別 —— 決策樹算法第 14 頁共 14 頁類趨向于拋棄小數(shù)據(jù)量的數(shù)據(jù)元組，然而取值較多的屬性卻不總是最優(yōu)的屬性，即按照使熵值最小和信息增益最大的原則被 ID3算法列為應(yīng)該首先選取的屬性在現(xiàn)實情況中卻并不那么重要，也就是說對這些屬性進(jìn)行測試不會提供太多的信息。利用用戶興趣度把（ 2）修改為： 1||( ) ( ) ( )||v jAjjDIn fo D In fo DD ??? ? ?? 六、附錄 —— 核心算法的主要源代碼模式識別 —— 決策樹算法第 15 頁共 14 頁模式識別 —— 決策樹算法第 16 頁共 14 頁模式識別 —— 決策樹算法第 17 頁共 14 頁參考文獻(xiàn) [1] 張學(xué)工 . 模式識別 . 第三版 . 北京：清華大學(xué) 出版社， 20228. [2] ID3 決策樹 eWl2mx7aXG2z_BIgPL1m513MXrZIwpZEXlio5KnGrzH00DE_XSRGwRyeoB1EK

點擊復(fù)制文檔內(nèi)容

公司管理相關(guān)推薦

模式識別論文——虹膜圖像評估采集算法的實現(xiàn)-資料下載頁

【摘要】虹膜圖像評估采集算法的實現(xiàn)摘要：隨著計算機技術(shù)的發(fā)展，模式識別的理論和方法逐漸得到也越來越廣泛的應(yīng)用。這其中包括圖像評估采集問題。本文主要是利用已搭建好的一套低成本的虹膜識別采集系統(tǒng)，選擇了基于空域方法的Robert算子作為清晰度評價的梯度函數(shù)，實現(xiàn)一種基于普爾欽斑分析的虹膜圖像評估采集算法，并對該算法的有效性進(jìn)行了分析。關(guān)鍵字：虹膜識別、普爾欽斑分析

2025-06-06 08:34

決策樹c45算法總結(jié)課件(ppt41)-資料下載頁

【摘要】數(shù)據(jù)：weka中的weather數(shù)據(jù)（字符型、數(shù)值型）outlook,temperature,humidity,windy,playsunny,hot,high,FALSE,nosunny,hot,high,TRUE,noovercast,hot,high,FALSE,yesrainy,mild,high,FALSE,yesrainy,cool

2025-01-13 19:35

決策樹決策表練習(xí)-資料下載頁

【摘要】1、某運輸公司收取運費的標(biāo)準(zhǔn)如下：①本地客戶每噸5元。②外地客戶貨物重量W在100噸以內(nèi)（含），每噸8元。③外地客戶貨物100噸以上時，距離L在500公里以內(nèi)（含）超過部分每噸增加7元，距離500公里以上時，超過部分每噸再增加10元。試畫出決策樹、決策表，反映運費策略。2、郵寄包裹收費標(biāo)準(zhǔn)如下：若收件地點在1000公里以內(nèi)，普通件每公斤2元，掛號件每公斤3元；若

2025-06-30 19:25

模式識別導(dǎo)論-資料下載頁

【摘要】2022/8/16北京郵電大學(xué)信息工程學(xué)院模式識別導(dǎo)論盛立東北京郵電大學(xué)信息工程學(xué)院2022/8/16北京郵電大學(xué)信息工程學(xué)院參考書?模式識別人民郵電出版社羅耀光盛立東?模式識別清華大學(xué)出版社邊肇祺?模式識別及應(yīng)用科學(xué)出版社付京蓀?Syntactic

2025-08-01 12:40

決策樹分類算法的應(yīng)用、進(jìn)展和發(fā)展前景-資料下載頁

【摘要】機器學(xué)習(xí)第3章決策樹學(xué)習(xí)?決策樹分類算法的進(jìn)展?決策樹分類算法的發(fā)展前景主要決策樹算法?最早的決策樹算法是由Hunt等人于1966年提出的CLS。當(dāng)前最有影響的決策樹算法是Quinlan于1986年提出的ID3和1993年提出的。?其它早期算法主CART、FACT、CHAI

2025-05-10 07:22

模式識別及其分類-資料下載頁

【摘要】模式識別與分類導(dǎo)言數(shù)據(jù)預(yù)處理無監(jiān)督方法有監(jiān)督方法本章作業(yè)模式識別與分類導(dǎo)言?Clustering/Classification統(tǒng)稱?如下問題人眼識別物中醫(yī)看舌苔/脈搏圖譜辨別化合物?低維與高維數(shù)據(jù)?一次觀察的矢量表示??tnxxx?21?xn為空

2025-03-03 08:30

模式識別實驗報告-資料下載頁

【摘要】實驗報告實驗課程名稱：模式識別姓名：王宇班級：20110813學(xué)號：2011081325實驗名稱規(guī)范程度原理敘述實驗過程實驗結(jié)果實驗成績圖像的貝葉斯分類K均值聚類算法神經(jīng)網(wǎng)絡(luò)模式識別

2025-08-02 20:23

人臉識別綜述(模式識別論文)-資料下載頁

【摘要】.....人臉識別技術(shù)綜述控制工程陳龍斌12013002342摘要：簡要介紹了人臉識別技術(shù)的研究背景及其發(fā)展歷程；對人臉識別技術(shù)的常用方法進(jìn)行了分類總結(jié)；重點對近年來人臉識別方法的研究進(jìn)展進(jìn)行綜述并對各種方法加以評價；總結(jié)了

2025-06-28 11:51

決策樹培訓(xùn)課件-資料下載頁

【摘要】Clementine的決策樹1主要內(nèi)容n決策樹算法概述n從學(xué)習(xí)角度看，決策樹屬有指導(dǎo)學(xué)習(xí)算法n目標(biāo)：用于分類和回歸n分類回歸樹及應(yīng)用nCHAID算法及應(yīng)用nQUEST算法及應(yīng)用n模型的對比分析2決策樹算法概述：基本概念n得名其分析結(jié)論的展示方式類似一棵倒置的樹?根節(jié)點?葉節(jié)點?中間節(jié)點?2叉樹和多叉樹3決策樹算法概述

2025-01-12 21:57

基于決策樹規(guī)則分類算法的研究(12-15)-資料下載頁

【摘要】基于決策樹規(guī)則分類算法的研究,報告人：孫秀芳2010年12月15日,介紹內(nèi)容,研究的主要內(nèi)容數(shù)據(jù)挖掘及其分類方法概述C4.5算法基于規(guī)則排序的決策樹分類算法CABRR的研究,一、研究的主要內(nèi)容,研究的主要內(nèi)容：從決策樹入手，從中提取決策樹規(guī)則，并通過對決策樹規(guī)則進(jìn)行有效地排序后生成分類器，應(yīng)用于分類預(yù)測。,二、數(shù)據(jù)挖掘及其分類方法概述,數(shù)據(jù)挖掘的理論分類概念及算法描述分類算法度量的方

2025-03-02 16:23

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

模式識別——決策樹算法-預(yù)覽頁

模式識別論文——虹膜圖像評估采集算法的實現(xiàn)-資料下載頁

決策樹c45算法總結(jié)課件(ppt41)-資料下載頁

決策樹決策表練習(xí)-資料下載頁

模式識別導(dǎo)論-資料下載頁

決策樹分類算法的應(yīng)用、進(jìn)展和發(fā)展前景-資料下載頁

模式識別及其分類-資料下載頁

模式識別實驗報告-資料下載頁

人臉識別綜述(模式識別論文)-資料下載頁

決策樹培訓(xùn)課件-資料下載頁

基于決策樹規(guī)則分類算法的研究(12-15)-資料下載頁

[工學(xué)]模式識別導(dǎo)論-資料下載頁

模式識別課matlab數(shù)字識別程序-資料下載頁

決策樹基本研究-資料下載頁

決策樹學(xué)習(xí)課件-資料下載頁

分類與決策樹-資料下載頁

模式識別——決策樹算法-全文預(yù)覽

模式識別——決策樹算法-預(yù)覽頁

模式識別——決策樹算法-免費閱讀

模式識別——決策樹算法(存儲版)

模式識別——決策樹算法-文庫吧在線文庫