freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

關(guān)于決策樹剪枝的兩點探討-預(yù)覽頁

2025-07-14 05:02 上一頁面

下一頁面
 

【正文】 柳州,545007數(shù)據(jù)挖掘是一個利用各種分析工具在海量數(shù)據(jù)中發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過程,使用這些模型和關(guān)系可以進(jìn)行預(yù)測,它幫助決策者尋找數(shù)據(jù)間潛在的關(guān)聯(lián),發(fā)現(xiàn)被忽略的因素,因而被認(rèn)為是解決當(dāng)今時代所面臨的數(shù)據(jù)爆炸而信息貧乏問題的一種有效方法。關(guān)于決策樹剪枝的兩點探討楊龍平【摘 要】 數(shù)據(jù)挖掘中的決策樹方法可以很好地實現(xiàn)對數(shù)據(jù)的分類,并根據(jù)生成的決策樹模型,為決策者提供決策參考?!娟P(guān) 鍵 詞】決策樹 信息增益 屬性 剪枝【作者簡介】楊龍平,男,柳州運輸職業(yè)技術(shù)學(xué)院信息工程系教師。而充分合理地利用預(yù)先剪枝可以從很大程度上降低決策樹計算的復(fù)雜度。內(nèi)部結(jié)點用矩形表示,而樹葉結(jié)點用橢圓表示。在收集到的這些畢業(yè)生數(shù)據(jù)中,并不是完美的,有些數(shù)據(jù)表中的字段并不一致,有些字段和課題的關(guān)系并不緊密,還有些數(shù)據(jù)并不準(zhǔn)確、甚至含有噪音。從理論上講,后剪枝好于預(yù)先剪枝,但計算復(fù)雜度大。ID3算法總是選擇具有最高信息增益(或最大熵壓縮)的屬性作為當(dāng)前結(jié)點的測試屬性。因此,這個屬性可能會有非常高的信息增益,而且被選作樹的根結(jié)點的決策屬性,并形成一棵深度只為一級但卻非常寬的樹,這棵樹可以理想地分類訓(xùn)練數(shù)據(jù)。假設(shè)有表格數(shù)據(jù)如表1所示。在第一次計算信息熵的時候,“性別”,因此,在以后的計算過程中,可以不再對“性別”屬性計算增益,這樣一方面可以減少計算的工作量,另一方面,可以有效地防止創(chuàng)建一棵龐大的決策樹。例如,有一個“主觀意愿”屬性作為子樹的根結(jié)點,設(shè)它有兩個屬性值0和1,如果繼續(xù)進(jìn)行測試,則將0和1作為分支進(jìn)行劃分子
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1