freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹分類算法的應(yīng)用、進(jìn)展和發(fā)展前景-免費(fèi)閱讀

2025-06-11 07:22 上一頁面

下一頁面
  

【正文】 ? 將決策樹技術(shù)軟件化一直是決策樹技術(shù)的方向之一。目前正在進(jìn)行決策樹與專家系統(tǒng)相結(jié)合的研究,以便在不確定環(huán)境下更好地決策。訓(xùn)練數(shù)據(jù)的增加經(jīng)常造成決策樹大小的線性增加 ,而這種增加并沒有都帶來決策樹準(zhǔn)確性的提高。 3 、尋找更好的簡化決策樹的方法 ? 簡化決策樹的研究工作主要有兩個(gè)方面,一是對(duì)比各種不同的簡化決策樹方法,分析它們各自的特性、優(yōu)點(diǎn)和缺點(diǎn)。一種思路是:在每個(gè)節(jié)點(diǎn)上選擇測(cè)試屬性,即最優(yōu)分裂屬性時(shí),各個(gè)屬性之間是相互獨(dú)立的,它們的信息增益或者基尼指數(shù)的計(jì)算可以在不同的處理器上并行進(jìn)行。因此 ,劃分表時(shí)不需要重新排序。每個(gè)元組由屬性表中鏈接到類表的一個(gè)表目鏈接表示 ,而類表的表目則鏈接到它在決策樹中對(duì)應(yīng)的葉節(jié)點(diǎn)。與傳統(tǒng)的決策樹算法相比 ,明顯地降低了運(yùn)算的復(fù)雜度而且產(chǎn)生的決策樹在精度和規(guī)模上也保持了較高的質(zhì)量。針對(duì)這一問題 ,出, 可以選擇一個(gè)合適的間隔 ,利用它來選擇每個(gè)數(shù)值型屬性的某些取值而不是全部取值來計(jì)算其基尼指數(shù) ,這樣計(jì)算量會(huì)大大降低。因此這種做法是以犧牲精確度為代價(jià)來提高運(yùn)算效率的。直接利用這種數(shù)據(jù)集來產(chǎn)生決策樹會(huì)增加存儲(chǔ)和計(jì)算方面的負(fù)擔(dān)。其操作步驟可以概括為從原始數(shù)據(jù)庫中選定某一屬性 ,計(jì)算屬性的信息增益比 ,假設(shè)其值為 I1。在這種情況下我們需要先用過濾、概化和歸約等方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理然后再對(duì)預(yù)處理后的數(shù)據(jù)集進(jìn)行挖掘。 后期的算法主要有 SLIQ、SPRINT 、 PUBLIC等。 決策樹分類算法的進(jìn)展 ? 傳統(tǒng)的決策樹分類算法主要是針對(duì)小數(shù)據(jù)集的,大都要求訓(xùn)練集常駐內(nèi)存,這使得在處理數(shù)據(jù)挖掘任務(wù)時(shí),傳統(tǒng)決策樹算法在可伸縮性、精度和效率方面受到了很大的限制。 數(shù)據(jù)預(yù)處理 ? 數(shù)據(jù)概化是指將數(shù)據(jù)集從較低的概念層抽象到較高的概念層。對(duì)于候選提取分層中的每一種提取 ,計(jì)算其針對(duì)選定屬性的信息增益比 ,選擇信息增益比最大的提取 ,假設(shè)該提取的信息增益比為 I2。在這種情況下,對(duì)數(shù)據(jù)集進(jìn)行壓縮或者精簡是必要的。另一種抽樣方法節(jié)點(diǎn)抽樣是決策樹方法中特有的我們主要對(duì)其進(jìn)行介紹。但是在間隔如何選擇的問題上人為的因素比較多。 ? 前面提到的數(shù)據(jù)概化、歸約和抽樣方法都可以簡化數(shù)據(jù)集 ,提高決策樹算法的效率。 SLIQ的特點(diǎn)是將類表駐留在主存 ,在決策樹的學(xué)習(xí)過程中經(jīng)常訪問它 ,因此算法的效率會(huì)提高。當(dāng) SLIQ和 SPRINT處理的數(shù)據(jù)量太大 ,不能一次裝入內(nèi)存時(shí) ,SLIQ的可伸縮性受限于它所使用的常駐內(nèi)存的數(shù)據(jù)結(jié)構(gòu)
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1