freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹(shù)分類算法的應(yīng)用、進(jìn)展和發(fā)展前景-展示頁(yè)

2025-05-22 07:22本頁(yè)面
  

【正文】 大減小。對(duì)于候選提取分層中的每一種提取 ,計(jì)算其針對(duì)選定屬性的信息增益比 ,選擇信息增益比最大的提取 ,假設(shè)該提取的信息增益比為 I2。其基本思想是給定一組候選的提取分層 ,ITA選擇一個(gè)最優(yōu)的提取并對(duì)原始數(shù)據(jù)庫(kù)進(jìn)行概化。因此面向?qū)傩缘母呕瘧?yīng)當(dāng)把握好尺度。使用 AOI方法可能出現(xiàn)的問(wèn)題是 :如果屬性概化得太高可能導(dǎo)致過(guò)分概化 ,產(chǎn)生的規(guī)則可能沒(méi)有多少信息 。 數(shù)據(jù)預(yù)處理 ? 數(shù)據(jù)概化是指將數(shù)據(jù)集從較低的概念層抽象到較高的概念層。此外決策者有時(shí)需要在數(shù)據(jù)的多個(gè)抽象層上進(jìn)行分析以獲得有價(jià)值的信息。 數(shù)據(jù)預(yù)處理 ? 數(shù)據(jù)挖掘處理的是海量數(shù)據(jù)集不僅樣本容量大、含有的屬性集大而且數(shù)據(jù)中往往含有一些與挖掘任務(wù)不相關(guān)和無(wú)意義的部分。針對(duì)以上問(wèn)題許多學(xué)者提出了處理大型數(shù)據(jù)集的決策樹(shù)算法。 決策樹(shù)分類算法的進(jìn)展 ? 傳統(tǒng)的決策樹(shù)分類算法主要是針對(duì)小數(shù)據(jù)集的,大都要求訓(xùn)練集常駐內(nèi)存,這使得在處理數(shù)據(jù)挖掘任務(wù)時(shí),傳統(tǒng)決策樹(shù)算法在可伸縮性、精度和效率方面受到了很大的限制。 ? 其它早期算法主 CART、 FACT、 CHAID算法 。機(jī)器學(xué)習(xí) 第 3章 決策樹(shù)學(xué)習(xí) ? 決策樹(shù)分類算法的進(jìn)展 ? 決策樹(shù)分類算法的發(fā)展前景 主要決策樹(shù)算法 ? 最早的決策樹(shù)算法是由 Hunt等人于 1966年提出的 CLS 。當(dāng)前最有影響的決策樹(shù)算法是 Quinlan于 1986年提出的 ID3和 1993年提出的 。 后期的算法主要有 SLIQ、SPRINT 、 PUBLIC等。而在實(shí)際的數(shù)據(jù)挖掘應(yīng)用中我們面臨的數(shù)據(jù)集往往是容量巨大的數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù),在構(gòu)造決策樹(shù)時(shí)需要將龐大的數(shù)據(jù)在主存和緩存中不停的導(dǎo)入導(dǎo)出使得運(yùn)算效率大大降低。下面我們分三個(gè)方面對(duì)一些算法的改進(jìn)進(jìn)行討論。在這樣的數(shù)據(jù)集上進(jìn)行分析會(huì)花費(fèi)很長(zhǎng)時(shí)間使得挖掘任務(wù)不可行。在這種情況下我們需要先用過(guò)濾、概化和歸約等方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理然后再對(duì)預(yù)處理后的數(shù)據(jù)集進(jìn)行挖掘。面向?qū)傩缘臍w納( AOI)是一種有用的概化方法它考查數(shù)據(jù)集中每個(gè)屬性的不同取值,通過(guò)屬性刪除或者屬性概化等操作在給定的概念分層上概化數(shù)據(jù)庫(kù),由此抽取有意義的知識(shí)。而如果屬性概化不到足夠高的層次 ,則可能概化不足 ,得到的規(guī)則可能也不含多少信息。 數(shù)據(jù)預(yù)處理 ? 針對(duì)這個(gè)問(wèn)題 ,有專家提出了一種新的基于信息增益比的數(shù)據(jù)概化方法 ITA。其操作步驟可以概括為從原始數(shù)據(jù)庫(kù)中選定某一屬性 ,計(jì)算屬性的信息增益比 ,假設(shè)其值
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1