freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹(shù)建模概述-文庫(kù)吧資料

2025-01-18 19:43本頁(yè)面
  

【正文】 性“收入”的數(shù)值就可以被泛化為若干離散區(qū)間,諸如低、中和高。 數(shù)據(jù)準(zhǔn)備 數(shù)據(jù)轉(zhuǎn)換 利用概念層次樹(shù),數(shù)據(jù)能夠被泛化到更高的層次。在機(jī)器學(xué)習(xí)中,這一相關(guān)分析步驟被稱為屬性選擇 (feature selection) ,包含與挖掘任務(wù)無(wú)關(guān)的屬性可能會(huì)減緩甚至誤導(dǎo)整個(gè)學(xué)習(xí)過(guò)程。此外,有些屬性也可能是冗余的。主要的工作包括: ? 數(shù)據(jù)清洗 ? 相關(guān)分析 ? 數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)準(zhǔn)備 數(shù)據(jù)清洗 這一數(shù)據(jù)預(yù)處理步驟,主要是幫助除去數(shù)據(jù)中的噪聲,并妥善解決缺失數(shù)據(jù)問(wèn)題,盡管大多數(shù)分類算法都包含一些處理噪聲和缺失數(shù)據(jù)的方法,但這一預(yù)處理步驟可以有效 減少學(xué)習(xí)過(guò)程可能出現(xiàn)相互矛盾情況的問(wèn)題。 樹(shù)的建模過(guò)程 數(shù)據(jù)要求 (數(shù)據(jù)準(zhǔn)備 ) 在進(jìn)行分類和預(yù)測(cè)挖掘之前,首先必須準(zhǔn)備好有關(guān)挖掘數(shù)據(jù)。一般情況下,根據(jù)測(cè)試數(shù)據(jù)集中的每一元組對(duì)生成的規(guī)則進(jìn)行預(yù)測(cè)準(zhǔn)確性的檢驗(yàn),如果預(yù)測(cè)準(zhǔn)確性過(guò)低,則將該分枝剪除。一般情況下,訓(xùn)練樣本數(shù)據(jù)集是根據(jù)實(shí)際需要由實(shí)際的歷史數(shù)據(jù)生成的、有一定綜合程度的、用于數(shù)據(jù)分析處理的 數(shù)據(jù)集。 如何構(gòu)造 精度高、規(guī)模小的決策樹(shù) 是決策樹(shù)算法的 核心內(nèi)容 167。 (3)以 AID, CHAD為代表的算法,在此類算法中,非終端節(jié)點(diǎn)的分枝數(shù)在 2至樣本類別個(gè)數(shù)范圍內(nèi)分布。 樹(shù)的建模過(guò)程 決策樹(shù)算法通過(guò)構(gòu)造決策樹(shù)來(lái)發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)涵的分類規(guī)則,包含許多種不同的算法,主要可以分為三類 : (1)基于統(tǒng)計(jì)學(xué)理論的方法,以 CART為代表,在這類算法中,對(duì)于非終端節(jié)點(diǎn)來(lái)說(shuō),有兩個(gè)分枝 。 167。 ? 在工業(yè)領(lǐng)域,決策樹(shù)可以用于故障診斷、工業(yè)生產(chǎn)過(guò)程控制等。 國(guó)內(nèi)目前有關(guān)決策樹(shù)的研究多是圍繞算法的改進(jìn)以及決策樹(shù)在商業(yè)、工業(yè)等領(lǐng)域的運(yùn)用。 決策樹(shù)介紹 2 決策樹(shù)的應(yīng)用和發(fā)展趨勢(shì) 決策樹(shù)由于結(jié)構(gòu)簡(jiǎn)單、效率高等優(yōu)點(diǎn)而獲得了廣泛的應(yīng)用。因此,將決策樹(shù)算法推廣到考慮多屬性 是一個(gè)有待研究的課題。 ? 缺值數(shù)據(jù)處理問(wèn)題 : 因?yàn)闆Q策樹(shù)進(jìn)行分類預(yù)測(cè)時(shí),完全基于數(shù)據(jù)的測(cè)試屬性,所以對(duì)于測(cè)試屬性缺失的數(shù)據(jù),決策樹(shù)將無(wú)法處理。 ? 對(duì)于順序相關(guān)的數(shù)據(jù),需要很多預(yù)處理的工作。 ? 決策樹(shù)的輸出包含屬性的排序 生成決策樹(shù)時(shí),按照最大信息增益選擇測(cè)試屬性, 因此,在決策樹(shù)中可以大致判斷屬性的相對(duì)重要性。 ? 計(jì)算量較小。 它的最大優(yōu)點(diǎn)是,在學(xué)習(xí)過(guò)程中不需要使用者了解很多背景知識(shí),只要訓(xùn)練樣本集能夠用 “屬性 值” 的方式表達(dá) 出來(lái)就能使用決策樹(shù)學(xué)習(xí)算法來(lái)分類。 決策樹(shù)的基本知識(shí) 2 決策樹(shù)學(xué)習(xí)是應(yīng)用最廣的歸納推理算法之一。 ? 每個(gè)屬性可能是值類型 (連續(xù)值 ),也可能是枚舉類型 (離散值 )。 ? 測(cè)試屬性的不同屬性值的個(gè)數(shù),可能使得每個(gè)內(nèi)節(jié)點(diǎn)有兩個(gè)或多個(gè) 分枝。 根據(jù)決策樹(shù)各種不同的屬性,可分為以下幾類 : ? 決策樹(shù)內(nèi)節(jié)點(diǎn)的測(cè)試屬性可能是單變量的,即每個(gè)內(nèi)節(jié)點(diǎn)只包含一個(gè) 屬性 。 決策樹(shù)的基本知識(shí) 2 決策樹(shù)通常有兩大類型,分別為 分類決策樹(shù) 和 回歸決策樹(shù) 。 決策樹(shù)的基本知識(shí) 2 先根據(jù) 訓(xùn)練子集 (又稱為窗口 )形成決策樹(shù),如果該樹(shù)不能對(duì)所有對(duì)象給出正確的分類,那么選擇一些例外 加入到窗口中,重復(fù)該過(guò)程一直到形成正確的決策集。 自上而下法則對(duì)可能的一般化描述集進(jìn)行搜索,試圖 找到一些滿足一定要求的最優(yōu)的描述。 歸納過(guò)程就是在描述空間中進(jìn)行搜索的過(guò)程。 決策樹(shù)的基本知識(shí) 2 歸納學(xué)習(xí)存在一個(gè)基本假定 : 任一模型如果能在足夠大的 訓(xùn)練樣本集 中很好地逼近 目標(biāo)函數(shù),則它也能在 未見(jiàn)樣本 中很好地逼近目標(biāo)函數(shù)。這種一般化描述能夠解釋給定的輸入數(shù)據(jù),并可以用來(lái)預(yù)測(cè) 新的數(shù)據(jù)。 歸納推理從若干個(gè)事實(shí)表征出的特征、特性或?qū)傩灾?, 通過(guò)比較、總結(jié)、概括而得出一個(gè)規(guī)律性的結(jié)論。 例子 關(guān)于上 moo
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1