freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹分析及spss實(shí)現(xiàn)(ppt61頁)(完整版)

2025-02-06 19:35上一頁面

下一頁面
  

【正文】 分隔變數(shù),勝利者就被選為根節(jié)點(diǎn)的分隔變數(shù)。 24 分類與迴歸樹 ( CART) 找出起始的分隔 : 用來評估一個(gè)分隔數(shù)的衡量標(biāo)準(zhǔn)是分散度( diversity)。在下圖中,我們將顥示在這種分類問題上,決策樹超越純粹統(tǒng)計(jì)方法的優(yōu)點(diǎn)。在下圖,我們可以一眼看出左下的格子清一色都是男性。和決策樹根部節(jié)點(diǎn)有關(guān)的測試將下層分成兩個(gè)或更多部分。 決策樹基本觀念 9 藉由將資料分到正確類別的情況,我們可以驗(yàn)證出建構(gòu)決策樹的最佳演算法。 決策樹基本觀念 6 一筆資料從根部的節(jié)點(diǎn)進(jìn)入決策樹。 在本章中,我們先介紹決策樹運(yùn)作的方式及其如何應(yīng)用在分類和預(yù)測問題。隨後我們進(jìn)一步介紹如何以 CART、 CHAID演算法建構(gòu)決策樹。在根部,應(yīng)用一項(xiàng)測驗(yàn)來決定這筆資料該進(jìn)入下一層的哪一個(gè)子節(jié)點(diǎn) ( child node) 。第四章中的電影迷資料庫。 13 決策樹基本觀念 14 決策樹基本觀念 決策樹的根部擴(kuò)大成資料箱: ●資料箱的寬度可以有變化,以顯示一筆資料落 在特定箱中的相對可能性。仔細(xì)的看,我們可以發(fā)現(xiàn)某些層在分類上表現(xiàn)很好,或是聚集了大量資料。 19 決策樹基本觀念 20 分類與迴歸樹 ( CART) 分類與迴歸樹 ( Classification And Regression Tree,CART) CART演算法是建構(gòu)決策樹時(shí)最常用的演算法之一。對於一組資料的 『 分散度指標(biāo) 』( index of diversity)有多種計(jì)算方式。 27 分類與迴歸樹 ( CART) 培養(yǎng)出整棵樹 : 一開始的分隔製造出兩個(gè)節(jié)點(diǎn),現(xiàn)在我們再以分隔根節(jié)點(diǎn)的方法將每個(gè)節(jié)點(diǎn)予以分隔?;仡櫱皥D,圖中選取了從根部到標(biāo)示為『 女性 』 的葉部路徑。 30 分類與迴歸樹 ( CART) 修剪決策樹 : 只要能發(fā)現(xiàn)新的分隔,改善決策樹將訓(xùn)練組資料分類的能力,決策樹就會(huì)繼續(xù)成長。 32 分類與迴歸樹 ( CART) 33 分類與迴歸樹 ( CART) 確認(rèn)入選的分支決策樹: 我們的目標(biāo)是首先將提供最少額外預(yù)測能力的分支先修剪掉。 38 分類與迴歸樹 ( CART) 將代價(jià)列入考量 : 我們討論至此,只使用錯(cuò)誤率作為評估一個(gè)分支樹良莠的依據(jù)。 40 修剪決策樹: CART使用決策樹的分散度為度量,來標(biāo)記不同的分支樹,然後以沒有見過的預(yù)先分類好的資料(測試組)來測試這些分支樹。 42 43 CHAID CHAID是哈根( . Hartigan)在 1975年率先提出的演算法,這是本章所討論的最古老的演算法。第二步,三個(gè)或更多的預(yù)測變數(shù)群組以二分法被重新分隔。其中之一會(huì)造成決策樹擁有超過我們所需的節(jié)點(diǎn)。這個(gè)決策樹如今更能夠表現(xiàn)分類上顯示的無異議的觀念: 『 當(dāng)所有投票人意見一致,這項(xiàng)決策就是無異議。真正的辦法是用屬性的線性合併輕易解決問題。 ●決策樹不需要太多計(jì)算就可進(jìn)行分類。 ●決策樹提供清楚的指引,告訴我們在進(jìn)行預(yù) 測和分類時(shí)哪一個(gè)變是最重要。這些衍生變數(shù)可能是多個(gè)其他變數(shù)的函數(shù),或者可能是對數(shù),平方根,立方,絕對值,或其他單一變數(shù)函數(shù)。機(jī)械學(xué)習(xí)領(lǐng)域的一些研究者,非常強(qiáng)調(diào)這個(gè)觀念,但似乎只有在這些學(xué)者以一些小型的,組織完整的資料在建構(gòu)他們的研究時(shí),才能獲得這樣完美的結(jié)果。每一個(gè)節(jié)點(diǎn)的案例越少,得出的分類可靠性就越低。 卡方分析 (chisquared )這是對應(yīng)於 CHAID的前兩個(gè)字母縮寫。CHAID是從更早的一套自動(dòng)互動(dòng)偵測系統(tǒng) AID衍生而來,後者是摩根( . Man)與??固?(. Sonquist)在 1963年提出。因此, 樹
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1