freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹分析及spss實(shí)現(xiàn)(ppt61頁)-文庫吧在線文庫

2025-02-04 19:35上一頁面

下一頁面
  

【正文】 球形或點(diǎn)狀來代表。例如,在信用卡產(chǎn)業(yè),很多種持卡人都讓發(fā)卡根行有利可圖。預(yù)先分類意味輸出變數(shù),或稱依變數(shù),具備一個己知的類別。換言之,我們希望以下這個式子最大化: 分散度(分隔前)- ﹝ 分散度(分隔後左邊子集 合)+分散度(分隔後右邊子集合) ﹞ 三分種分散度衡量法: ? min{P(c1), P(c2) } ? 2P(c1)P(c2 ) ?〔 P(c1)logP (c1)〕 +〔 P(c2)logP (c2)〕 26 分類與迴歸樹 ( CART) 當(dāng)各類別出現(xiàn)的機(jī)率相等時,以上的三個函數(shù)會出現(xiàn)最大值,當(dāng)資料組中只包含單一類別時,函數(shù)值則為零。 一個類別變數(shù)若被用來作為決策樹中較高層的分隔變數(shù)時,比較有可能很快的變成單一數(shù)值化。使用簡單機(jī)率的定義,我們可以看到 11個葉部中有 9個是正確分類。 31 分類與迴歸樹 ( CART) 修剪決策樹 : 下圖顯示出會發(fā)的狀況。為達(dá)到此目的,我們使用第二個預(yù)先分好的資料組,即 『 測試組資料 』 ( test set)。在進(jìn)行癌癥抹片檢查時,誤診為性也許只會帶來更多的檢查,但誤診為陰性卻可能讓病情惡化。 41 從決策樹到規(guī)則: 我們可以在不改變分類行為的前提下藉著合併到葉部的路徑來向這個目標(biāo)走出第一步。 44 CHAID CHAID與 CART的差異: CHAID和 CART兩種演算法的最大差異在於,後兩者先過度套用資料,再加以修剪,而 CHAID嘗試在過度套用的情況發(fā)生之前就讓決策樹停止蔓生擴(kuò)大。 49 CHAID 評鑑入選分隔變數(shù): 一旦每一個分隔變數(shù)都被分類,在輸出變數(shù)上產(chǎn)生最大的類別差異,就對這項(xiàng)結(jié)果使用卡方分析檢驗(yàn)。為了簡化說明,我們假設(shè)只有三個人投票。 57 讓超平面傾斜: 傳統(tǒng)的決策樹檢驗(yàn)一個節(jié)點(diǎn)的單一變數(shù)值,只能形成方形區(qū)域。 其他決策樹的變化 59 其他決策樹的變化 60 類神經(jīng)樹: 在每一個節(jié)點(diǎn)就多個變數(shù)進(jìn)行合併性輸入的一個方法,就是將每一個節(jié)點(diǎn)組成一個小型的類神經(jīng)網(wǎng)路。 缺點(diǎn) : ●遇上太多類別時容易犯錯 。 其他決策樹的變化 61 決策樹的優(yōu) 、 缺點(diǎn) 優(yōu)點(diǎn) : ●決策樹可以產(chǎn)生易於了解的規(guī)則。 其他決策樹的變化 58 問題是有些東西不適合放進(jìn)方形區(qū)域裡,下圖顯示了這個問題:這兩個區(qū)域?qū)嶋H上是由一條對角線劃分,需要一個更深入的決策樹才能產(chǎn)生足夠的方形區(qū)域來約略正確的將其劃分。這個決策樹顯示使用變數(shù)結(jié)合能獲得的另一個潛在優(yōu)點(diǎn)。這個方法可能會有一些問題。 46 CHAID 選擇分隔變數(shù): 經(jīng)過第一步驟之後,我們得出以下的表: 47 CHAID 杏仁燒魚,鮪魚沙拉,生魚片 ? 魚肉 鵝肝醬,水牛城雞翅,碎雞肝 ? 禽肉 牛腰肉,麥香堡,罐頭牛肉,碎羊肉 ? 紅肉 48 CHAID 重新分隔類別: 第一步無法在輸出數(shù)上產(chǎn)生顯著統(tǒng)計(jì)差異的所有預(yù)測變都被合併。 ?看球賽加上地主隊(duì)輸球加上待在家裡,就會得出 牛奶 。這是因?yàn)?處理方式和 CART相當(dāng)類似,但對類別變項(xiàng)的處理就相當(dāng)不同。入選分支樹應(yīng)用在評估組所得出的錯誤率,來預(yù)期這個分支樹在未經(jīng)分類的資料上使用時的錯誤率。問題是要決定該倒推回去修剪多少,以及這些分支的決策樹中哪些表現(xiàn)很好。每一個葉部的錯誤率乘上資料抵達(dá)葉部的機(jī)率 (分配到資料的比例 ),加起來的總數(shù)就是整個決策樹的錯誤率。 28 分類與迴歸樹 ( CART) 計(jì)算每個節(jié)點(diǎn)的錯誤率: 每一個葉部如今都分配到一個類別以及一個錯誤率。我們從每個變數(shù)中找出最能降低分散度的最佳
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1