freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

決策樹(shù)分析及spss實(shí)現(xiàn)(ppt61頁(yè))(已改無(wú)錯(cuò)字)

2023-02-01 19:35:23 本頁(yè)面
  

【正文】 set)。入選分支樹(shù)應(yīng)用在評(píng)估組所得出的錯(cuò)誤率,來(lái)預(yù)期這個(gè)分支樹(shù)在未經(jīng)分類的資料上使用時(shí)的錯(cuò)誤率。 38 分類與迴歸樹(shù) ( CART) 將代價(jià)列入考量 : 我們討論至此,只使用錯(cuò)誤率作為評(píng)估一個(gè)分支樹(shù)良莠的依據(jù)。然而,在許多應(yīng)用上,錯(cuò)誤分類的代價(jià)依資料類別不同而有異。 當(dāng)然在醫(yī)療診斷上,一個(gè)錯(cuò)誤的陰性診斷( negative)也許會(huì)比錯(cuò)誤的陽(yáng)性診斷( positive)傷害更大。在進(jìn)行癌癥抹片檢查時(shí),誤診為性也許只會(huì)帶來(lái)更多的檢查,但誤診為陰性卻可能讓病情惡化。我們可以把問(wèn)題列入考量,以一個(gè)使用加權(quán)方式將錯(cuò)誤分類的機(jī)率加倍的代價(jià)函數(shù),來(lái)取代錯(cuò)誤率。 39 ,是澳州研究者昆蘭( J. Ross Quinlan)多年努力成果。 與 CART差異 : 培養(yǎng)決策樹(shù): CART之間的第一個(gè)差異是 CART在每一個(gè)節(jié)點(diǎn)都呈現(xiàn)二分法,因此產(chǎn)生二分式?jīng)Q策樹(shù),而 個(gè)節(jié)點(diǎn)產(chǎn)不同數(shù)目的分支。這是因?yàn)?處理方式和 CART相當(dāng)類似,但對(duì)類別變項(xiàng)的處理就相當(dāng)不同。 40 修剪決策樹(shù): CART使用決策樹(shù)的分散度為度量,來(lái)標(biāo)記不同的分支樹(shù),然後以沒(méi)有見(jiàn)過(guò)的預(yù)先分類好的資料(測(cè)試組)來(lái)測(cè)試這些分支樹(shù)。相反的,嘗試以只用訓(xùn)練資料的情況下來(lái)修剪決策樹(shù)。因此, 樹(shù)的相同資料來(lái)決定該如何加以修剪。 41 從決策樹(shù)到規(guī)則: 我們可以在不改變分類行為的前提下藉著合併到葉部的路徑來(lái)向這個(gè)目標(biāo)走出第一步。下圖的決策樹(shù)部分得出以下的規(guī)則: ?看球賽加上地主隊(duì)獲勝加上跟朋友出門,就會(huì)得出 啤酒 。 ?看球賽加上地主隊(duì)獲勝加上待在家裡,就會(huì)得出 健怡汽水 。 ?看球賽加上地主隊(duì)輸球加上跟朋友出門,就會(huì)得出 啤酒 。 ?看球賽加上地主隊(duì)輸球加上待在家裡,就會(huì)得出 牛奶 。 42 43 CHAID CHAID是哈根( . Hartigan)在 1975年率先提出的演算法,這是本章所討論的最古老的演算法。這也是最受到廣泛使用的演算法,因?yàn)樗S著 SPSS和 SAS等受歡迎的統(tǒng)計(jì)軟體流通。CHAID是從更早的一套自動(dòng)互動(dòng)偵測(cè)系統(tǒng) AID衍生而來(lái),後者是摩根( . Man)與桑奎斯特 (. Sonquist)在 1963年提出。 44 CHAID CHAID與 CART的差異: CHAID和 CART兩種演算法的最大差異在於,後兩者先過(guò)度套用資料,再加以修剪,而 CHAID嘗試在過(guò)度套用的情況發(fā)生之前就讓決策樹(shù)停止蔓生擴(kuò)大。 另一個(gè)差異是 CHAID只限於類別變數(shù)使用,連續(xù)變數(shù)必頇被區(qū)隔成幾個(gè)區(qū)段範(fàn)圍,或是以高,中,低等類別來(lái)取代。 45 CHAID 培養(yǎng)決策樹(shù): 如同其他兩種方法, CHAID演算利用輸入變數(shù)找出一個(gè)方法,將訓(xùn)練組資料分隔成兩個(gè)或兩個(gè)以上子節(jié)點(diǎn)。這些子節(jié)點(diǎn)被選擇的方式是輸出變數(shù)遇上某個(gè)特定數(shù)值的機(jī)率隨著節(jié)點(diǎn)不同而有所差異。 46 CHAID 選擇分隔變數(shù): 經(jīng)過(guò)第一步驟之後,我們得出以下的表: 47 CHAID 杏仁燒魚(yú),鮪魚(yú)沙拉,生魚(yú)片 ? 魚(yú)肉 鵝肝醬,水牛城雞翅,碎雞肝 ? 禽肉 牛腰肉,麥香堡,罐頭牛肉,碎羊肉 ? 紅肉 48 CHAID 重新分隔類別: 第一步無(wú)法在輸出數(shù)上產(chǎn)生顯著統(tǒng)計(jì)差異的所有預(yù)測(cè)變都被合併。第二步,三個(gè)或更多的預(yù)測(cè)變數(shù)群組以二分法被重新分隔。如果這些分隔之中任何一個(gè)可以產(chǎn)生統(tǒng)計(jì)上顯著差異的結(jié)果,就就被保留。 卡方分析 (chisquared )這是對(duì)應(yīng)於 CHAID的前兩個(gè)字母縮寫。 49 CHAID 評(píng)鑑入選分隔變數(shù): 一旦每一個(gè)分隔變數(shù)都被分類,在輸出變數(shù)上產(chǎn)生最大的
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1