freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

決策樹分析技巧培訓課件-文庫吧資料

2025-01-17 19:35本頁面
  

【正文】 分支樹: 最後工作是從利用第三組資料,將測試組和訓練組打散,即『評估組資料』( evaluation set)。測試組和訓練組來自同一群母體,但包含的資料不同。這是一種衡量方法,逐一檢視每一個葉部,確認最弱勢的分支(那些無法有效降低整棵決策樹錯誤率的分支),然後將它們標示出來加以修剪 33 分類與迴歸樹 ( CART) 34 分類與迴歸樹 ( CART) 35 分類與迴歸樹 ( CART) 評估分支樹: 最後工作是從入選的分支樹中選出最能分類新資料的決策樹。 31 分類與迴歸樹 ( CART) 32 分類與迴歸樹 ( CART) 確認入選的分支決策樹: 我們的目標是首先將提供最少額外預測能力的分支先修剪掉。我們需要修剪這個決策樹以便在一般性的案例中獲得更正確的預測。圖中的箱子變得很小,而且每一個都不大,只容得下訓組資料,不太可能再容納新資料。這個規(guī)則有助於將訓練資料分類,但如果在更寬廣的世界上,馬丁是一個很少見的名,而且這個名字和身高又沒有特別的關連,那麼這個規(guī)則比沒用還糟糕。 29 分類與迴歸樹 ( CART) 修剪決策樹 : 只要能發(fā)現新的分隔,改善決策樹將訓練組資料分類的能力,決策樹就會繼續(xù)成長。 28 分類與迴歸樹 ( CART) 計算整個決策樹的錯誤率: 整個決策樹的錯誤率是所有葉部錯誤率的加權總數。這告訴我們,以這個訓練組而言,抵達這個節(jié)點的資料是女性的機率為 。然而,這並不表示所有祗達這個葉部的資料都屬於同一類?;仡櫱皥D,圖中選取了從根部到標示為『女性』的葉部路徑。到了最後,存在的只剩下葉部節(jié)點,而我們也完成決策樹。對每一個剩下的變數最好的分隔就確定了。如果這個變數只遇上一個數值,我們就將其排除,因為它無法被用來創(chuàng)造一個分隔。 26 分類與迴歸樹 ( CART) 培養(yǎng)出整棵樹 : 一開始的分隔製造出兩個節(jié)點,現在我們再以分隔根節(jié)點的方法將每個節(jié)點予以分隔。假設這個變數遇上多個數值,我們進行二分式研究,希望找出降低分散度最多的最佳分隔法。在完全分散和完全聚集的兩個極端之間,這些函數有些微不同的型態(tài)。 24 分類與迴歸樹 ( CART) 找出起始的分隔 : 最好的分隔變數是能夠降低一個資料組的分散度,而且降得最多。對於一組資料的『分散度指標』( index of diversity)有多種計算方式。最好分隔的定義是能夠將資料最完善的分配到一個單一類別支配的群體。 CART藉著一個單一輸入變數函數,在每一個節(jié)點分隔資料,以建構一個二分式決策樹。 20 分類與迴歸樹 ( CART) 21 分類與迴歸樹 ( CART) numbers 22 分類與迴歸樹 ( CART) 找出起始的分隔 : 在過程中的一開始,我們有一個預先分類好的訓練和資料。 18 決策樹基本觀念 19 分類與迴歸樹 ( CART) 分類與迴歸樹 ( Classification And Regression Tree,CART) CART演算法是建構決策樹時最常用的演算法之一。這兩種非常不同的持卡人可能為發(fā)卡銀行帶來同樣多的收益。某些持卡人每次繳款的金額不高,但他們欠繳金額很高時,卻又不會超過額度 。 16 決策樹基本觀念 17 決策樹基本觀念 這是一種基本上的差異:當一筆資料有多種非常不同的方法使其成為目標類別的一部份時,使用單一線條來找出類別間界線的統(tǒng)計方法效力會很弱。仔細的看,我們可以發(fā)現某些層在分類上表現很好,或是聚集了大量資料。一個層形圖讓我們一目了然的見到數層資料的細節(jié)。這樣可以立即顯示這套分 類系統(tǒng)的表現。這類直條圖可以使用直條的頻
點擊復制文檔內容
黨政相關相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1