freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)挖掘課設(shè)報(bào)告-文庫吧

2025-01-06 16:13 本頁面


【正文】 uatic: Boolean8. predator: Boolean9. toothed: Boolean10. backbone: Boolean11. breathes: Boolean12. venomous: Boolean13. fins: Boolean14. legs: Numeric (set of values: {0,2,4,5,6,8})15. tail: Boolean16. domestic: Boolean17. catsize: Boolean18. type: Numeric (integer values in range [1,7])Relevant Papers:Forsyth39。s PC/BEAGLE User39。s Guide. 將數(shù)據(jù)讀入Modeler中。在源選項(xiàng)卡中選擇可變文件節(jié)點(diǎn)并設(shè)置節(jié)點(diǎn)參數(shù)。 在輸出選項(xiàng)卡中選擇表節(jié)點(diǎn),添加到數(shù)據(jù)流中。執(zhí)行該節(jié)點(diǎn)生成數(shù)據(jù)表。在瀏覽數(shù)據(jù)時(shí)發(fā)現(xiàn)兩個(gè)錯(cuò)誤項(xiàng),數(shù)據(jù)中有兩個(gè)frog和一個(gè)gril,則刪除一個(gè)frog和gril?!颈怼抗?jié)點(diǎn)的輸出結(jié)果 其中animal name,hair,feathers ,eggs,milk,airborne,aquatic ,Predator,toothed,backbone,breathes,venomous,fins,legs,tail,domestic,catsize為模型的輸入變量, type為模型的目標(biāo)變量。在字段選項(xiàng)選項(xiàng)卡中選擇【類型】節(jié)點(diǎn),添加到數(shù)據(jù)流中,設(shè)置參數(shù)指定變量角色。 【類型】節(jié)點(diǎn)的參數(shù) 在輸出選項(xiàng)卡中選擇數(shù)據(jù)審核節(jié)點(diǎn),添加到數(shù)據(jù)流中。執(zhí)行節(jié)點(diǎn)生成數(shù)據(jù)表?!緮?shù)據(jù)審核】節(jié)點(diǎn)的輸出結(jié)果可以看出,該份數(shù)據(jù)有99個(gè)樣本,除animal name以外均為數(shù)值型變量,除animal name、legs、type以外均是布爾值。Modeler對此計(jì)算,輸出最小值、最大值、均值、標(biāo)準(zhǔn)差、偏態(tài)系數(shù)等基本描述統(tǒng)計(jì)量。數(shù)據(jù)顯示,legs最大值與最小值差距較大。從數(shù)值型變量的柱形圖可以看出屬于type1的數(shù)量最多。數(shù)據(jù)質(zhì)量理想。3 數(shù)據(jù)準(zhǔn)備 針對該數(shù)據(jù),hair,feathers ,eggs,milk,airborne,aquatic ,Predator,toothed,backbone,breathes,venomous,fins,tail,domestic,catsize屬性為是否有hair,feathers ,eggs,milk,airborne,aquatic ,Predator,toothed,backbone,breathes,venomous,fins,tail,domestic,catsize,所以取值0和1不規(guī)范,應(yīng)將取值0和1調(diào)整為No和Yes。 【重新分類】的【設(shè)置】選項(xiàng)卡 在輸出選項(xiàng)卡中選擇【表】節(jié)點(diǎn),連接到【重新分類】節(jié)點(diǎn),執(zhí)行【表】節(jié)點(diǎn)生成重新分類后的數(shù)據(jù)表,如下: 【表】節(jié)點(diǎn)的輸出結(jié)果 觀察數(shù)據(jù)發(fā)現(xiàn),屬于type1的數(shù)據(jù)較多,屬于其他type的數(shù)據(jù)相對較少,所以進(jìn)行樣本平衡處理。 【平衡】的【設(shè)置】選項(xiàng)卡 在輸出選項(xiàng)卡中選擇【表】節(jié)點(diǎn),連接到【平衡】節(jié)點(diǎn),執(zhí)行【表】節(jié)點(diǎn)生成平衡處理后的數(shù)據(jù)表,如下圖:【表】節(jié)點(diǎn)的輸出結(jié)果4 建立決策樹模型 ,CART,CHAID三種算法建立模型: ,CART,CHAID算法介紹 (1):,79年由J R Quinlan發(fā)展,并提出了ID3算法,主要針對離散型屬性數(shù)據(jù),其后又不斷的改進(jìn),它在ID3基礎(chǔ)上增加了隊(duì)連續(xù)屬性的離散化。,主要在執(zhí)行效率和內(nèi)存使用方面進(jìn)行了改進(jìn)。,可生成多分支的決策樹,目標(biāo)變量為分類變量。第一次拆分確定的樣本子集隨后再次拆分,通常是根據(jù)另一個(gè)字段進(jìn)行拆分,這一過程重復(fù)進(jìn)行指導(dǎo)樣本子集不能在被拆分為止。最后,重新緝拿眼最低層次的拆分,哪些對模型值沒有顯著貢獻(xiàn)的樣本子集被提出或者修剪。優(yōu)點(diǎn):; ,模型退出的規(guī)則有非常直觀的解釋; 。:以信息熵的下降速度作為確定最佳分支變量和分割閥值的依據(jù)。 (2)CART:CART(Classification And Regression Tree)算法采用一種二分遞歸分割的技術(shù),將當(dāng)前的樣本集分為兩個(gè)子樣本集,使得生成的的每個(gè)非葉子節(jié)點(diǎn)都有兩個(gè)分支。因此,CART算法生成的決策樹是結(jié)構(gòu)簡潔的二叉樹。CART算法檢查每個(gè)變量和該變量所有可能的劃分值來發(fā)現(xiàn)最好的劃分,對離散值如{x,y,x},則在該屬性上的劃分有三種情({{x,y},{z}},{{x,z},y},{{y,z},x}),空集和全集的劃分除外;對于連續(xù)值處理引進(jìn)“分裂點(diǎn)”的思想,假設(shè)樣本集中某個(gè)屬性共n個(gè)連續(xù)值,則有n1個(gè)分裂點(diǎn),每個(gè)“分裂點(diǎn)”為相鄰兩個(gè)連續(xù)值的均值 (a[i] + a[i+1]) / 2。將每個(gè)屬性的所有劃分按照他們能減少的雜質(zhì)(合成物中的異質(zhì),不同成分)量來進(jìn)行排序。CART算法經(jīng)常采用事后剪枝方法:該方法是通過在完全生長的樹上剪去分枝實(shí)現(xiàn)的,通過刪除節(jié)點(diǎn)的分支來剪去樹節(jié)點(diǎn)。最下面未被剪枝的節(jié)點(diǎn)成為樹葉。 (3)CHAID:CHAID(ChiSquareAutomaticInteractionDetection)提供了一種在多個(gè)自變量中自動搜索能產(chǎn)生最大差異的變量方案。CHAID分析可以生成非二進(jìn)制樹,即有些分割有兩個(gè)以上的分支。CHAID模型需要一個(gè)單一的目標(biāo)和一個(gè)或多個(gè)輸入字段。還可以指定重量和頻率領(lǐng)域。CHAID分析,卡方自動交互檢測,是一種用卡方統(tǒng)計(jì),以確定最佳的分割,建立決策樹的分類方法。CHAID算法以因變量為根結(jié)點(diǎn),對每個(gè)自變量(只能是分類或有序變量,也就是離散性的,如果是連續(xù)變量,如年齡,收入要定義成分類或有序變量)進(jìn)行分類,計(jì)算分類的卡方值(ChiSquareTest)。如果幾個(gè)變量的分類均顯著,則比較這些分類的顯著程度(P值的大?。?,然后選擇最顯著的分類法作為子節(jié)點(diǎn)。CHIAD可以自動歸并自變量中類別,使之顯著性達(dá)到最大。最后的每個(gè)葉結(jié)點(diǎn)就是一個(gè)細(xì)分市場。 (1)在【建?!窟x項(xiàng)卡中選擇【】、【Camp。R樹R】、【CHAID(C)】節(jié)點(diǎn),添加到數(shù)據(jù)流中。設(shè)置各算法的主要參數(shù)。 【】的【模型】選項(xiàng)卡【】的【分析】選項(xiàng)卡 【Camp。R樹】的【構(gòu)建選項(xiàng)】選項(xiàng)卡(一) 【Camp。R樹】的【構(gòu)建選項(xiàng)】選項(xiàng)卡(二) 【Camp。R樹】的【構(gòu)建選項(xiàng)】選項(xiàng)卡(三) 【Camp。R樹】的【構(gòu)建選項(xiàng)】選項(xiàng)卡
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1