freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

集群分析clusteranalysis(編輯修改稿)

2024-11-12 05:16 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 3 : C4 : D5 : E6 : F7 : G1 : A 2 : B 3 : C 4 : D 5 : E 6 : F 7 : G S q u a r e d E u c l i d e a n D i s t a n c eT h i s i s a d i s s i m i l a r i t y m a t r i x1 2 3 4 5 6 Profile diagram: Preliminary screening for outliers 0123456781 2ABCDEFGV1 V2 網(wǎng)路購(gòu)物被騙時(shí),你怎麼辦? ID 打電話 寫信 告消基會(huì) 大一 1 1 1 小二 1 1 1 李三 0 0 1 邱 SIR 0 0 1 王五 0 0 1 趙六 0 1 0 劉妻 0 1 0 八八 1 1 0 酒鬼 1 1 0 石頭 1 1 0 群數(shù)凝聚過(guò)程9 10 . 0 0 0 0 0 28 9 . 0 0 0 0 1 76 7 . 0 0 0 0 0 84 5 . 0 0 0 0 0 53 4 . 0 0 0 0 4 91 2 . 0 0 0 0 0 71 8 1 . 0 0 0 6 2 81 6 1 . 4 0 0 7 3 91 3 2 . 4 2 9 8 5 0階段123456789集群1 集群2組合集群係數(shù) 集群1 集群2先出現(xiàn)的階段集群下一階段 階段一:定向 ? 確立研究的目的 ? 分類系統(tǒng)的建立:兼顧探索性與確認(rèn)性 ? 資料簡(jiǎn)化 ? 關(guān)係的探究 ? 重要的議題 ? 分類變項(xiàng)的選擇:選擇具有鑑別力的適當(dāng)變項(xiàng) 階段二:研究設(shè)計(jì) ? 三個(gè)決策的重點(diǎn) ? 1. 偏離值如何檢測(cè) ? ? 2. 樣本相似性如何測(cè)量? ? 3. 資料是否需要經(jīng)過(guò)標(biāo)準(zhǔn)化? ? 重要議題 ? 集群分析涉及一連串研究者的主觀判斷,因此判斷的合理性與依恃的的基礎(chǔ)便格外重要 階段三:假定的考量 ? 集群分析不是母數(shù)統(tǒng)計(jì) , 而是一套客觀的分類程序 , 涉及複雜的數(shù)學(xué)計(jì)算程序 , 並沒(méi)有嚴(yán)格的統(tǒng)計(jì)假定必須遵守 ? 兩個(gè)重要的分析影響條件 ? representativeness樣本的代表性 ? multicollinearity變項(xiàng)的多元共線性 階段四:集群的分離與評(píng)鑑 ? 決定形成集群的策略 ? 決定集群的合理數(shù)目 ? 集群分析的程序 ? 階層法 ?凝聚法 (agglomerative) ?分離法 (divisive) ? 非階層法 ? 二階段法( Ward法):結(jié)合變異數(shù)分析 ,找出兩群最佳的集群使 MSwithin最小 階段五:集群的解釋 ? 集群分離出來(lái)之後 , 決定集群性質(zhì)的過(guò)程 ? 類似於因素分析法的命名問(wèn)題 ? 非標(biāo)準(zhǔn)化資料 :就原始資料意義來(lái)說(shuō)明 ? 標(biāo)準(zhǔn)化資料 :需迴歸資料原始狀態(tài) ? 可以使用區(qū)別分析來(lái)釐清 階段六:集群的效度驗(yàn)證 ? 一旦集群確立之後 , 對(duì)於集群的性質(zhì)的區(qū)辨力以及穩(wěn)定性與類化性的評(píng)估 ? 進(jìn)行相關(guān)性的研究 , 選取重要的變項(xiàng)來(lái)進(jìn)行預(yù)測(cè)與分類分析 集群分析的技術(shù)特性 ? 測(cè)量集群距離的方法 ? 最近法( single linkage) ? 最遠(yuǎn)法( plete linkage) ? 平均法 ( centroid method, average linkage) ? 測(cè)量差異的方法 ? Squared Euclidean distance歐幾里得距離 (個(gè)體差距平方和 ) ? Cityblock approach(個(gè)體差距絕對(duì)值總和 ) ? 謝比雪夫法:個(gè)體最大差距的距離 ? Minkowski: 乘冪距離法 ? 資料的型態(tài) ? 標(biāo)準(zhǔn)化 vs. 非標(biāo)準(zhǔn)化 分類的層次 ? 階層測(cè)量距離方法 ? Agglomerative hierarchical clustering ? 匯聚法:將所有物體歸入越來(lái)越大的類別中直到所有的物體屬於同一類 ? 當(dāng)物體前一個(gè)步驟歸入所屬的類別後即不得改變 ? Divisive hierarchical clustering ? 分裂法:將所有的物體從一個(gè)大類區(qū)分成兩類直到所有的物體都自成一類 ? 非階層測(cè)量距離方法 ? 階段性閾值:選擇一個(gè)種子 , 針對(duì)某一個(gè)距離標(biāo)準(zhǔn)來(lái)分類 ? 平行閾值:同時(shí)選擇多個(gè)種子 , 針對(duì)某一個(gè)距離標(biāo)準(zhǔn)來(lái)分類 資料標(biāo)準(zhǔn)化 ? 當(dāng)變項(xiàng)對(duì)於測(cè)量的尺度(單位)有相當(dāng)?shù)拿舾卸葧r(shí) , 應(yīng)採(cǎi)用標(biāo)準(zhǔn)化策略 ? 優(yōu)點(diǎn) ? 易於比較 ? 有一致的變動(dòng)性 ? 缺點(diǎn) ? 失去原有變項(xiàng)的變異特性 分析技術(shù) ? Squared Euclidean distance: (nonstandardized) (157144)2+(4348) 2=194 ? 缺點(diǎn):受單位的影響 啤酒 品牌 熱量 價(jià)格 B品牌 144 43 L品牌 157 48 分析技術(shù) ? Squared Euclidean distance: (standardized) (.)2+(()) 2=.307 ? 缺點(diǎn):失去測(cè)量變項(xiàng)的特質(zhì) 啤酒 品牌 熱量 價(jià)格 B品牌 Z=.38 Z= L品牌 Z=.81 Z= Outliers 024681012V1 V2 V3 V4 V5 V6大一小二李三邱S I R王老五趙六劉妻八八酒鬼石頭Raw Data and Standardized Scores ID BEERS CALORIES SODIUM ALCOHOL COST ZCALORIE ZSODIUM ZALCOHOL ZCOST1 Budw 144 15 .43 .38 .01 .34 2 Sch 151 19 .43 .61 .62 .61 3 Low 157 15 .48 .81 .01 .61 4 Kro 170 7 .73 5 Hei 152 11 .77 .65 .74 6 Old 145 23 .29 .42 .21 7 Augs 175 24 .40 8 Stro 149 27 .42 .55 .34 9 Mill 99 10 .43 10 Budw l 113
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1