【正文】
b e r o f c l u s t e r s320:Case 20 24:Case 24 23:Case 23 25:Case 25 17:Case 17 21:Case 21 13:Case 13 10:Case 10 4:Case 4 3:Case 3 12:Case 12 16:Case 16 11:Case 11 9:Case 9 8:Case 8 6:Case 6 5:Case 5 2:Case 2 15:Case 15 18:Case 18 7:Case 7 14:Case 14 22:Case 22 19:Case 19 1:Case 1C a s e? SPSS 軟件實現(xiàn) 對樣本進行因子聚類 因子提取方法:主成分法、累積方差貢獻率 85% 、方差最大正交因子旋轉(zhuǎn) 數(shù)據(jù)標(biāo)準(zhǔn)化方法:離差標(biāo)準(zhǔn)化( Z score法) 點與點間距離的計算:歐氏距離 類與類間距離的計算: “Ward39。s method”離差平方和法 167。 系統(tǒng)聚類法 ? SPSS 軟件實現(xiàn) 對樣本進行聚類 167。 系統(tǒng)聚類法 V e r t i c a l I c i c l eX X X X X X X X X X XX X X X X X X X X XX X X X X X X X XX X X X X X X XX X X X X X XN u m b e r o f c l u s t e r s12345速效K 速效P 全P 全N 有效N 有機質(zhì)C a s e? SPSS 軟件實現(xiàn) 對樣本進行聚類 數(shù)據(jù)標(biāo)準(zhǔn)化方法:離差標(biāo)準(zhǔn)化( Z score法) 點與點間距離的計算:歐氏距離 類與類間距離的計算: “Ward39。 系統(tǒng)聚類法 Stage 列出步驟序號, Cluster Combined 欄中列出了合 并的兩個類的序號, Next stage欄是合并的新類再次出 現(xiàn)的步驟序號。 系統(tǒng)聚類法 C a s e P r oc e s s i ng S um m a r ya25 1 0 0 . 0 % 0 . 0 % 25 1 0 0 . 0 %N P e r c e n t N P e r c e n t N P e r c e n tV a l i d M i s s i n g T o t a lC a s e s C o r r e l a t i o n b e t w e e n V e c t o r s o f V a l u e s u s e da . ? SPSS 軟件實現(xiàn) 結(jié)果分析-相關(guān)系數(shù)矩陣 167。 系統(tǒng)聚類法 對原始數(shù)據(jù)進行離差標(biāo)準(zhǔn)化處理; 采用相關(guān)系數(shù)表征變量之間的相似程度; 采用離差平方和最小的方法計算類與類之間的距離。 系統(tǒng)聚類法 ? SPSS 軟件實現(xiàn) 167。 系統(tǒng)聚類 ? 類的個數(shù)的確定 根據(jù)譜系圖確定分類個數(shù)的準(zhǔn)則: ? 各類間的距離必須較大; ? 類中包含的元素不要太多; ? 類的個數(shù)必須符合實際應(yīng)用; ? 如果采用幾種不同的聚類方 法處理,則在各種聚類圖中應(yīng) 該發(fā)現(xiàn)相同的類。 167。 ⑥“ Median clustering”中心法,當(dāng)兩類中心距離最小時,這兩類可以合并為一類。 ④“ Furthest neighbor”最長距離法,當(dāng)兩類最遠樣本之間的距離最小時,這兩類可以合并為一類。 ②“ Within groups linkage”類內(nèi)平均法,當(dāng)合并后所有樣本的距離的平均值最小時,這兩類可以合并為一類。 167。 選擇距離最小的兩類將其合并成一新類,再按類間距離的定義 計算新類與其它類的距離,再行合并,直至所有樣本都聚為一類 為止。 統(tǒng)計量 ? ?( , ) m in ,j k p qD p q d j G k G? ? ?? ?( , ) m a x ,jk p qD p q d j G k G? ? ?? 類與類之間的距離 ? 重心距離 設(shè)類 Gp與類 Gq中兩個重心之間的距離為 Gp與類 Gq之間的距離 ? 類平均距離 設(shè)類 Gp與類 Gq中任意兩個元素之間距離的平均值為 Gp與類Gq之間的距離 167。? 統(tǒng)計量-距離 167。 統(tǒng)計量 1( ) ( ) 39。 統(tǒng)計量 122( 2)ij ia iaad x y?????????( ) m a xij ia iad x y? ? ?歐氏距離是應(yīng)用最廣泛的 一種距離系數(shù)。 統(tǒng)計量 ?統(tǒng)計量-距離 ? 明氏距離( Minkowski distance) ? 第 i個樣本與第 j個樣本間的明氏距離為: ? 絕對值距離( absolute value distance) q= 1時 167。 如果每一類都由一個點組成,那么點間的距離就 是類間距離。 統(tǒng)計量 點與點之間的距離: 把每一個樣本視為 p維空間中的一個 點,則兩個樣本之間的距離可以定義為 p維空間中兩個點之 間的距離。 距離系數(shù)的種類很多,但都有一個共同的特征,即當(dāng)兩 個向量完全相同時取最小值,完全不同時取最大值。 統(tǒng)計量 ijxx? 統(tǒng)計量-相似系數(shù) 167。 可以根據(jù)相似系數(shù)矩陣對樣本(指標(biāo))進行分類。? 統(tǒng)計量-相似系數(shù) ? 相關(guān)系數(shù) ( Correlation coefficient) ijr167。 統(tǒng)計量 為了消除量綱的影響,對原始數(shù)據(jù)進行離差標(biāo)準(zhǔn)化處理,經(jīng)過 離差標(biāo)準(zhǔn)化處理后的內(nèi)積正好是兩個向量的相關(guān)系數(shù) 。 12211 0 1 piji j i jppijxxCo s Co sxx????????????? ? ???? 1 1 0 0 ijijijiji j Co sCo si j Co sCo s?????????ijijijij當(dāng) 時 , , 說 明 兩 個 指 標(biāo) ( 樣 品 ) x 與 x 完 全 相 似 ;當(dāng) , 說 明 兩 個 指 標(biāo) ( 樣 品 ) x 與 x 相 似 密 切 ;當(dāng) 與 正 交 時 , , 說 明 兩 個 指 標(biāo) ( 樣 品