【正文】
)之間的距離或相似系數 : 歐氏距離 : Euclidean 2()iiixy??平方歐氏距離 : Squared Euclidean 2()iii xy??Block(絕對距離 ): Si|xiyi| Chebychev: Maxi|xiyi| Minkowski: 1() qqiiixy????????夾角余弦 (相似系數 1) : cosine 22( 1 ) c osiiix y x yiiiixyCxy??????Pearson correlation (相似系數 2): 22( ) ( )( 2)( ) ( )iiix y x yiiiix x y yCrx x y y?????????類與類之間各種距離簡介 類 Gp與類 Gq之間的距離 Dpq, (d(xi,xj)表示點 xi∈ Gp和 xj ∈ Gq之間的距離 ) m i n ( , )p q i jD d x x?最短距離法 : 最長距離法 : m a x ( , )p q i jD d x x?重心法 : m i n ( , )p q p qD d x x?類平均法 : 121 ( , )i p j qp q i jx G x GD d x xnn??? ??離差平方和 : (Wald) 121 2 1 2 1 2( ) 39。( ) , ( ) 39。( ) ,( ) 39。( )i p j qk p qi p i p j q j qx G x Gk i p qx G GD x x x x D x x x xD x x x x D D D D??????? ? ? ? ? ?? ? ? ? ? ? ????Matlab中有關聚類分析的函數 1) pdist函數 該函數用來計算 X矩陣中配對樣本的歐氏距離。其調用的格式為 Y=pdist(X).Y為長度 的向量,包含距離信息。這些信息按 照 (1,2),(1,3),…,(1,m),(2,3),(2,4),…,(2,m),…,(m 1,m)順序排列。 ( 1) / 2mm??Y=pdist(X,’metric’),其中’ metric’可以是’ Euclid’,’SEuclid’,’Mahal’. 2) Linkage函數 該函數用來創(chuàng)建系統聚類樹,其調用格式為 Z=linkage(Y),使用最短距離法創(chuàng)建一個系統聚類樹。 Z=linkage(Y,’method’),用’ method’指定的方法計算系統聚類樹。其中 ‘ method’可以是‘ single’即最短距離法,‘ plete’即最長距離法等。 3) dendrogram函數 該函數用于輸出冰柱圖,其調用格式為 H=dendrogram(Z,p)生成只有頂部 p個節(jié)點的冰柱圖。設置 p= 0,顯示所有 節(jié)點。 [H,T]=dendrogram(Z,p)返回一個大小為 m的向量 T,其中包含了原始數據 集合中每一個對象的聚類個數。使用 find(T==k)函數可以找到有哪些對象 包含在冰柱圖的葉節(jié)點 k中。 實例 對土壤數據進行樣本聚類 a=xlsread(39。e:\39。) a1=a(:,[2:6]) y=pdist(a1,‘euclid’) %計算樣本點之間的距離 z=linkage(y,‘single’) %計算類與類之間的距離 [H,T]=dendrogram(z,0) %給出聚類冰柱圖 T=cluster(z,3) %將樣本點分為 3類 find(T==3) %查找第 3類包含的樣本點 2 6 19 7 18 1 3 5 12 20 16 14 10 11 13 15 17 4 8 91234567891011