freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多元統(tǒng)計分析聚類分析講義-文庫吧資料

2024-09-08 16:58本頁面
  

【正文】 d????????? STEP02:選擇 (0)D 中非對角線最小元素 ① ,不防設(shè)為 pq pqDd? ,于是將 pG 與 qG 類合并,記為 1n p qG G G? ? STEP03:計算新類 1nG? 與其它類 ? ?,kG k l m? 的距離 ? ? ? ? ? ?? ?1 , 1m i n | , m i n m i n | , , m i n | ,n k i j i n j k i j i p j k i j i q j kD d x G x G d x G x G d x G x G??? ? ? ? ? ? ? ? ? ?m in ( , ) , ( , )p k q kD G G D G G? 將 (0)D 中的第 ,pq行及 ,pq列用上面公式并成一個新行新列,得到的矩陣記為 (1)D 。 NOTE:類與類之間的最短距離有如下的遞推公式,設(shè) rG 為由 pG 與 qG 合并所得,則 rG 與其它類( , )kG k pq? 的最短距離為 ? ? ? ? ? ?? ?( , ) m i n | , m i n m i n | , , m i n | ,r k r k i j i r j k i j i p j k i j i q j kD G G D d x G x G d x G x G d x G x G? ? ? ? ? ? ? ? ? ? ?m in ( , ) , ( , )p k q kD G G D G G? ( 2)基本步驟 STEP01:定義樣品之間的距離,計算樣品兩兩之間的距離,得到樣本距離矩陣 (0)D 。 下面給出 八 種最常用的類與類之間距離的定義。本節(jié)中,我們首先引進八種類與類之間的距離,然后再詳細介紹譜系聚類法。 在譜系聚類法的合并過程中要涉及到兩個類之間的距離(或相似系數(shù))問題。分類單位越小它所包含的植物種類就越少,植物間的共同特征就越多。譜系聚類法是根據(jù)古老的植物分類學的思想對研究對象進行分類的一種方法。 3 譜系聚類法 (系統(tǒng)聚類) 譜系聚類法是目前應用較為廣泛的一種聚類方法。 3.同號率 ( 3 ) , 1 , 2 , ,ij nnC i j p?????? 其中, n? 為指標 iX 和jX之間相應各分量取同號的個數(shù); n? 為指標 iX 和jX之間相應各分量取異號的 個數(shù) 。 ① 由印度統(tǒng)計學家馬哈拉諾比斯于 1936 年引入。因此,用任意兩個變量的 n個觀測值對其相關(guān)系數(shù)的估計可作為兩個變量關(guān)聯(lián)性的一種度量。設(shè) ? ?12, , ,i i nix x x ? 表示對變量 ( 1, , )iX i p? 的 n 個觀測值,常用的相似系數(shù)有: 1.夾角余弦(向量內(nèi)積) 12211( 1 ) c o s , 1 , 2 , ,nk i k jkij ij nnk i k jkkxxC i j pxx? ???? ? ???? NOTE:①若將變量 iX 的 n 個觀測值 ? ?12, , ,i i i niX x x x ?? 和變量 jX 的n 個觀測值 ? ?12, , ,j j njx x x ? 看成 n 維空間中的兩個向量, (1)ijC 正好是這兩個向量夾角的余弦,這個統(tǒng)計量在圖像識別中非常有用; ② 當 (1) 1ijC ? 時,說明完全相似 ; 當 (1) 0ijC ? 時,說明完全不一樣。 定義: 一般地,稱 ijC 為變量 iX 和 jX 之間的相關(guān)系數(shù),如果對一切的 1,i j p??滿足: ① 1ijC?; ② 1iiC? ; ③ ij jiCC? 。距離的定義有很大的靈活性,有時可根據(jù)實際問題定義新的距離。 4. 蘭氏( LanceWilliams)距離 11() p ik jkijk ik jkxxdL p x x??? ?? NOTE:此距離僅適用于一切 0ijx?的情況,該距離有助于克服各指標之間量綱的影響,但沒有考慮指標之間的相關(guān)性。 3. Mahalanobis距離 ① ? ? ? ?21()ij i j i jd M x x x x??? ? ? ? 其中, ? 為 p 個指標的協(xié)方差矩陣。 ③ 可以利用不等式的縮放技術(shù)進行證明。 2. 方差加權(quán)距離 ① 當變量為定性變量(如性別,職業(yè),等級)時,也可定義樣品間的“距離”和變量間的“相似系數(shù)”,在此不作深入討論。 1. Minkowski距離 1/1( ) 0qp qij ik jkkd q x x q???? ? ?????? ( 1)當 1q? 時,1(1)pij ik jkkd x x????為絕對距離; ( 2)當 2q? 時, 1 / 221( 2 )pij ik jkkd x x??????????為 歐氏 距離; ( 3)當 q?? 時,1( ) m axij ik jkkpd x x??? ? ?為 Chebishov距離 ③ 。設(shè)每個樣品 ix 有 p個指標,它們的觀測值可表示為 12( , , , )i i i pix x x x ?? ( 1,2, , )in? 這時,每個樣品 ix 可看成 p維空間中的一個點, n個樣品就組成 p組空間中的 n 個點,我們很自然地用各點之間的距離來衡量各樣品之間的靠近程度。下面分別介紹幾種常用的距離和相似系數(shù) ① 。如在服裝設(shè)計中,往往要測量很多的指標(變量),如身高,上體長,臂長,肩寬,胸圍,腰圍等,有時需要對這些指標分類,以顯示人體各部分的不同特點,以便于服裝設(shè)計。如某班有 n個學生,根據(jù)每個學生的期末各科考試成績將該班學生分類(如分為優(yōu),良,中,差四類等)。 第 頁 3 167。 本章將重點介紹一些常見的分類統(tǒng)計量和目前使用較為廣泛的譜系聚類方法。無論聚類統(tǒng)計量還是聚類的方法,都還未 最終定型。聚類分析一般上尋求客觀分類的方法,事先對總體到底有幾種類型無所知曉,而判別分析則是在總體類型劃分已知,在各總體分布或來自各總體訓練樣本的基礎(chǔ)上,對當前的新樣品用統(tǒng)計的方法判定它們屬于哪個總體。可以看到,這種系統(tǒng)歸類過程,顯然與計算類與類之間的歸類指標是什么有關(guān)系,同時也與歸類的方法有關(guān)系。 一開始將要歸類的 n 個變量(或個體)各自看成一類,然后按事先規(guī)定好的方法計算各類之間的歸類指標(如某種距離或相似系數(shù)),根據(jù)指 標值大小衡量兩兩之間關(guān)系的密切程度,將關(guān)系最密切的兩類并第 頁 2 成一類,其余不變,即得 1n? 類;又按事先規(guī)定的方法重新計算各類之間的歸類指標(仍為某種距離或相似系數(shù)),又將關(guān)系密切的兩類并成一類,其余不變,即得 2n? 類;如此進行下去,每次歸類都減少一類,直到最后, n 個變量(或個體)都歸成一類為止。而度量相似或疏遠程度常有兩種指標:距離和相似系數(shù)。這兩種聚類在數(shù)學上是對稱的,沒有什么不同。本章要介紹的分類的方法稱為 聚類分
點擊復制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1