freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第六章聚類(lèi)分析-文庫(kù)吧資料

2025-08-07 13:25本頁(yè)面
  

【正文】 最短距離法 56 圖 重心法 57 圖 離差平方和法 58 ? 從這三個(gè)樹(shù)形圖來(lái)看,只有 Ward方法較好地符合了我們的實(shí)際聚類(lèi)要求,它將 31個(gè)地區(qū)分為以下三類(lèi): ? 第 Ⅰ 類(lèi) :北京、浙江、上海和廣東。這八個(gè)變量是 x1:食品 x5:交通和通訊 x2:衣著 x6:娛樂(lè)教育文化服務(wù) x3:家庭設(shè)備用品及服務(wù) x7:居住 x4:醫(yī)療保健 x8:雜項(xiàng)商品和服務(wù) ? 分別用最短距離法、重心法和 Ward方法對(duì)各地區(qū)作聚類(lèi)分析。本章介紹的其他聚類(lèi)方法都將只能用于樣品的聚類(lèi)。 2K L M K LD W W W? ? ?2KLD? ? ? ?2 KLK L K L K LMnnDn?? ? ?x x x x50 1 =1 1 2K L K L K L KKLM K L L K Mn n n n n n nnnn n n n n n? ? ??? , 當(dāng) 時(shí) , 51 圖 離差平方和法與重心法的聚類(lèi)比較 ? 離差平方和法的平方距離遞推公式為 ? 對(duì)例 。 kx49 ? 定義 GK和 GL之間的平方距離為 ? 也可表達(dá)為 ? ? 離差平方和法使得兩個(gè)大的類(lèi)傾向于有較大的距離,因而不易合并;相反,兩個(gè)小的類(lèi)卻因傾向于有較小的距離而易于合并。 ? 設(shè)類(lèi) GK和 GL合并成新類(lèi) GM,則 GK, GL和 GM的離差平方和分別是 對(duì)固定的 類(lèi)內(nèi) 樣品 數(shù), 它們反映了各自類(lèi)內(nèi)樣品的分散程度。 46 2 2 2 22K L K LM J K J L J K LM M Mn n n nD D D Dn n n? ? ?K K L LMMnnn?? xxx*五、中間距離法 ? 設(shè)某一步將 GK和 GL合并為 GM,對(duì)于任一類(lèi) GJ,考慮由 DKJ,DLJ和 DKL為邊長(zhǎng)組成的三角形,取 DKL邊的中線作為 DMJ。設(shè) GK和 GL的重心分別為 ,則 GK與GL之間的平方距離為 KLxx和? ? ? ?22 KLK L K L K LDd ?? ? ? ?xx x x x x45 圖 重心法 ? 合并 GK和 GL之后的新類(lèi) GM的重心是 其中 nM=nK+nL為 GM的樣品個(gè)數(shù) 。一開(kāi)始將 D(0)的每個(gè)元素都平方,并記作 。 一種定義方法是把類(lèi)與類(lèi)之間的距離定義為所有樣品對(duì)之間的平均距離,即定義 GK和 GL之間的距離為 ,1KLK L i ji G j GKLDdnn??? ?39 圖 類(lèi)平均法 ? 遞推公式: , , ,11M J K J L JM J ij ij iji G j G i G j G i G j GM J M JKLK J L JMMD d d dn n n nnnDDnn? ? ? ? ? ???? ? ???????? ? ?40 ? 另一種定義方法是定義類(lèi)與類(lèi)之間的平方距離為樣品對(duì)之間平方距離的平均值,即 ? 它的遞推公式 為 ? 類(lèi)平均法較好地利用了所有樣品之間的信息,在很多情況下它被認(rèn)為是一種比較好的系統(tǒng)聚類(lèi)法。 35 圖 最長(zhǎng)距離法樹(shù)形圖 異常值的影響 ? 最長(zhǎng)距離法容易被異常值嚴(yán)重地扭曲。 G1 G2 G3 G4 G5 G1 0 G2 1 0 G3 5 4 0 G4 7 6 2 0 G5 10 9 5 3 0 表 D(0) 30 其中 G6= G1∪ G2 其中 G7= G3∪ G4 G6 G3 G4 G5 G6 0 G3 4 0 G4 6 2 0 G5 9 5 3 0 表 D(1) 表 D(2) G6 G7 G5 G6 0 G7 4 0 G5 9 3 0 31 其中 G6= G1∪ G2 表 D(3) G6 G8 G6 0 G8 4 0 32 圖 最短距離法樹(shù)形圖 二、最長(zhǎng)距離法 ? 類(lèi)與類(lèi)之間的距離定義為兩類(lèi)最遠(yuǎn)樣品間的距離,即 ,m a xKLK L iji G j GDd???33 圖 最長(zhǎng)距離法: DKL=d15 ? 最長(zhǎng)距離法與最短距離法的并類(lèi)步驟完全相同,只是類(lèi)間距離的遞推公式有所不同。 29 ? 例 設(shè)有五個(gè)樣品,每個(gè)只測(cè)量了一個(gè)指標(biāo),分別是 1, 2, 6, 8, 11,試用最短距離法將它們分類(lèi)。最短距離法最容易產(chǎn)生結(jié) ,且有一種挑選長(zhǎng)鏈狀聚類(lèi)的傾向,稱(chēng)為 鏈接 ( chaining)傾向 。 ? (4)對(duì) D(1)重復(fù)上述對(duì) D(0)的兩步得 D(2) ,如此下去直至所有元素合并成一類(lèi)為止。 ? (2)選擇 D(0)中的最小元素,設(shè)為 DKL,則將 GK和 GL合并成一個(gè)新類(lèi),記為 GM,即 GM= GK∪ GL。 23 167。如此下去,直至所有 n個(gè)樣品各自為一類(lèi)或采用某種停止規(guī)則 。 21 一開(kāi)始每個(gè)樣品各自作為一類(lèi) 22 ? 分割系統(tǒng)法 的 聚類(lèi)步驟與聚集系統(tǒng)法正相反。 系統(tǒng)聚類(lèi)法 ? 系統(tǒng)聚類(lèi)法 (或 層次聚類(lèi)法 , hierarchical clustering method)是通過(guò)一系列相繼的合并或相繼的分割來(lái)進(jìn)行的,分為聚集的( agglomerative)和分割的(divisive)兩種,適用于樣品數(shù)目 n不 是很 大 的情形。高爾( Gower)證明,當(dāng)相似系數(shù)矩陣 (cij)為非負(fù)定時(shí),如令 則 dij滿足距離定義的三個(gè)條件。 ? 由距離來(lái)構(gòu)造相似系數(shù)總是可能的,如令 這里 dij為第 i個(gè)樣品與第 j個(gè)樣品的距離,顯然 cij滿足定
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1