freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多元統(tǒng)計(jì)分析聚類分析講義(參考版)

2024-09-04 16:58本頁面
  

【正文】 【作業(yè)】 T r e e D ia g r a m f o r 3 0 C a s e sW a r d ` s m e t h o dE u c lid e a n d is t a n c e s新 疆重 慶云 南廣 西寧 夏青 海海 南甘 肅陜 西貴 州江 西吉 林內(nèi)蒙古山 西河 南四 川湖 南安 徽黑龍江湖 北遼 寧河 北廣 東浙 江山 東江 蘇福 建天 津上 海北 京0500010000150002020025000300003500040000Linkage Distance圖 25 2020年系統(tǒng)聚類的結(jié)果 。 案例 2:根據(jù)信息基礎(chǔ)設(shè)施的發(fā)展?fàn)顩r,對(duì)世界 20個(gè)國家和地區(qū)進(jìn)行分類 二、 課題研究中的 案例 案例 3: 區(qū)域產(chǎn)業(yè)結(jié)構(gòu)與區(qū)域消費(fèi)結(jié)構(gòu)關(guān)聯(lián)問題研究 在實(shí)際應(yīng)用中,離差平方和法應(yīng)用比較廣泛,分類效果較好,但要求樣本之間的距離必須為歐氏距離。 一、 教材中的案例 案例 1:為了更深入地了解我國人口的文化程度狀況,現(xiàn)利用 1990 年全國人口普查數(shù)據(jù)對(duì)全國 30 個(gè)省、直轄市、自治區(qū)進(jìn)行聚類分析。 第 頁 11 167。 第 頁 10 STEP03:由(1)D出發(fā),重復(fù)步驟 2得到對(duì)稱矩陣(2)D,從(2)D出發(fā)得到(2)D,依此類推,直到 n 個(gè)樣品(變量)聚為一個(gè)大類為止。 ② 也可將相似系數(shù)轉(zhuǎn)化為距離,以維持距離越小,關(guān)系越密切的含義。在 (0)D 中劃去 pG 與 qG 所對(duì)應(yīng)的兩行和兩列,并加入由新類 ? ?,r p qG G G?與剩下的未聚合的各類之間的距離所組成的一行和一列,得到一個(gè)新的距離矩陣 (1)D , (1)D 是一個(gè) 1n? 階對(duì)稱陣(若在 (0)D 中最小元素不唯一,對(duì)其它最小元素也作如上相同處理,每合并兩類,矩陣 (0)D 則降低一階)。記 (0)DD。 有了樣品之間的距離(或變量之間的相似系數(shù))以及類與類之間的距離定義后,便可以進(jìn)行譜系聚類,其基本步驟歸納如下: STEP01: n 個(gè)樣品(變量)一開始就作為 n 個(gè)類,計(jì)算兩兩之間的距離(或相似系數(shù))構(gòu)成一個(gè)對(duì)稱矩陣 ? ?ij nnDd??,其對(duì)角線上的元素全為零(對(duì)相似系數(shù)矩陣,其對(duì)角線上元素全為 1)。但這些公式在 1967 年由蘭斯( Lance)和威廉姆斯( Williams)統(tǒng)一起來。它定義 類與類之間的相似系數(shù)(最小、最大、平均),并且按照最大的相似系數(shù)進(jìn)行并類 ② 。 結(jié)論: ( 1) 各種聚類方法具有共同步驟 首先定義類與類之間的距離;其次找到類與新類之間距離的遞推公式; ( 2)以上類與類之間的距離,不但適用于對(duì)樣品的聚類問題,而且也適合于對(duì)變量的聚類問題,這只要將 ijd 用變量間的相似系數(shù) ijC 代替,相應(yīng)的距離可稱之為類與類之間的相似系數(shù)。其含義為:把兩類合并增加的離差平方和,當(dāng)成是兩類之間距離的平方。 ( 2)基本做法 不妨設(shè)將 n 個(gè)樣品分成了 k 類: 12, , , kG G G ,用 ()tiX 表示 tG 中的第 i 個(gè)樣品(這里 ()tiX 是 p 維向量),tn 表示 tG 中的樣品個(gè)數(shù), ()tX 是 tG 的重心,則 tG 中樣品的離差平方和為 第 頁 9 ? ? ? ?1 ( ) ( ) ( ) ( )1n t t t tt i iiS X X X X? ?? ? ?? k 個(gè)類的類內(nèi)離差平方和為 ? ? ? ?1 ( ) ( ) ( ) ( )1 1 1nkk t t t tt i it t iS S X X X X? ? ? ?? ? ? ?? ? ? 首先將 n 個(gè)樣品看成各自一類,然后每次縮小一類,每縮小一類,離差平方和就要增大,選擇使得離差平方和增加最小的二類進(jìn)行合并,直到所有的樣品歸為一類 ① 。 8.離差平方和法 該方法是 Ward提出,所以又稱 Ward方法。 ( 2)基本步驟 基本步驟完全等同于最短距離法。 7.可變距離法 ( 1) 由 可變類平均距離法可以得到一個(gè)特例,即令 12pqrrnn??,得到: ? ?2 2 2 21 2kr kp kq pqD D D D? ??? ? ? 其中 ? 是可變的,且 1?? 。 設(shè) pG 與 qG 合并成新類 rG ,則任一類 kG 與 rG 之間的距離為 2 ( 1 ) ( , ) ( 1 ) ( , ) ( , ) ( 1 ) ( 1 )p q p qk r k p k q p q k p k q p qr r r rn n n nD D G G D G G D G G D D Dn n n n? ? ? ? ? ?? ? ? ? ? ? ? ? ? ? 其中 ? 是可變的,且 1?? ( 2)基本步驟 基本步驟完全等同于最短距離法。 ( 1)定義距離:其距離的定義仍為221i p j qpq ijx G x GpqDdnn ??? ??。 ( 3)例 子: P80續(xù)例 1。 5.類平均距離法 ( 1)重心距離法雖然具有一定的代表性,但并未充分利用各樣品點(diǎn)所包括的距離信息,為此給出類平均距離法。 Gp Gq Gk Gr Dkq Dkp Dkr 第 頁 8 ( 2)基本步驟 基本步驟完全等同于最短距離法。 ③ 每類的重心就是該類(組)樣本點(diǎn)的均值。 ① 在實(shí)際問題中,一般事先給定分類的數(shù)目,或給定閾值 T,要求 類與類之間的距離小于 T。則 ? ?1r p p q qrx n x n xn??。它將兩類之間的距離定義兩類重心 ③ 之間的距 離。 ( 3)例子: P76續(xù)例 1。 如果 r p qG G G? ,則任一類 kG 與新類 rG 的距離公式為: 2 2 2 21122kr kp kq pqD D D D?? ? ? 1 04 ?? ? ?② NOTE:① 當(dāng) 14???時(shí), krD 為三角形的中線; ② 如果用最短距離法,則 kr kpDD? ;如果用最長距離法,則 kr kqDD? 。 ( 3)例子: P74續(xù) 例 1。 ( 2)基本步驟 基本步驟完全等同于最短距離法。 ( 3)例子: P71例 1。 第 頁 7 STEP04:對(duì) (1)D ,重復(fù)上述對(duì) (0)D 的 STEP02 和 STEP03 兩步得 (2)D 。 213 1 3 21 2 300( 0 ) 00n n ndD d dd d
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1