freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第六章聚類分析-資料下載頁(yè)

2025-08-01 13:25本頁(yè)面
  

【正文】 確定類個(gè)數(shù)的常用方法有: T。 。 。 69 T ? 通過觀測(cè)樹形圖,給出一個(gè)你認(rèn)為合適的閾值 T,要求類與類之間的距離要大于 T,有些樣品可能會(huì)因此而歸不了類或只能自成一類。這種方法有較強(qiáng)的主觀性,這是它的不足之處。 70 ? 如果樣品只有兩個(gè)(或三個(gè))變量,則可通過觀測(cè)數(shù)據(jù)的散點(diǎn)圖(或旋轉(zhuǎn)圖)來(lái)主觀確定類的個(gè)數(shù) 。 ? 如果 變量個(gè)數(shù)超過三個(gè),則可對(duì)每一可能考慮的聚類結(jié)果,將所有樣品的前兩個(gè)(或三個(gè))費(fèi)希爾判別函數(shù)得分制作成散點(diǎn)圖(或旋轉(zhuǎn)圖),目測(cè)類之間是否分離得較好。該圖既能幫助我們?cè)u(píng)估聚類效果的好壞,也能幫助我們判斷所定的類數(shù)目是否恰當(dāng)。 71 72 圖 按圖 73 圖 按圖 五 類 的兩個(gè)判別函數(shù)得分的散點(diǎn)圖 ? ( 1) R2統(tǒng)計(jì)量。 ? ( 2)半偏 R2統(tǒng)計(jì)量。 ? ( 3)偽 F統(tǒng)計(jì)量。 ? ( 4)偽 t統(tǒng)計(jì)量。 74 167。 動(dòng)態(tài)聚類法 ? 在系統(tǒng)聚類法中,對(duì)于那些先前已被“錯(cuò)誤”分類的樣品不再提供重新分類的機(jī)會(huì),而動(dòng)態(tài)聚類法(或稱逐步聚類法)卻允許樣品從一個(gè)類移動(dòng)到另一個(gè)類中 。 ? 動(dòng)態(tài) 聚類法的計(jì)算量要比建立在距離矩陣基礎(chǔ)上的系統(tǒng)聚類法小得多。因此,使用動(dòng)態(tài)聚類法計(jì)算機(jī)所能承受的樣品數(shù)目 n要遠(yuǎn)遠(yuǎn)超過使用系統(tǒng)聚類法所能承受的 n。 75 ? 動(dòng)態(tài)聚類法的基本思想是,選擇一批凝聚點(diǎn)或給出一個(gè)初始的分類,讓樣品按某種原則向凝聚點(diǎn)凝聚,對(duì)凝聚點(diǎn)進(jìn)行不斷的修改或迭代,直至分類比較合理或迭代穩(wěn)定為止。類的個(gè)數(shù) k需先指定一個(gè) 。 ? 選擇 初始凝聚點(diǎn)(或給出初始分類)的一種簡(jiǎn)單方法是采用隨機(jī)抽選(或隨機(jī)分割)樣品的方法,可以要求凝聚點(diǎn)之間至少應(yīng)間隔某個(gè)距離值 。 ? 動(dòng)態(tài) 聚類法只能用于對(duì)樣品的聚類,而不能用于對(duì)變量的聚類。 ? 動(dòng)態(tài)聚類法有許多種方法,在這一節(jié)中,我們將討論一種比較流行的動(dòng)態(tài)聚類法 —— k均值法 。它是由麥奎因(MacQueen, 1967)提出并命名的一種算法。 76 k均值法的基本步驟 ? (1)選擇 k個(gè)樣品作為初始凝聚點(diǎn),或者將所有樣品分成 k個(gè)初始類,然后將這 k個(gè)類的重心(均值)作為初始凝聚點(diǎn)。 ? (2)對(duì)除凝聚點(diǎn)之外的所有樣品逐個(gè)歸類,將每個(gè)樣品歸入凝聚點(diǎn)離它最近的那個(gè)類(通常采用歐氏距離),該類的凝聚點(diǎn)更新為這一類目前的均值,直至所有樣品都?xì)w了類。 ? (3)重復(fù)步驟 (2),直至所有的樣品都不能再分配為止。 77 ? 最終的聚類結(jié)果在一定程度上依賴于初始凝聚點(diǎn)或初始分類的選擇。經(jīng)驗(yàn)表明,聚類過程中的絕大多數(shù)重要變化均發(fā)生在第一次再分配中。 ? 例 對(duì)例 k均值法聚類,指定 k=2,具體步驟如下: ? (1) 隨意將這些樣品分成 兩類,則這兩個(gè)初始類的均值分別是 5和 。 ? (2)計(jì)算 1到兩個(gè)類 (均值 )的歐氏距離 ? ? ? ?( 0 ) ( 0 )121 , 6 , 8 2 , 1 1GG?? 和162? ?? ?( 0 )1( 0 )21 , 1 5 4111 , 1 6 522dGdG? ? ?? ? ?78 1不用重新分配,計(jì)算 6到兩個(gè)類的距離 故 6應(yīng)重新分配到 中,修正后的兩個(gè)類為 ,新的類均值分別為 。計(jì)算 ? ?? ?( 0 )1( 0 )26 , 6 5 1116 , 6 622dGdG? ? ?? ? ?(0)2G? ?( 1 )2 2 , 6 , 11G ?和 114623和? ?(1 )1 1, 8G ?? ?? ?( 1 )1( 1 )2118 , 8 4 322128 , 8 6 133dGdG? ? ?? ? ?79 結(jié)果 8重新分配到 中,兩個(gè)新類為 , , 其類均值分別為 1和 。再計(jì)算 重新分配 2到 中,兩個(gè)新類為 ,其類均值分別為 。 ? (3)再次計(jì)算每個(gè)樣品到類均值的距離,結(jié)果列于表。 ? 最終得到的兩個(gè)類為 {1,2}和 {6,8,11}。 (1)2G ? ?( 2 )1 1G ?364? ?? ?( 2 )1( 2 )22 , 2 1 1332 , 2 6 444dGdG? ? ?? ? ?(2)1G? ?( 2 )2 2 , 6 , 8 , 1 1G ?? ?( 3 )1 1 ,2G ? ,? ?( 3 )2 6 , 8 , 1 1G ? 111823和80 表 各樣品到類均值的距離 81 ? 例 對(duì)例 k均值法進(jìn)行聚類,聚類前對(duì)各變量作標(biāo)準(zhǔn)化變換,聚類結(jié)果如下: 第 Ⅰ 類:北京、上海和浙江。 第 Ⅱ 類:廣東。 第 Ⅲ 類:天津、江蘇、福建、山東、湖南、廣西、 重慶、四川和云南。 第 Ⅳ 類:河北、山西、內(nèi)蒙古、遼寧、吉林、黑龍 江、安徽、江西、河南、湖北、海南、貴 州、陜西、甘肅、青海、寧夏和新疆。 第 Ⅴ 類:西藏。 82 ? 由于 k均值法對(duì)凝聚點(diǎn)的初始選擇有一定敏感性,故再試一下其他初始的凝聚點(diǎn)也許是個(gè)不錯(cuò)的想法。如果不同初始凝聚點(diǎn)的選擇產(chǎn)生明顯不同的最終聚類結(jié)果,或者迭代的收斂是極緩慢的,那么可能表明沒有自然的類可以形成。 ? k均值法有時(shí)也可用來(lái)改進(jìn)系統(tǒng)聚類的結(jié)果,例如,先用類平均法聚類,然后將其各類的重心作為 k均值法的初始凝聚點(diǎn)重新聚類,這可使得系統(tǒng)聚類時(shí)錯(cuò)分的樣品能有機(jī)會(huì)獲得重新的分類。不過, k均值法能否有效地改善系統(tǒng)聚類,我們不能一概而論,還應(yīng)視聚類的最終結(jié)果而定。 83
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1