freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

聚類分析ppt課件(參考版)

2025-01-20 19:20本頁(yè)面
  

【正文】 希望利用該數(shù)據(jù)對(duì) 15個(gè)地區(qū)進(jìn)行分類研究 。 對(duì)各地區(qū)實(shí)現(xiàn)小康生活質(zhì)量的狀況進(jìn)行綜合評(píng)價(jià) , 對(duì)各級(jí)政府部門具有重要意義 。然后依次考察每個(gè)樣品,若某樣品與已選定的凝聚點(diǎn)的距 離均大于 d,該樣品作為新的凝聚點(diǎn),否則考察下一個(gè)樣品。這方法一般不提倡使用。 69 69 (5) 隨機(jī)地選擇,如果對(duì)樣品的性質(zhì)毫無(wú)所知,可采用隨機(jī)數(shù)表來(lái)選擇,打算分幾類就選幾個(gè)凝聚點(diǎn)。然后選出次大密度的樣品點(diǎn),若它與第一個(gè)凝 聚點(diǎn)的距離大于 D,則將其作為第二個(gè)凝聚點(diǎn);否則舍去這點(diǎn),再 選密度次于它的樣品。以某個(gè)正數(shù) d為半徑,以每個(gè)樣品為球心,落在這個(gè)球內(nèi)的樣品數(shù) (不包括作為球心的樣品 )就叫做這個(gè)樣品的密度。 (2) 將數(shù)據(jù)人為地分為 A類,計(jì)算每一類的重心,就將這些 重心作為凝聚點(diǎn) 。凝聚點(diǎn)的 選擇直接決定初始分類,對(duì)分類結(jié)果也有很大的影響,由于凝聚點(diǎn) 的不同選擇,其最終分類結(jié)果也將出現(xiàn)不同。 )1(1x )1(2xkx ),(),()1(2)1(1 xxdxxd kk 和),(),( )1(2)1(1 xxdxxd kk ? kx 分別計(jì)算兩個(gè)類的重心 , 則得 和 , 以其為新的聚核 , 對(duì)空間中的點(diǎn)進(jìn)行重新分類 , 得到新分類 。 對(duì)于任何點(diǎn) ,分別計(jì)算 若 ,則將 劃為第一類,否則劃給第二類。例如我們要把圖中的點(diǎn)分成兩類。 動(dòng)態(tài)聚類使用于 大型數(shù)據(jù) 。 這時(shí) , 采用系統(tǒng)聚類法就很困難 , 而動(dòng)態(tài)聚類法就會(huì)顯得方便 , 適用 。 然而當(dāng)樣本點(diǎn)數(shù)量十分龐大時(shí) , 則是一件非常繁重的工作 , 且聚類的計(jì)算速度也比較慢 。 通常需要考慮的問(wèn)題 62 167。這時(shí)主要涉及兩個(gè)問(wèn)題: ( 1)選擇聚類的方法 ( 2)確定形成的類數(shù) 通常需要考慮的問(wèn)題 61 61 聚類結(jié)果的解釋和證實(shí) 對(duì)聚類結(jié)果進(jìn)行解釋是希望對(duì)各個(gè)類的特征進(jìn)行準(zhǔn)確的描述,給每類起一個(gè)合適的名稱。 58 single最短距離法 plete—最長(zhǎng)距離法 median中間距離法 average類平均法 centroid重心法 ward離差平方和法 58 常用的工具軟件中的聚類距離選擇的參數(shù)設(shè)置 59 59 選擇變量 ( 1)和聚類分析的目的密切相關(guān) ( 2)反映要分類變量的特征 ( 3)在不同研究對(duì)象上的值有明顯的差異 ( 4)變量之間不能高度相關(guān) 計(jì)算相似性 相似性是聚類分析中的基本概念,他反映了研究對(duì)象之間的親疏程度,聚類分析就是根據(jù)對(duì)象之間的相似性來(lái)分類的。要求類與類之間的距離不要超過(guò) T值 。 下面我們介紹幾種方法 。 首先采用絕對(duì)距離計(jì)算距離矩陣: 1G2G 3G4G5G1G2G3G4G5G 0 1 0 0 6 5 0 8 7 2 0 56 56 然后和被聚為新類 , 得: 0 0 6 0 8 2 0 3G5G6G4G5G6G 3G 4G57 57 (三)確定類的個(gè)數(shù) 在聚類分析過(guò)程中類的個(gè)數(shù)如何來(lái)確定才合適呢 ? 這是一個(gè)十分困難的問(wèn)題 , 人們至今仍未找到令人滿意的方法 。 用最短距離法對(duì) 5個(gè)樣品進(jìn)行分類 。 類推直至所有的樣本點(diǎn)歸為一類為止 。分別刪除 D( 1) 表的相應(yīng)的行和列 , 并新增一行和一列添上的新類和舊類之間的距離 。分別刪除 D( 0) 表的第 p, q行和第 p, q列 , 并新增一行和一列添上的結(jié)果 , 產(chǎn)生 D( 1) 表 。 pqd pGqG? ?qpr GGG ,?2nCijd開(kāi)始各樣本自成一類。 所有的樣本點(diǎn)各自為一類 。 離差平方和法連接 45 根據(jù)樣品的特征 , 規(guī)定樣品之間的距離 ,共有 個(gè) 。 常用距離的算法 37 … 0 … 0 ┇ ┇ ┇ ┇ … 0 pGqG1G 2G nG1G2GnG12dnd121d1nd 2ndnd2 至此,我們已經(jīng)可以根據(jù)所選擇的距離構(gòu)成 樣本點(diǎn)間的距離表 ,樣本點(diǎn)之間被連接起來(lái)。 樣品間或變量間親疏測(cè)度指標(biāo)的選擇是一個(gè)比較復(fù)雜且?guī)е饕?guī)性的問(wèn)題 , 我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)作具體分折 , 以選擇出合適的親疏測(cè)度指標(biāo) 。 常用距離的算法 36 (3)適當(dāng)?shù)乜紤]計(jì)算工作量的大小 。 如在標(biāo)準(zhǔn)化變換之下 , 夾角余弦實(shí)際上就是相關(guān)系數(shù);又如若在進(jìn)行聚類分析之前已經(jīng)對(duì)變量的相關(guān)性作了處理 , 則通常就可采用歐氏距離 . 此外 , 所選擇的親疏測(cè)度指標(biāo) , 還須和所選用的聚類分析方法一致 。 如在經(jīng)濟(jì)變量分析中 ,常用相關(guān)系數(shù)表示經(jīng)濟(jì)變量之間的親疏程度 。 因此我們?cè)谶M(jìn)行聚類分析時(shí) ,應(yīng)注意親疏測(cè)度指標(biāo)的選擇 。設(shè)在 n維空間的向量 ? ??? niiii xxx , 21 ?x ? ??? njjjj xxx , 21 ?x? ??? ????nknk kjkink kjkiijijxxxxc1 1221c o s ?22 1 ijij Cd ??常用距離的算法 33 五 、 距離和相似系數(shù)選擇的原則 一般說(shuō)來(lái) , 同一批數(shù)據(jù)采用不同的親疏測(cè)度指標(biāo) ,會(huì)得到不同的分類結(jié)果 。 常用距離的算法 30 ?????? ??
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1