freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

awvaaa聚類分析new-文庫吧

2025-07-20 09:35 本頁面


【正文】 211 12))((1 ?????? ???? ?? ?phpk hkjkikjhihijxxxxpd ?25 四、變量間親疏程度的測度 準則 當對變量進行聚類時 , 最常見的相似系數(shù)是樣本相關(guān)系數(shù) 。 性質(zhì)越接近的變量 , 它們的相關(guān)系數(shù)的絕對值越接近 1, 而彼此無關(guān)的變量的相關(guān)系數(shù)則越接近 0。 滿足的條件: 完全線性關(guān)系;當且僅當兩變量之間為,1??ijC成立;和對一切的 jiC ij ,1|| ?成立;和對一切的 jiCC jiij ,?26 相似系數(shù)的算法 ( 1)相似系數(shù) 設(shè) 和 是第 和 個樣品的觀測值,則二者之間的相似 測度為 : ? ??? ipii xxx , 21 ?ix ),( 21 ?? jpjj xxx ?jxi j? ??? ??????? pkpk jjkiikpk jjkiikijxxxxxxxx1 1221])(][)([))((?其中 27 ( 2)夾角余弦 夾角余弦時從向量集合的角度所定義的一種測度變量之間親疏程度的相似系數(shù)。設(shè)在 n維空間的向量 觀測向量在原點出的夾角的余弦,若變量之間的相關(guān)程度密切,則夾角接近 0,其余弦接近 1;反之接近 0。 ? ??? niiii xxx , 21 ?x ? ??? njjjj xxx , 21 ?x? ??? ????nknk kjkink kjkiijijxxxxc1 1221c os ?28 22 1 ijij Cd ?? 五 、 距離和相似系數(shù)選擇的原則 一般說來 , 同一批數(shù)據(jù)采用不同的親疏測度指標 , 會得到不同的分類結(jié)果 。 產(chǎn)生不同結(jié)果的原因 , 主要是由于不同的親疏測度指標所衡量的親疏程度的實際意義不同 ,也就是說 , 不同的親疏測度指標代表了不同意義上的親疏程度 。 因此我們在進行聚類分析時 , 應注意親疏測度指標的選擇 。 通常 , 選擇親疏測度指標時 , 應注意遵循的基本原則主要有: (1)所選擇的親疏測度指標在實際應用中應有明確的意義 。 如在經(jīng)濟變量分析中 , 常用相關(guān)系數(shù)表示經(jīng)濟變量之間的親疏程度 。 29 (2)親疏測度指標的選擇要綜合考慮已對樣本觀測數(shù)據(jù)實施了的變換方法和將要采用的聚類分析方法 。 如在標準化變換之下 , 夾角余弦實際上就是相關(guān)系數(shù);又如若在進行聚類分析之前已經(jīng)對變量的相關(guān)性作了處理 , 則通常就可采用歐氏距離 , 而不必選用斜交空間距離 。 此外 , 所選擇的親疏測度指標 , 還須和所選用的聚類分析方法一致 。如聚類方法若選用離差平方和法 , 則距離只能選 用歐氏距離 。 30 (3)適當?shù)乜紤]計算工作量的大小 。 如對大樣本的聚類問題 , 不適宜選擇斜交空間距離 , 因采用該距離處理時 , 計算工作量太大 。 樣品間或變量間親疏測度指標的選擇是一個比較復雜且?guī)е饕?guī)性的問題 , 我們應根據(jù)研究對象的特點作具體分折 , 以選擇出合適的親疏測度指標 。 實踐中 , 在開始進行聚類分析時 , 不妨試探性地多選擇幾個親疏測度指標 , 分別進行聚類 , 然后對聚類分析的結(jié)果進行對比分析 , 以確定出合適的親疏測度指標 。 31 六、類的連接方法 單連接 (最短距離) 完全連接 (最長距離) 平均連接 (平均距離) x21? x12? x22? x11? ? ? ? x11? x21? ? ? ? ? ? ? ? ? ? 13d12d991 dd ?? ?32 167。 3 系統(tǒng)聚類方法 根據(jù)樣品的特征 , 規(guī)定樣品之間的距離 ,共有 個 。 將所有列表 , 記為 D( 0) 表 , 該表是一張對稱表 。 選擇 D( 0)表中最小的非零數(shù),不妨假設(shè) , 于是將 和 合并為一類,記為 。 pqdpG qG ? ?qpr GGG ,? 利用遞推公式計算新類與其它類之間的距離 。分別刪除 D( 0) 表的第 p, q行和第 p, q列 , 并新增一行和一列添上的結(jié)果 , 產(chǎn)生 D( 1) 表 。 2nCijd(一)方法 33 0 0 0 pGqG 1G 2G nG?1G2GnG? ?12d nd121d1nd? ? ????2ndnd234 (二)常用的種類 最短距離法 設(shè)抽取五個樣品 , 每個樣品只有一個變量 , 它們 是 1, 2, , 7, 9。 用最短距離法對 5個樣品進行分類 。 首先采用絕對距離計算距離矩陣: )0(D1G2G 3G4G5G1G2G3G4G5G 0 1 0 0 6 5 0 8 7 2 0 35 然后 和 被聚為新類 ,得 : 1G 2G 6G )1(D6G3G5G3G 4G 0 0 5 0 7 2 0 6G4G5G? ?qpijpq GGdM i nD ??? ji xx ,:定義距離:? ? qplDDM i nD qlplrl ,遞推公式: ??36 最長距離法 用最長距離法對 5個樣品進行分類 。 首先采用絕對距離計算距離矩陣: )0(D1G2G 3G4G5G1G2G3G4G5G 0 1 0 0 6 5 0 8 7 2 0 37 然后和被聚為新類 , 得: 0 0 6 0 8 2 0 3G5G6G4G5G6G 3G 4G}{ qpijpq GGdM a xD ??? ji XX ,:定義距離:qplDDM a xD qlplrl ,,遞推公式: ?? }{38 2G3G 4G 0 1 0 0 36 25 0 64 49 4 0 用中間距離法對 5個樣品進行分類 。 首先采用絕對距離計算距離平方矩陣: )0(D1G 2G3G5G1G4G5G 中間距離法 39 12231363 412 DDDD ???41412 ?????D2222412121pqkqkpkr DDDD ???遞推公式:0412121 2222 〈〈,遞推公式: ?? ???? pqkqkpkr DDDD40 6G3G4G5G3G4G 0 4 0 0 4 0 5G6G41 類平均法 類平均法定義類間的距離是兩類間樣品的距離的平均數(shù) 。 2G3G 4G 0 1 0 0 36 25 0 64 49 4 0 1G 2G3G5G1G4G5G? ?? ??pi qjGx Gxijqppq dnnD22 142 然后和被聚為新類 , 得 : 6G)1(D3G 4G5G3G4G 0 0 0 4 0 6G 5Gqpkqqkpprk nnDnDnD??? 222遞推公式:43 可變類平均法 類平均法的遞推公式中 , 沒有反映 Gp類和 Gq類的距離有多大 , 進一步將其改進 , 加入 D2Pq, 并給定系數(shù) ?1, 則類平均法的遞推公式改為: 用此遞推公式進行聚類就是可變類平均法 。 2222 )1(pqqpqkqpkprk DnnDnDnD ?? ?????44 離差平方和法 如 和 為一類 , 則離差平方和 1G 2G)()( 2212 ?????S)()( 2213 ?????S 如 和 為一類 , 則離差平方和 1G 3G 和 被聚為新類,重心為 1G 2G )21(6 ???X45 類似于方差分析的想法,如果類分得恰當,同類內(nèi)的樣品之間的離差平方和應較小,而類間的離差平方和應當較大。 離差平方和法的思路是 , 當 k固定時 , 選擇使 S達到最小的分類 。 先讓 n個樣品各自成一類 , 然后縮小一類 ,每縮小一類離差平方和就要增大 , 選擇使 S2增加最小的兩類合并 , 直到所有的樣品歸為一類為止 。 離差平方和法定義類間的平方距離為 46 1G2G3G 4G 5G1G2G3G 0 0 0 18 0 32 2 0 4G5G47 2222 qprpq SSSD ???的增量:定義距離為離差平方和其中 是由 Gp和 Gq合并成的 Gr類的類內(nèi)離差平方和 ??梢宰C明離差平方和的聚類公式為 2rS2222pqrkkqk
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1