freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

聚類(lèi)分析ppt課件(完整版)

  

【正文】 群克隆的排序 9 聚類(lèi)分析根據(jù)一批樣品的許多觀測(cè)指標(biāo) , 按照一定的數(shù)學(xué)公式具體地計(jì)算一些樣品或一些參數(shù) (指標(biāo) )的 相似程度 ,把相似的樣品或指標(biāo)歸為一類(lèi) , 把不相似的歸為一類(lèi) 。 指標(biāo)度量時(shí)用 數(shù)量 來(lái)表示 , 其數(shù)值由測(cè)量或計(jì)數(shù) 、 統(tǒng)計(jì)得到 , 如長(zhǎng)度 、 重量 、 收入 、 支出等 。 在名義尺度中只取兩種特性狀態(tài)的變量是很重要的 , 如電路的開(kāi)和關(guān) , 天氣的有雨和無(wú)雨 , 人口性別的男和女 , 醫(yī)療診斷中的 “ 十 ” 和 “ 一 ” , 市場(chǎng)交易中的買(mǎi)和賣(mài)等都是此類(lèi)變量 。 標(biāo)準(zhǔn)化變換 標(biāo)準(zhǔn)化變換也是對(duì)變量的數(shù)值和量綱進(jìn)行類(lèi)似于規(guī)格化變換的一種數(shù)據(jù)處理方法 。0 成立和對(duì)一切的 jid ij ?。 常用距離的算法 28 (3)馬氏距離 這是印度著名統(tǒng)計(jì)學(xué)家馬哈拉諾比斯(P. C. Mahalanobis)所定義的一種距離 , 其計(jì)算公式為: )()(2 ji1ji xxxx ????? ?ijd 分別表示第 i個(gè)樣品和第 j樣品的 p指標(biāo)觀測(cè)值所組成的列向量 , 即樣本數(shù)據(jù)矩陣中第 i個(gè)和第 j個(gè)行向量的轉(zhuǎn)置 , ?表示觀測(cè)變量之間的協(xié)方差短陣 。設(shè)在 n維空間的向量 ? ??? niiii xxx , 21 ?x ? ??? njjjj xxx , 21 ?x? ??? ????nknk kjkink kjkiijijxxxxc1 1221c o s ?22 1 ijij Cd ??常用距離的算法 33 五 、 距離和相似系數(shù)選擇的原則 一般說(shuō)來(lái) , 同一批數(shù)據(jù)采用不同的親疏測(cè)度指標(biāo) ,會(huì)得到不同的分類(lèi)結(jié)果 。 常用距離的算法 36 (3)適當(dāng)?shù)乜紤]計(jì)算工作量的大小 。 所有的樣本點(diǎn)各自為一類(lèi) 。 類(lèi)推直至所有的樣本點(diǎn)歸為一類(lèi)為止 。要求類(lèi)與類(lèi)之間的距離不要超過(guò) T值 。 然而當(dāng)樣本點(diǎn)數(shù)量十分龐大時(shí) , 則是一件非常繁重的工作 , 且聚類(lèi)的計(jì)算速度也比較慢 。 對(duì)于任何點(diǎn) ,分別計(jì)算 若 ,則將 劃為第一類(lèi),否則劃給第二類(lèi)。以某個(gè)正數(shù) d為半徑,以每個(gè)樣品為球心,落在這個(gè)球內(nèi)的樣品數(shù) (不包括作為球心的樣品 )就叫做這個(gè)樣品的密度。然后依次考察每個(gè)樣品,若某樣品與已選定的凝聚點(diǎn)的距 離均大于 d,該樣品作為新的凝聚點(diǎn),否則考察下一個(gè)樣品。 對(duì)各地區(qū)實(shí)現(xiàn)小康生活質(zhì)量的狀況進(jìn)行綜合評(píng)價(jià) , 對(duì)各級(jí)政府部門(mén)具有重要意義 。然后選出次大密度的樣品點(diǎn),若它與第一個(gè)凝 聚點(diǎn)的距離大于 D,則將其作為第二個(gè)凝聚點(diǎn);否則舍去這點(diǎn),再 選密度次于它的樣品。 )1(1x )1(2xkx ),(),()1(2)1(1 xxdxxd kk 和),(),( )1(2)1(1 xxdxxd kk ? kx 分別計(jì)算兩個(gè)類(lèi)的重心 , 則得 和 , 以其為新的聚核 , 對(duì)空間中的點(diǎn)進(jìn)行重新分類(lèi) , 得到新分類(lèi) 。 這時(shí) , 采用系統(tǒng)聚類(lèi)法就很困難 , 而動(dòng)態(tài)聚類(lèi)法就會(huì)顯得方便 , 適用 。 58 single最短距離法 plete—最長(zhǎng)距離法 median中間距離法 average類(lèi)平均法 centroid重心法 ward離差平方和法 58 常用的工具軟件中的聚類(lèi)距離選擇的參數(shù)設(shè)置 59 59 選擇變量 ( 1)和聚類(lèi)分析的目的密切相關(guān) ( 2)反映要分類(lèi)變量的特征 ( 3)在不同研究對(duì)象上的值有明顯的差異 ( 4)變量之間不能高度相關(guān) 計(jì)算相似性 相似性是聚類(lèi)分析中的基本概念,他反映了研究對(duì)象之間的親疏程度,聚類(lèi)分析就是根據(jù)對(duì)象之間的相似性來(lái)分類(lèi)的。 用最短距離法對(duì) 5個(gè)樣品進(jìn)行分類(lèi) 。 pqd pGqG? ?qpr GGG ,?2nCijd開(kāi)始各樣本自成一類(lèi)。 樣品間或變量間親疏測(cè)度指標(biāo)的選擇是一個(gè)比較復(fù)雜且?guī)е饕?guī)性的問(wèn)題 , 我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)作具體分折 , 以選擇出合適的親疏測(cè)度指標(biāo) 。 因此我們?cè)谶M(jìn)行聚類(lèi)分析時(shí) ,應(yīng)注意親疏測(cè)度指標(biāo)的選擇 。 常用距離的算法 29 馬氏距離又稱(chēng)為廣義歐氏距離 。0 成立和對(duì)一切的 jidd jiij ?.成立和對(duì)于一切的 jiddd kjikij ??23 簡(jiǎn)單的幾個(gè) 距離定義 給定向量 x = (x1, …, xn), y = (y1, …, yn) ? 歐式: ? 馬氏: ? 相關(guān)距離 : ????niiiE yxyxd12)(),(.),(1????niiiM yxyxd.)()())((1),(12121????????????iiiiiiiCyyxxyyxxyxd24 聚類(lèi)取決于采用的距離 1 . 0 1 . 5 2 . 0 2 . 5 3 . 0 3 . 5 4 . 012345In d e xbx = (1, 1, , ) y = (, , , ) = 2x + z = (, , 1, 1) dc(x, y) = 0, dc(x, z) = 2. dE(x, z) = 1, dE(x, y) ~ . ? 右側(cè)圖式 ? 相關(guān)距離測(cè)量是 dc: dc(x, y)= dc(ax+b, y) if a 0. 25 常用距離的算法 設(shè) 和 是第 i和 j 個(gè)樣品的觀測(cè)值,則二者之間的距離 為: gpk gjkikij xxd 11 )||( ?? ???? ?? pk jkikij xxd 1 2)(? ??? ipii xxx , 21 ?ix ),( 21 ?? jpjj xxx ?jx明氏距離 特別,歐氏距離 (1) 明氏距離測(cè)度 26 明考夫斯基距離主要有以下兩個(gè)缺點(diǎn): ① 明氏距離的值與各指
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1