freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

awvaaa聚類分析new-免費閱讀

2024-08-29 09:35 上一頁面

下一頁面
  

【正文】 方法:有條件的經(jīng)修改的層次聚類 —— (1) 程序?qū)颖具M行異端值(或異端類)的識別,以避免異端值對聚類樹的影響(可使聚類樹“體積”過大 —— 類內(nèi)的差異不合理的擴大,對聚類效果造成影響) (2) 進行經(jīng)修改(詳情請閱讀“ BIRCH”)的層次聚類 105 (3) 由給定閾值(或初始類數(shù))的條件下,完成初始聚類。 101 模糊聚類 在自然科學(xué)或社會科學(xué)研究中 , 存在著許多定義不很嚴(yán)格或者說具有模糊性的概念 。 記該分法為 p[n,k]。 一種方法是按照行政命令 。 要將 分為 類;即 , 分類時不能打亂樣本點的順序 , 即每一類必須呈的 形式 , 即有序樣本聚類 。 希望利用該數(shù)據(jù)對 15個地區(qū)進行分類研究 。 為所有 K個類中所有元素與其重心的距離的平方和。這方法一般不提倡使用。故選擇時要慎重.通 常選擇凝聚點的方法有: (1) 人為選擇,當(dāng)人們對所欲分類的問題有一定了解時,根據(jù)經(jīng)驗,預(yù)先確定分類個數(shù)和初始分類,并從每一類中選擇一個有代表性的樣品作為凝聚點。 73 選擇凝聚點 分 類 修改分類 分類是否合理 分類結(jié)束 Yes No 74 用一個簡單的例子來說明動態(tài)聚類法的工作過程。 Call— 每千人擁有的電話線數(shù); move l— 每千人戶居民擁有的蜂窩移動電話數(shù); fee— 高峰時期每三分鐘國際電話的成本; p— 每千人擁有的計算機數(shù); mips— 每千人計算機功率 ( 每秒百萬指令 ) ; — 每千人互聯(lián)網(wǎng)絡(luò)戶主數(shù)。 65 ? 如果是變量聚類分析 , 聚類分析做完之后 , 各類中仍有較多的指標(biāo) 。 可以證明除了重心法和中間距離法之外 ,其他的系統(tǒng)聚類法均滿足單調(diào)性的條件 。 比較大,說明分 G個類時類內(nèi)的離差平方和比較小,也就是說分 G類是合適的。 ??? ppinGx ippxnX 1 ??? qqinGx iqqxnX 1和G4和 G6的距離為 212242241246 412121 DDDD ??? ???????51 設(shè)某一步 Gp和 Gq的重心分別為為和 , 類內(nèi)的樣品數(shù)分別為和 , 如果要把 Gp和 Gq合并為 Gr類 , 則 Gr類的樣品數(shù) nr=np+nq, Gr類的重心為 和 的加權(quán)算術(shù)平均數(shù): pX qXqpqqppr nnXnXnX???遞推公式為: 22222pqrqpqkrqpkrpkr DnnnDnnDnnD ???52 (三)確定類的個數(shù) 在聚類分析過程中類的個數(shù)如何來確定才合適呢 ? 這是一個十分困難的問題 , 人們至今仍未找到令人滿意的方法 。 2222 )1(pqqpqkqpkprk DnnDnDnD ?? ?????44 離差平方和法 如 和 為一類 , 則離差平方和 1G 2G)()( 2212 ?????S)()( 2213 ?????S 如 和 為一類 , 則離差平方和 1G 3G 和 被聚為新類,重心為 1G 2G )21(6 ???X45 類似于方差分析的想法,如果類分得恰當(dāng),同類內(nèi)的樣品之間的離差平方和應(yīng)較小,而類間的離差平方和應(yīng)當(dāng)較大。 pqdpG qG ? ?qpr GGG ,? 利用遞推公式計算新類與其它類之間的距離 。 30 (3)適當(dāng)?shù)乜紤]計算工作量的大小 。 產(chǎn)生不同結(jié)果的原因 , 主要是由于不同的親疏測度指標(biāo)所衡量的親疏程度的實際意義不同 ,也就是說 , 不同的親疏測度指標(biāo)代表了不同意義上的親疏程度 。 。 因此 ,馬氏距離不僅考慮了觀測變量之間的相關(guān)性 , 而且也考慮到了各個觀測指標(biāo)取值的差異程度 , 消除了各個觀測指標(biāo)不同量綱的影響 。 實際上 , 明考夫斯基距離是把各個變量都同等看待 , 將兩個樣品在各個變量上的離差簡單地進行了綜合 。 即: )l o g (* ijij xx ?15 三、樣品間親疏程度的測度 研究樣品或變量的親疏程度的數(shù)量指標(biāo)有兩種 , 一種叫相似系數(shù) , 性質(zhì)越接近的變量或樣品 , 它們的相似系數(shù)越接近于 1或一 l, 而彼此無關(guān)的變量或樣品它們的相似系數(shù)則越接近于0, 相似的為一類 , 不相似的為不同類;另一種叫距離 , 它是將每一個樣品看作 p維空間的一個點 , 并用某種度量測量點與點之間的距離 ,距離較近的歸為一類 , 距離較遠的點應(yīng)屬于不同的類 。 即有: jniijijij Rxxx ,2,1*)m in (???? ),3,2,1。 指標(biāo)度量時既沒有數(shù)量表示也沒有次序關(guān)系 , 只有一些特性狀態(tài) , 如眼睛的顏色 , 化學(xué)中催化劑的種類等 。 一般來說 , 計數(shù)得到的數(shù)量是離散數(shù)量 ,測量得到的數(shù)量是連續(xù)數(shù)量 。 由此,我們的問題是如何來選擇樣品間相似的測度指標(biāo),如何將有相似性的類連接起來? 7 聚類分析根據(jù)一批樣品的許多觀測指標(biāo) , 按照一定的數(shù)學(xué)公式具體地計算一些樣品或一些參數(shù)(指標(biāo) )的相似程度 , 把相似的樣品或指標(biāo)歸為一類 ,把不相似的歸為一類 。其得分如下,選擇合適的統(tǒng)計方法對應(yīng)聘者進行分類。 通常 , 變量按照測量它們的尺度不同 , 可以分為三類 。 如評價酒的味道 ,分成好 、 中 、 次三等 , 三等有次序關(guān)系 , 但沒有數(shù)量表示 。 設(shè)原始觀測數(shù)據(jù)矩陣為: ?????????????npnnppxxxxxxxxx??????212222111211X11 jijij xxx ??* ),3,2,1。,3,2,1( pjni ?? ??????? ni jijjxxnS12)(1114 經(jīng)過標(biāo)準(zhǔn)化變換處理后 , 每個變量即數(shù)據(jù)矩陣中每列數(shù)據(jù)的平均值為 0, 方差為 1, 且也不再具有量綱 , 同樣也便于不同變量之間的比較 。0 成立當(dāng)且僅當(dāng) jid ij ??。 21 馬氏距離又稱為廣義歐氏距離 。比較合理的辦法是用各個類的樣本來計算各自的協(xié)方差矩陣,同一類樣本的馬氏距離應(yīng)當(dāng)用這一類的協(xié)方差短陣來計算。 滿足的條件: 完全線性關(guān)系;當(dāng)且僅當(dāng)兩變量之間為,1??ijC成立;和對一切的 jiC ij ,1|| ?成立;和對一切的 jiCC jiij ,?26 相似系數(shù)的算法 ( 1)相似系數(shù) 設(shè) 和 是第 和 個樣品的觀測值,則二者之間的相似 測度為 : ? ??? ipii xxx , 21 ?ix ),( 21 ?? jpjj xxx ?jxi j? ??? ??????? pkpk jjkiikpk jjkiikijxxxxxxxx1 1221])(][)([))((?其中 27 ( 2)夾角余弦 夾角余弦時從向量集合的角度所定義的一種測度變量之間親疏程度的相似系數(shù)。 如在標(biāo)準(zhǔn)化變換之下 , 夾角余弦實際上就是相關(guān)系數(shù);又如若在進行聚類分析之前已經(jīng)對變量的相關(guān)性作了處理 , 則通常就可采用歐氏距離 , 而不必選用斜交空間距離 。 3 系統(tǒng)聚類方法 根據(jù)樣品的特征 , 規(guī)定樣品之間的距離 ,共有 個 。 首先采用絕對距離計算距離矩陣: )0(D1G2G 3G4G5G1G2G3G4G5G 0 1 0 0 6 5 0 8 7 2 0 37 然后和被聚為新類 , 得: 0 0 6 0 8 2 0 3G5G6G4G5G6G 3G 4G}{ qpijpq GGdM a xD ??? ji XX ,:定義距離:qplDDM a xD qlplrl ,遞推公式: ?? }{38 2G3G 4G 0 1 0 0 36 25 0 64 49 4 0 用中間距離法對 5個樣品進行分類 。 1)(21 2222 〈, ??? pqkqkpkr DDDD ????49 重心法 用重心法對 5個樣品進行分類 。 例如我們給定 T=, 當(dāng)聚類時 , 類間的距離已經(jīng)超過了 , 則聚類結(jié)束 。 )()1()(GnPGPTFGG????58 Pseudo F Statistic 0 10 20 30 40 50 60 70 80 90 100 110 120 Number of Clusters 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 59 偽 統(tǒng)計量的定義為 其中 和 分別是的類內(nèi)離差平方和 , 是將 K和 L合并為第 M類的離差平方和 = 為合并導(dǎo)致的類內(nèi)離差平方和的增量 。有很多刻畫相似性的測度 63 聚類 選定了聚類的變量,計算出樣品或指標(biāo)之間的相似程度后,構(gòu)成了一個相似程度的矩陣。 通過計算 30個企業(yè) 8個指標(biāo)的相關(guān)系數(shù)距離 , 數(shù)據(jù)是 1r2。 這時 , 采用系統(tǒng)聚類法就很困難 , 而動態(tài)聚類法就會顯得方便 , 適用 。 )1(1x )1(2xkx ),(),()1(2)1(1 xxdxxd kk 和),(),( )1(2)1(1 xxdxxd kk ?kx 分別計算兩個類的重心 , 則得 和 , 以其為新的聚核 , 對空間中的點進行重新分類 , 得到新分類 。這樣,按密度大小依次考查,直至全部樣品考查完畢為止.此方法中, d要給的合適,太大了使凝聚點個數(shù)太 少,太小了使凝聚點個數(shù)太多。 定義 若分類不合理時, 會很大,隨著分類的過程,逐漸下降,并趨于穩(wěn)定。 84 例 我國經(jīng)濟發(fā)展的總目標(biāo)是到 2022
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1