freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

聚類分析ppt課件(存儲版)

2025-02-16 19:20上一頁面

下一頁面
  

【正文】 6 5 0 8 7 2 0 56 56 然后和被聚為新類 , 得: 0 0 6 0 8 2 0 3G5G6G4G5G6G 3G 4G57 57 (三)確定類的個數(shù) 在聚類分析過程中類的個數(shù)如何來確定才合適呢 ? 這是一個十分困難的問題 , 人們至今仍未找到令人滿意的方法 。分別刪除 D( 0) 表的第 p, q行和第 p, q列 , 并新增一行和一列添上的結(jié)果 , 產(chǎn)生 D( 1) 表 。 常用距離的算法 37 … 0 … 0 ┇ ┇ ┇ ┇ … 0 pGqG1G 2G nG1G2GnG12dnd121d1nd 2ndnd2 至此,我們已經(jīng)可以根據(jù)所選擇的距離構(gòu)成 樣本點(diǎn)間的距離表 ,樣本點(diǎn)之間被連接起來。 如在經(jīng)濟(jì)變量分析中 ,常用相關(guān)系數(shù)表示經(jīng)濟(jì)變量之間的親疏程度 。 如果假定各變量之間相互獨(dú)立 , 即觀測變量的協(xié)方差矩陣是對角矩陣 , 則馬氏距離就退化為用各個觀測指標(biāo)的標(biāo)準(zhǔn)差的倒數(shù)作為權(quán)數(shù)進(jìn)行加權(quán)的歐氏距離 。 實(shí)際上 , 明考夫斯基距離是把各個變量都同等看待 , 將兩個樣品在各個變量上的離差簡單地進(jìn)行了綜合 。 變換后 , 數(shù)據(jù)短陣中任何兩列數(shù)據(jù)乘積之和是兩個變量相關(guān)系數(shù)的 ( n- 1) 倍 , 所以這是一種很方便地計(jì)算相關(guān)矩陣的變換 。,3,2,1( pjni ?? ??中心化變換的結(jié)果是使每列數(shù)據(jù)之和均為 0, 即每個變量的均值為 0, 而且 每列數(shù)據(jù)的平方和是該列變量樣本方差的 (n—1)倍 , 任何不同兩列數(shù)據(jù)之交叉乘積是這兩列變量樣本協(xié)方差的 (n—1)倍 , 所以這是一種很方便地計(jì)算方差與協(xié)方差的變換 。 指標(biāo)度量時沒有明確的數(shù)量表示 , 只有次序關(guān)系 , 或雖用數(shù)量表示 , 但相鄰兩數(shù)值之間的差距并不相等 , 它只表示一個有序狀態(tài)序列 。 12 聚類類型 ? Exclusive:只屬于某類 . ? Overlapping: 可以同時屬于多類 . Overlapping clusters Exclusive clusters 13 1. 樣本點(diǎn)之間 按什么刻畫相似程度 2. 樣本點(diǎn)和小類之間 按什么刻畫相似程度 按什么來刻畫相似程度 思考: 14 一 、 變量測量尺度的類型 為了將樣本進(jìn)行分類 , 就需要研究樣品之間的關(guān)系;而為了將變量進(jìn)行分類 , 就需要研究變量之間的關(guān)系 。 由此,我們的問題是如何來選擇樣品間相似的測度指標(biāo),如何將有相似性的類連接起來? 什么是聚類分析 4 4 分析兒童的生長期。 應(yīng)聘者 1 2 3 4 5 6 7 8 9 10 X 28 18 11 21 26 20 16 14 24 22 Y 29 23 22 23 29 23 22 23 29 27 Z 28 18 16 22 26 22 22 24 24 24 什么是聚類分析 3 我們直觀地來看, 計(jì)算 4號和 6號得分的離差平方和: (2120)2+(2323)2+(2222)2=1 計(jì)算 1號和 2號得分的離差平方和: (2818)2+(2923)2+(2818)2=236 計(jì)算 1號和 3號得分的離差平方和為 482,由此可見一般, 歐氏距離很大的應(yīng)聘者沒有被聚在一起 。 ( 1)用基因表達(dá)數(shù)據(jù)發(fā)現(xiàn)新的(未知的)腫瘤類型即無監(jiān)督學(xué)習(xí) ; ( 2)將腫瘤歸到已知癌癥類別中,即 有 監(jiān)督學(xué)習(xí) ; ( 3)指明哪些基因能刻劃出不同的腫瘤類型,即 特征選擇 。 相似系數(shù)和距離 15 (2)順序尺度 。 設(shè)原始觀測數(shù)據(jù)矩陣為: ?????????????npnnppxxxxxxxxx??????212222111211X數(shù)據(jù)的變換處理 17 jijij xxx ??* ),3,2,1。,3,2,1( pjni ?? ??????? ni jijjxxnS12)(11數(shù)據(jù)的變換處理 20 經(jīng)過標(biāo)準(zhǔn)化變換處理后 , 每個變量即數(shù)據(jù)矩陣中 每列數(shù)據(jù)的平均值為 0, 方差為 1, 且也不再具有量綱 , 同樣也便于不同變量之間的比較 。 ② 明氏距離的定義 沒有考慮各個變量之間的相關(guān)性和重要性 。 顯然 , 馬氏距離與上述各種距離的主要不同就是馬氏距離考慮了觀測變量之間的相關(guān)性 。 通常 , 選擇親疏測度指標(biāo)時 , 應(yīng)注意遵循的基本原則主要有: 常用距離的算法 34 (1)所選擇的親疏測度指標(biāo)在實(shí)際應(yīng)用中應(yīng)有明確的意義 。 實(shí)踐中 , 在開始進(jìn)行聚類分析時 ,不妨試探性地多選擇幾個親疏測度指標(biāo) , 分別進(jìn)行聚類 , 然后對聚類分析的結(jié)果進(jìn)行對比分析 , 以確定出合適的親疏測度指標(biāo) 。 聚類步驟 46 46 利用遞推公式計(jì)算新類與其它類之間的距離 。 首先采用絕對距離計(jì)算距離矩陣: )0(D1G2G 3G4G5G1G2G3G4G5G 0 1 0 0 6 5 0 8 7 2 0 49 49 然后 和 被聚為新類 ,得 : 1G 2G 6G )1(D6G3G5G3G 4G 0
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1