freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

《聚類分析》ppt課件-文庫吧

2025-01-02 19:20 本頁面


【正文】 標軸平移處理方法 , 它是先求出每個變量的樣本平均值 , 再從原始數(shù)據(jù)中減去該變量的均值 , 就得到中心化變換后的數(shù)據(jù) 。 設原始觀測數(shù)據(jù)矩陣為: ?????????????npnnppxxxxxxxxx??????212222111211X數(shù)據(jù)的變換處理 17 jijij xxx ??* ),3,2,1。,3,2,1( pjni ?? ??中心化變換的結果是使每列數(shù)據(jù)之和均為 0, 即每個變量的均值為 0, 而且 每列數(shù)據(jù)的平方和是該列變量樣本方差的 (n—1)倍 , 任何不同兩列數(shù)據(jù)之交叉乘積是這兩列變量樣本協(xié)方差的 (n—1)倍 , 所以這是一種很方便地計算方差與協(xié)方差的變換 。 數(shù)據(jù)的變換處理 18 極差規(guī)格化變換 規(guī)格化變換是從數(shù)據(jù)矩陣的每一個變量中找出其最大值和最小值, 這兩者之差稱為極差 , 然后從每個變量的每個原始數(shù)據(jù)中減去該變量中的最小值 , 再除以極差 , 就得到規(guī)格化數(shù)據(jù) 。 即有: jniijijij Rxxx ,2,1*)mi n (???? ),3,2,1。,3,2,1( pjni ?? ??niijijnij xxR,2,1,2,1)mi n ()(ma x?? ????10 * ?? ijx數(shù)據(jù)的變換處理 19 經(jīng)過規(guī)格化變換后 , 數(shù)據(jù)矩陣中每列即每個變量的最大數(shù)值為1, 最小數(shù)值為 0, 其余數(shù)據(jù) 取值均在 0- 1之間;并且變換后的數(shù)據(jù)都 不再具有量綱 , 便于不同的變量之間的比較 。 標準化變換 標準化變換也是對變量的數(shù)值和量綱進行類似于規(guī)格化變換的一種數(shù)據(jù)處理方法 。 首先對每個變量進行 中心化變換 , 然后用該變量的標準差進行 標準化 。 即有 : jjijij Sxxx ??* ),3,2,1。,3,2,1( pjni ?? ??????? ni jijjxxnS12)(11數(shù)據(jù)的變換處理 20 經(jīng)過標準化變換處理后 , 每個變量即數(shù)據(jù)矩陣中 每列數(shù)據(jù)的平均值為 0, 方差為 1, 且也不再具有量綱 , 同樣也便于不同變量之間的比較 。 變換后 , 數(shù)據(jù)短陣中任何兩列數(shù)據(jù)乘積之和是兩個變量相關系數(shù)的 ( n- 1) 倍 , 所以這是一種很方便地計算相關矩陣的變換 。 4. 對數(shù)變換 對數(shù)變換是將各個原始數(shù)據(jù)取對數(shù) , 將 原始數(shù)據(jù)的對數(shù)值作為變換后的新值 。 即 : )log (*ijij xx ?數(shù)據(jù)的變換處理 21 樣品間親疏程度的測度 研究樣品或變量的 親疏程度 的數(shù)量指標有兩種 , 一種叫 相似系數(shù) , 性質(zhì)越接近的變量或樣品 , 它們的相似系數(shù)越接近于 1或 l, 而彼此無關的變量或樣品它們的相似系數(shù)則越接近于 0, 相似的為一類 , 不相似的為不同類 ;另一種叫 距離 , 它是將每一個樣品看作 p維空間的一個點 , 并用某種度量測量點與點之間的距離 , 距離較近的歸為一類 , 距離較遠的點應屬于不同的類 。 22 定義距離的準則 定義距離要求滿足第 i個和第 j個樣品之間的距離如下四個條件 ( 距離可以自己定義 , 只要滿足距離的條件 ) 。0 成立和對一切的 jid ij ?。0 成立當且僅當 jid ij ??。0 成立和對一切的 jidd jiij ?.成立和對于一切的 jiddd kjikij ??23 簡單的幾個 距離定義 給定向量 x = (x1, …, xn), y = (y1, …, yn) ? 歐式: ? 馬氏: ? 相關距離 : ????niiiE yxyxd12)(),(.),(1????niiiM yxyxd.)()())((1),(12121????????????iiiiiiiCyyxxyyxxyxd24 聚類取決于采用的距離 1 . 0 1 . 5 2 . 0 2 . 5 3 . 0 3 . 5 4 . 012345In d e xbx = (1, 1, , ) y = (, , , ) = 2x + z = (, , 1, 1) dc(x, y) = 0, dc(x, z) = 2. dE(x, z) = 1, dE(x, y) ~ . ? 右側(cè)圖式 ? 相關距離測量是 dc: dc(x, y)= dc(ax+b, y) if a 0. 25 常用距離的算法 設 和 是第 i和 j 個樣品的觀測值,則二者之間的距離 為: gpk gjkikij xxd 11 )||( ?? ???? ?? pk jkikij xxd 1 2)(? ??? ipii xxx , 21 ?ix ),( 21 ?? jpjj xxx ?jx明氏距離 特別,歐氏距離 (1) 明氏距離測度 26 明考夫斯基距離主要有以下兩個缺點: ① 明氏距離的值與各指標的量綱有關 , 而各指標計量單位的選擇有一定的人為性和隨意性 , 各變量計量單位的不同不僅使此距離的實際意義難以說清 , 而且 , 任何一個變量計量單位的改變都會使此距離的數(shù)值改變從而使該距離的數(shù)值依賴于各變量計量單位的選擇 。 ② 明氏距離的定義 沒有考慮各個變量之間的相關性和重要性 。 實際上 , 明考夫斯基距離是把各個變量都同等看待 , 將兩個樣品在各個變量上的離差簡單地進行了綜合 。 27 (2)蘭氏距離 這是蘭思和維廉姆斯 (Lance amp。 Williams)所給定的一種距離,其計算公式為: ?? ??? pkjkikjkikij xxxxLd1)( 這是一個 自身標準化 的量,由于它對大的奇異值不敏感,這樣使得它特別適合于高度偏倚的數(shù)據(jù)。雖然這個距離有助于克服明氏距
點擊復制文檔內(nèi)容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1