freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多元統(tǒng)計(jì)分析均值向量與協(xié)方差陣的檢驗(yàn)-資料下載頁

2024-08-29 01:23本頁面

【導(dǎo)讀】則總體的密度函數(shù)為。,Xn是從總體中抽取的一個(gè)簡(jiǎn)單隨機(jī)樣本,滿足X1,為樣本聯(lián)合密度函數(shù)。服從自由度為的非中心維斯特分布,記為。正態(tài)隨機(jī)變量也有類似的樣本分布。于一元統(tǒng)計(jì)中的分布。的分布為,即維斯特分布有可加性。定理1:設(shè)X1,X2,……可見維希特分布是由卡方分布在多元下的推廣。證:由于樣本均值)1,(~?相互獨(dú)立的標(biāo)準(zhǔn)正態(tài)分布的平方和為自由度為的卡方分布。

  

【正文】 值作為變換后的新值 。 即: )l o g (* ijij xx ? 三、樣品間親疏程度的測(cè)度 研究樣品或變量的親疏程度的數(shù)量指標(biāo)有兩種 , 一種叫 相似系數(shù) , 性質(zhì)越接近的變量或樣品 , 它們的相似系數(shù)越接近于 1或一 l, 而彼此無關(guān)的變量或樣品它們的相似系數(shù)則越接近于 0, 相似的為一類 , 不相似的為不同類;另一種叫 距離 , 它是將每一個(gè)樣品看作 p維空間的一個(gè)點(diǎn) , 并用某種度量測(cè)量點(diǎn)與點(diǎn)之間的距離 , 距離較近的歸為一類 , 距離較遠(yuǎn)的點(diǎn)應(yīng)屬于不同的類 。 變量之間的聚類即 R型聚類分析 , 常用相似系數(shù) 來測(cè)度變量之間的親疏程度 。 而樣品之間的聚類即 Q型聚類分析 , 則 常用距離 來測(cè)度樣品之間的親疏程度 。 注 :變量聚類放到因子分析后面 定義距離的準(zhǔn)則 定義距離要求滿足第 i個(gè)和第 j個(gè)樣品之間的距離如下四個(gè)條件 ( 距離可以自己定義 , 只要滿足距離的條件 。0 成立和對(duì)一切的 jid ij ?。0 成立當(dāng)且僅當(dāng) jid ij ??。成立和對(duì)一切的 jidd jiij ?.成立和對(duì)于一切的 jiddd kjikij ??常用距離的算法 設(shè) 和 是第 i和 j 個(gè)樣品的觀測(cè)值,則二者之間的距離 為: gpk gjkikij xxd11 )||(?? ???? ?? pk jkikij xxd 1 2)(? ??? ipii xxx , 21 ?ix ),( 21 ?? jpjj xxx ?jx明氏距離 特別,歐氏距離 (1) 明氏距離測(cè)度 明考夫斯基距離主要有以下兩個(gè)缺點(diǎn): ① 明氏距離的值與各指標(biāo)的量綱有關(guān) , 而各指標(biāo)計(jì)量單位的選擇有一定的人為性和隨意性 , 各變量計(jì)量單位的不同不僅使此距離的實(shí)際意義難以說清 , 而且 , 任何一個(gè)變量計(jì)量單位的改變都會(huì)使此距離的數(shù)值改變從而使該距離的數(shù)值依賴于各變量計(jì)量單位的選擇 。 ② 明氏距離的定義沒有考慮各個(gè)變量之間的相關(guān)性和重要性 。 實(shí)際上 , 明考夫斯基距離是把各個(gè)變量都同等看待 , 將兩個(gè)樣品在各個(gè)變量上的離差簡(jiǎn)單地進(jìn)行了綜合 (2)杰氏距離 這是杰斐瑞和馬突斯塔 (Jffreys amp。 Matusita)所定義的一種距離 , 其計(jì)算公式為: ? ?2112)()( ???? pk jkikijxxJd(3)蘭氏距離 這是蘭思和維廉姆斯 (Lance amp。 Williams)所給定的一種距離,其計(jì)算公式為: ?? ???pkjkikjkikij xxxxLd1)( 這是一個(gè) 自身標(biāo)準(zhǔn)化 的量,由于它對(duì)大的奇異值不敏感,這樣使得它 特別適合于高度偏倚的數(shù)據(jù) 。雖然這個(gè)距離有助于克服明氏距離的第一個(gè)缺點(diǎn),但它也沒有考慮指標(biāo)之間的相關(guān)性。 (4)馬氏距離 這是印度著名統(tǒng)計(jì)學(xué)家馬哈拉諾比斯(P. C. Mahalanobis)所定義的一種距離 , 其計(jì)算公式為: )()(2ji1ji xxxx ??????ijd 分別表示第 i個(gè)樣品和第 j樣品的 p指標(biāo)觀測(cè)值所組成的列向量 , 即樣本數(shù)據(jù)矩陣中第 i個(gè)和第 j個(gè)行向量的轉(zhuǎn)臵 , ?表示觀測(cè)變量之間的協(xié)方差短陣 。 在實(shí)踐應(yīng)用中 , 若總體協(xié)方差矩陣 ?未知 , 則可用樣本協(xié)方差矩陣作為估計(jì)代替計(jì)算 。 馬氏距離又稱為 廣義歐氏距離 。 顯然 , 馬氏距離與上述各種距離的主要不同就是 馬氏距離考慮了觀測(cè)變量之間的相關(guān)性 。 如果假定各變量之間相互獨(dú)立 , 即觀測(cè)變量的協(xié)方差矩陣是對(duì)角矩陣 , 則馬氏距離就退化為用各個(gè)觀測(cè)指標(biāo)的標(biāo)準(zhǔn)差的倒數(shù)作為權(quán)數(shù)進(jìn)行加權(quán)的歐氏距離 。 因此 , 馬氏距離不僅考慮了觀測(cè)變量之間的相關(guān)性 , 而且也考慮到了各個(gè)觀測(cè)指標(biāo)取值的差異程度 , 為了對(duì)馬氏距離和歐氏距離進(jìn)行一下比較 , 以便更清楚地看清二者的區(qū)別和聯(lián)系 , 現(xiàn)考慮一個(gè)例子 。 ?????? ????????????,002N ?????????? ?11兩點(diǎn)。和設(shè) )1,1()1,1( ??BA)( ?Md A ?20)( ?Md B ?2)( ?Ud A ?2)( ?Ud B ?例如,假設(shè)有一個(gè)二維正態(tài)總體,它的分布為: (5) 斜交空間距離 由于各變量之間往往存在著不同的相關(guān)關(guān)系,用正交空間的距離來計(jì)算樣本間的距離易變形,所以可以采用斜交空間距離。 211 12))((1????????? ? ?? ?phpk hkjkikjhihijxxxxpd ?當(dāng)各變量之間不相關(guān)時(shí),斜交空間退化為歐氏距離。 相似系數(shù)的算法 ( 1)相似系數(shù) 設(shè) 和 是第 和 個(gè)樣品的觀測(cè)值,則二者之間的相似 測(cè)度為 : ? ??? ipii xxx , 21 ?ix ),( 21 ?? jpjj xxx ?jxi j? ??? ???????pkpk jjkiikpk jjkiikijxxxxxxxx1 1221])(][)([))((?其中 ( 2)夾角余弦 夾角余弦時(shí)從向量集合的角度所定義的一種測(cè)度變量之間親疏程度的相似系數(shù)。設(shè)在 n維空間的向量 ? ??? niiii xxx , 21 ?x ? ??? njjjj xxx , 21 ?x? ??? ????nknk kjkink kjkiijijxxxxc1 1221c os ?22 1 ijij Cd ??五 、 距離和相似系數(shù)選擇的原則 一般說來 , 同一批數(shù)據(jù)采用不同的親疏測(cè)度指標(biāo) , 會(huì)得到不同的分類結(jié)果 。 產(chǎn)生不同結(jié)果的原因 , 主要是由于 不同的親疏測(cè)度指標(biāo)所衡量的親疏程度的實(shí)際意義不同 , 也就是說 , 不同的親疏測(cè)度指標(biāo)代表了不同意義上的親疏程度 。 因此我們?cè)谶M(jìn)行聚類分析時(shí) , 應(yīng)注意親疏測(cè)度指標(biāo)的選擇 。 通常 , 選擇親疏測(cè)度指標(biāo)時(shí) , 應(yīng)注意遵循的基本原則主要有: (1)所選擇的親疏測(cè)度指標(biāo)在實(shí)際應(yīng)用中應(yīng)有明確的意義 。 如在經(jīng)濟(jì)變量分析中 , 常用相關(guān)系數(shù)表示經(jīng)濟(jì)變量之間的親疏程度 。 (2)親疏測(cè)度指標(biāo)的選擇要綜合考慮已對(duì)樣本觀測(cè)數(shù)據(jù)實(shí)施了的變換方法和將要采用的聚類分析方法 。 如在標(biāo)準(zhǔn)化變換之下 , 夾角余弦實(shí)際上就是相關(guān)系數(shù); 又如若在進(jìn)行聚類分析之前已經(jīng)對(duì)變量的相關(guān)性作了處理 ,則通常就可采用歐氏距離 , 而不必選用斜交空間距離 。 此外 , 所選擇的親疏測(cè)度指標(biāo) , 還須和所選用的聚類分析方法一致 。 如聚類方法若選用離差平方和法 , 則距離只能選用歐氏距離 。 (3)適當(dāng)?shù)乜紤]計(jì)算工作量的大小 。 如對(duì)大樣本的聚類問題 , 不適宜選擇斜交空間距離 , 因采用該距離處理時(shí) , 計(jì)算工作量太大 。 樣品間或變量間親疏測(cè)度指標(biāo)的選擇是一個(gè)比較復(fù)雜且?guī)?主規(guī)性 的問題 , 我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)作具體分折 , 以選擇出合適的親疏測(cè)度指標(biāo) 。實(shí)踐中 , 在開始進(jìn)行聚類分析時(shí) , 不妨試探性地多選擇幾個(gè)親疏測(cè)度指標(biāo) , 分別進(jìn)行聚類 , 然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析 , 以確定出合適的親疏測(cè)度指標(biāo) … 0 … 0 ┇ ┇ ┇ ┇ … 0 pGqG 1G 2G nG1G2GnG12d nd121d1nd 2ndnd2 至此,我們已經(jīng)可以根據(jù)所選擇的距離構(gòu)成 樣本點(diǎn)間的距離 表 ,樣本點(diǎn)之間被連接起來。 四、樣本數(shù)據(jù)與小類、小類與小類之間的度量 1 、最短距離( Nearest Neighbor) x21? x12? x22? x11? 13d最長(zhǎng)距離( Furthest Neighbor ) ? ? ? x11? x21? ? ? ? 12d? ? ? ? ? ? 991 dd ?? ?組間平均連接( Betweengroup Linkage) 組內(nèi)平均連接法( Withingroup Linkage) 1 2 3 4 5 66d d d d d d? ? ? ? ?x21? x12? x22? x11? 重心法( Centroid clustering):均值點(diǎn)的距離 ? ? ? ?11,xy ? ?22,xy離差平方和法連接 2, 4 1, 5 6, 5 22( 2 3 ) ( 4 3 ) 2? ? ? ?22(6 5 . 5 ) ( 5 5 . 5 ) 0 . 5? ? ? ?22( 1 3 ) ( 5 3 ) 8? ? ? ?紅綠( 2, 4, 6, 5) 離差平方和增加 - = 黃綠( 6, 5, 1, 5) 離差平方和增加 - = 黃紅( 2, 4, 1, 5) 10- 10= 0 故按該方法的連接和黃紅首先連接。 167。 3 系統(tǒng)聚類方法 根據(jù)樣品的特征 , 規(guī)定樣品之間的距離 ,共有 個(gè) 。 將所有列表 , 記為 D( 0) 表 , 該表是一張對(duì)稱表 。 所有的樣本點(diǎn)各自為一類 。 選擇 D( 0)表中最小的非零數(shù),不妨假設(shè) ,于是將 和 合并為一類,記為 。 pqd pG qG? ?qpr GGG ,?2nCijd(一)方法 開始各樣本自成一類。 利用遞推公式計(jì)算新類與其它類之間的距離 。 分別刪除 D( 0) 表的第 p, q行和第 p,q列 , 并新增一行和一列添上的結(jié)果 , 產(chǎn)生D( 1) 表 。 在 D( 1) 表再選擇最小的非零數(shù) , 其對(duì)應(yīng)的兩類有構(gòu)成新類 , 再利用遞推公式計(jì)算新類與其它類之間的距離 。 分別刪除 D( 1) 表的相應(yīng)的行和列 , 并新增一行和一列添上的新類和舊類之間的距離 。 結(jié)果 ,產(chǎn)生 D( 2) 表 。 類推直至所有的樣本點(diǎn)歸為一類為止 。 (二)常用的種類 最短距離法 設(shè)抽取五個(gè)樣品 , 每個(gè)樣品只有一個(gè)變量 , 它們 是 1, 2, , 7, 9。 用最短距離法對(duì) 5個(gè)樣品進(jìn)行分類 。 首先采用絕對(duì)距離計(jì)算距離矩陣: )0(D1G2G 3G4G5G1G2G3G4G5G 0 1 0 0 6 5 0 8 7 2 0 然后 和 被聚為新類 ,得 : 1G 2G 6G )1(D6G3G5G3G 4G 0 0 5 0 7 2 0 6G4G5G? ?qpijpq GGdM i nD ??? ji xx ,:定義距離:? ? qplDDM i nD qlplrl ,遞推公式: ?? 最短距離法的遞推公式 ? ?qpijpq GGdM i nD ??? ji xx ,:定義距離: ? ?qplDDM i nD qlplrl ,遞推公式: ?? 假設(shè)第 p類和第 q類合并成第 r類,第 r類與其它各舊類的距離按最短距離法為: ? ?r l i j r lD M in d G G? ? ?ijxx: ,? ?? ?ij p q lM in d G G G? ? ?ijxx: ,? ?? ?ij p q lM in d G G G? ? ?: ,? ?,q l p lM in D D?0 0 2 0 7G4G5G7G 4G 5G0 0 8G 7G8G7G各步聚類的結(jié)果: (1,2) (3) (4) (5) (1,2,3) (4) (5) (1,2,3) (4,5) (1,2,3,4,5) 最長(zhǎng)距離法 用最長(zhǎng)距離法對(duì) 5個(gè)樣
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1