freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

試驗設計與統(tǒng)計分析-資料下載頁

2025-01-07 00:59本頁面
  

【正文】 標的線性組合 Fi。 ? 2x1x1F2F? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 主成分分析的幾何解釋 平移、旋轉坐標軸 x1 x2 PCA1 PCA2 0 均值 0 0 0 0 方差 1 1 主成分分析綜合能力 1)貢獻率:第 i個主成分的方差在全部方差中所占比重 ,稱為貢獻率 , 反映了原來 P個指標多大的信息,有多大的綜合能力 。 ??pi ii 1?? 2)累積貢獻率:前 k個主成分共有多大的綜合能力,用這 k個主成分的方差和在全部方差中所占比重 來描述,稱為累積貢獻率。 ????pi iki i 11?? 我們進行主成分分析的目的之一是希望用盡可能少的主成分 F1, F2, … , Fk( k≤p ) 代替原來的 P個指標 。 到底應該選擇多少個主成分 , 在實際工作中 , 主成分個數(shù)的多少取決于能夠反映原來變量 80%以上的信息量為依據 , 即當累積貢獻率 ≥ 80%時的主成分的個數(shù)就足夠了 。 最常見的情況是主成分為 2到 3個 。 102 聚類分析 系統(tǒng)聚類分析 : 直觀,易懂。 快速聚類 : 快速,動態(tài)。 有序聚類 : 保序 (時間順序或大小順序 )。 103 聚類分析根據一批樣品的許多觀測指標 , 按照一定的數(shù)學公式具體地計算一些樣品或一些參數(shù) (指標 )的相似程度 , 把相似的樣品或指標歸為一類 , 把不相似的歸為一類 。 樣品之間的聚類即 Q型聚類分析,則常用距離來測度樣品之間的親疏程度。 變量之間的聚類即 R型聚類分析,常用相似系數(shù)來測度變量之間的親疏程度。 104 樣品間親疏程度的測度 聚類距離和方法: 聚類距離:樣本點之間的距離; 聚類方法:聚類過程中類間的距離的構造 ,因此聚類方法實質上是類間聚類的定義 。 向量 x=(x1,…, x p)與 y=(y1,…, y p)之間的距離或相似系數(shù) : 2()iiixy??歐氏距離 : Euclidean 平方歐氏距離 : Squared Euclidean 2()iiixy??夾角余弦 (相似系數(shù) 1) : cosine 22( 1 ) c osiiix y x yiiiixyCxy??????Pearson correlation (相似系數(shù) 2): Chebychev: Maxi|xiyi| Block(絕對距離 ): Si|xiyi| Minkowski: 1()qqiiixy????????當變量的測量值相差懸殊時 ,要先進行標準化 . 如 R為極差 , s 為標準差 , 則標準化的數(shù)據為每個觀測值減去均值后再除以 R或 s. 當觀測值大于 0時 , 有人采用 Lance和 Williams的距離 ||1 iii iixyp x y???22( ) ( )( 2)( ) ( )iiix y x yiiiix x y yCrx x y y?????????類 Gp與類 Gq之間的距離 Dpq (d(xi,xj)表示點 xi∈ G p和 xj ∈ G q之間的距離 ) m in ( , )pq i jD d x x?最短距離法 : 最長距離法 : 重心法 : 離差平方和 : (Wald) 類平均法 : (中間距離 , 可變平均法 ,可變法等可參考各書 ). 在用歐氏距離時 , 有統(tǒng)一的遞推公式 121 2 1 2 1 2( ) 39。( ) , ( ) 39。( ) ,( ) 39。( )i p j qk p qi p i p j q j qx G x Gk i pqx G GD x x x x D x x x xD x x x x D D D D??????? ? ? ? ? ?? ? ? ? ? ? ????m a x ( , )pq i jD d x x?m in ( , )pq p qD d x x?121 ( , )i p j qp q i jx G x GD d x xnn ??? ??107 系統(tǒng)聚類基本步驟 1. 構造 n個類,每個類包含且只包含一個樣品。 2. 計算 n個樣品兩兩間的距離,構成距離矩陣,記作 D0。 3. 合并距離最近的兩類為一新類。 4. 計算新類與當前各類的距離。若類的個數(shù)等于 1,轉到步驟 (5),否則回到步驟 (3)。 5. 畫聚類圖。 6. 決定類的個數(shù),及各類包含的樣品數(shù),并對類作出解釋。 108 確定類的個數(shù) 在聚類分析過程中類的個數(shù)如何來確定才合適呢 ?這是一個十分困難的問題 , 人們至今仍未找到令人滿意的方法 。 但是這個問題又是不可回避的 。 下面我們介紹幾種方法 。 給定閾值 —— 通過觀測聚類圖 , 給出一個合適的閾值 T。 要求類與類之間的距離不要超過 T值 。 例如我們給定 T=, 當聚類時 , 類間的距離已經超過了 , 則聚類結束 。 109 統(tǒng)計量 其中 T是數(shù)據的總離差平方和 , 是組內離差平方和 。 比較大 , 說明分 G個類時類內的離差平方和比較小 , 也就是說分 G類是合適的 。 但是 , 分類越多 , 每個類的類內的離差平方和就越小 , 也就越大;所以我們只能取合適的 G, 使得 足夠大 , 而 G本生很小 , 隨著 G的增加 , 的增幅不大 。 比如 , 假定分 4類時 , =;下一次合并分三類時 , 下降了許多 , =, 則分 4類是合適的 。 TPR G?? 12GP2R2R2R2R2R110 偽 F統(tǒng)計量的定義為 偽 F統(tǒng)計量用于評價聚為 G類的效果 。 如果聚類的效果好 , 類間的離差平方和相對于類內的離差平方和大 , 所以應該取偽 F統(tǒng)計量較大而類數(shù)較小的聚類水平 。 )()1()(GnPGPTFGG????K均值法 (快速聚類法 ) 111 Macqueen于 1967年提出,思想是把每個樣品聚集到最近形心 (均值 )類中去。這個過程由下列三步組成: 1. 把樣品粗略分成 K個初始類; 2. 進行修改,逐個分派樣品到其最近均值的類中去(通常用標準化數(shù)據或非標準化數(shù)據計算歐氏距離 )。重新計算接受新樣品的類和失去樣品的類的形心 (均值 ); 2步,直到各類無元素進出。 112 選擇凝聚點 分 類 修改分類 分類是否合理 分類結束 Yes No 謝謝!
點擊復制文檔內容
電大資料相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1