【正文】
,所以有 ,因此主成分的名次是 按特征根取值大小的順利排列的。aX且 167。= 39。E(XE(X))(XE(X))39。 ) ) 39。 ) ) ( 39。 ) ( 39。 X = ( X , X , ) 39。 8 主成分分析 數(shù)學(xué)模型的推導(dǎo) 1 1 2 21 1 2 21 2 1 2 1 , 2 ,39。該檢驗(yàn)的原假設(shè)是相關(guān)矩陣為單位 陣(不相關(guān)),如果不能拒絕原假設(shè) ,則不適合進(jìn)行主 成分分析。 KaiserMeyerOlkin( KMO)檢驗(yàn):檢驗(yàn)變量之間的 偏相關(guān)系數(shù)是否過小。 s T e s t. 5 9 01 5 1 . 7 8 228. 0 0 0K a i s e r M e y e r O l k i n M e a s u r e o f S a m p l i n gA d e q u a c y .A p p r o x . C h i S q u a r edfS i g .B a r t l e t t 39。 2a r ( ) v a r ( )iiv c F c F?var( )iF2 2 212 1i i ipa a a? ? ?167。 1 1 1 1 2 1 2 12 1 2 1 2 2 2 21 1 2 21 1 2 2 1 , 2 ,ppppp p p p p pi i i p i pF a x a x a xF a x a x a xF a x a x a xF a x a x a x i p? ? ? ???? ? ? ?????? ? ? ??? ? ? ? ?167。 167。 1 1 1 2 12 1 2 2 212ppn n n px x xx x xXXx x x???????????1 2 p( X , X , )167。 8 主成分分析 數(shù)學(xué)模型 假定有 n個(gè)地理樣本,每個(gè)樣本共有 p個(gè)變量,構(gòu)成一個(gè)n p階的地理數(shù)據(jù)陣 當(dāng) p較大時(shí),在 p維空間中考察問題比較麻煩。 標(biāo)準(zhǔn)? 各主成分的累積方差貢獻(xiàn)率 80%或特征根 1。因此,這些主成分之間是互不相關(guān)的,而且方差依次遞減。 F1和 F2的關(guān)系? 為了有效地反映原來信息, F1已有的信息就不再出現(xiàn)在 F2中,即 cov( F1,F2)= 0。 8 主成分分析 基本思想 如果第一主成分不足以代表原來 p個(gè)變量的信息,再考慮選取 F2即第二個(gè)線性組合。因此在所有的線性組合中所選取的 F1應(yīng)該是方差最大的,故稱之為第一主成分( principal ponent I)。 如何選擇? 如果將選取的第一個(gè)線性組合即第一個(gè)綜合變量記為 F1,自然希望 F1盡可能多的反映原來變量的信息。 8 主成分分析 基本思想 主成分分析就是設(shè)法將原來眾多具有一定相關(guān)性的變量(如 p個(gè)變量 ),重新組合成一組新的相互無關(guān)的綜合變量來代替原來變量。 主成分分析就是設(shè)法將原來變量重新組合成一組新的互相無關(guān)的幾個(gè)綜合變量來代替原來變量,同時(shí)根據(jù)實(shí)際需要從中可取幾個(gè)較少的綜合變量盡可能多地反映原來變量的信息。 8 主成分分析 什么是主成分分析 在實(shí)際問題中,經(jīng)常遇到多變量 (指標(biāo) )問題,而且變量之間有一定的相關(guān)性。