【正文】
? 2X1X1Y2Y? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 平移、旋轉(zhuǎn)坐標(biāo)軸 旋轉(zhuǎn)變換的目的是為了使得 n個(gè)樣品點(diǎn)在 Yl軸方向上的離 散程度最大,即 Yl的方差最大。經(jīng)過上述旋轉(zhuǎn)變換原始數(shù)據(jù)的大部分信息集中到 Yl軸上,對(duì)數(shù)據(jù)中包含的信息起到了濃縮作用。二維平面上的個(gè)點(diǎn)的方差大部分都?xì)w結(jié)在Yl軸上,而 Y2軸上的方差很小。 Y簡(jiǎn)化了系統(tǒng)結(jié)構(gòu),抓住了主要矛盾。 若 A是 k階實(shí)對(duì)稱陣 , 則一定可以找到正交陣 U, 使 若上述矩陣 A的各特征根所對(duì)應(yīng)的單位特征向量為 ??????????????kkkkkkkuuuuuuuuu????????2122221112111),( uuU則實(shí)對(duì)稱陣 屬于不同特征根所對(duì)應(yīng)的特征向量構(gòu)成的矩陣是正交的,即有 kuu ,1 ?令 AIUUUU ????即 ), . . . ,2,1,(,0 ,1 kjiji jiji ????????uu 主成分的計(jì)算結(jié)論 (一) 第一主成分 設(shè) X的協(xié)方差陣為 ???????????????2212222111221kkkkk???????????????xΣ由于 Σ x為非負(fù)定的對(duì)稱陣 , 則有利用線性代數(shù)的知識(shí)可得 , 必存在正交陣 U, 使得 ????????????k??001?UΣU X UUΣ X ????????????k??001?或 其中 ?1, ?2, … , ?k為 Σ x的特征根 , 不妨假設(shè) ?1? ?2 ? … ??k 。 ??????????????kkkkkkkuuuuuuuuu????????2122221112111),( uuU? ??? kiiii uuu , ?21uiki ,2,1 ??下面我們來看,是否由 U的第一列元素為組合系數(shù)所構(gòu)成的原始變量的線性組合是否有最大的方差。因?yàn)? 。 kk XuXuY 11111 ??? ?1111 )( ???? uΣu XYVa r(二) 第二主成分 在約束條件 下,尋找第二主成分,取 0),(21 ?YYC o vkk XuXuY 21122 ??? ?因?yàn)? 所以約束條件 滿足。 2YkkkkkkkkkkXuXuXuYXuXuXuYXuXuXuY?????????????????22112222112212211111 第一主成分 第二主成分 … 第 k 主成分 依此類推 寫為矩陣形式: XUY ????????????????kkkkkkkuuuuuuuuu???????2122221112111),( uuU),( 21 ?? kXXX ?X是協(xié)方差矩陣 Cov(X)的單位特征根構(gòu)成的矩陣 主成分的性質(zhì) 一、均值 μUXU ??? )(E二 、 方差為所有特征根之和 ???kiiYV ar1)( 2222121 kk ?????? ??????? ?? 說明主成分分析把 k個(gè)隨機(jī)變量的總方差分解成為 k個(gè)不相關(guān)的隨機(jī)變量的方差之和 。 其中 )( Xμ E?精度分析 1)貢獻(xiàn)率:第 i個(gè)主成分的方差在全部方差中所占比重 ,稱為它的貢獻(xiàn)率 。 ??kiii1?? 2)累積貢獻(xiàn)率:前 s個(gè)主成分共有多大的綜合能力,用這 s個(gè)主成分的方差和在全部方差中所占比重 來描述,稱為累積貢獻(xiàn)率。到底應(yīng)該選擇多少個(gè)主成分 , 在實(shí)際工作中 , 采用的主成分個(gè)數(shù) s的多少取決于它們是否能夠反映原來變量85%以上的信息量 , 即 當(dāng)累積貢獻(xiàn)率 ≥85%時(shí) , 主成分的個(gè)數(shù)就足夠了 。 一個(gè)簡(jiǎn)單的等價(jià)算法 1. 數(shù)據(jù)的標(biāo)準(zhǔn)化 對(duì)樣本數(shù)據(jù)矩陣 Xk?n中的數(shù)據(jù) Xij進(jìn)行標(biāo)準(zhǔn)化處理: iiijij SXXx .??處理后的數(shù)據(jù)構(gòu)成的矩陣記為 x 2. 兩個(gè)重要結(jié)論 x的協(xié)方差矩陣 Cov(x)的特征根和單位特征向量與原來數(shù)據(jù) X的協(xié)方差矩陣 Cov(X)的特征根和單位特征向量相同 . 由 X的原來數(shù)據(jù)所求得的相關(guān)系數(shù)矩陣 Rk? k = 標(biāo)準(zhǔn)化后的協(xié)方差矩陣 Cov(x) 3. 主成分的簡(jiǎn)化算法 ( 1)由 X的原始數(shù)據(jù)求出 相關(guān)系數(shù)矩陣 Rk? k。 ( 3)取 ?1, ?2, … , ?q,使得累積貢獻(xiàn)率滿足 %85)()( 2121 ??????? kq ?????? ??則 即為所求。 例 在企業(yè)經(jīng)濟(jì)效益的評(píng)價(jià)中 ,涉及的指標(biāo)往往很多 .為了簡(jiǎn)化系統(tǒng)結(jié)構(gòu) ,抓住經(jīng)濟(jì)效益評(píng)價(jià)中的主要問題 ,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分 .在對(duì)我國(guó)部分省 ,市 ,自治區(qū)獨(dú)立核算的工業(yè)企業(yè)的經(jīng)濟(jì)效益評(píng)價(jià)中 ,涉及到 9項(xiàng)指標(biāo) ,x1— 100元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值 ,X2— 100元固定資產(chǎn)原值實(shí)現(xiàn)利稅 ,X3— 100元資金實(shí)現(xiàn)利稅 ,X4—100元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅 ,X5— 100元銷售收入實(shí)現(xiàn)利稅 ,X6— 每噸標(biāo)準(zhǔn)煤實(shí)現(xiàn)工業(yè)產(chǎn)值 ,X7— 每千瓦時(shí)電力實(shí)現(xiàn)工業(yè)產(chǎn)值 ,X8— 全員勞動(dòng)生產(chǎn)率 ,X9— 100元流動(dòng)資金實(shí)現(xiàn)產(chǎn)值 (數(shù)據(jù)見 ex1102) 北京 2178 21006 天津 2852 20254 河北 1167 12607 山西 882 10166 內(nèi)蒙 894 7564 遼寧 1416 13386 吉林 1306 9400 黑龍江 1267 9832 267上海 4346 31246 江蘇 3202 23377 浙江 3811 22054 安徽 1468 12578 福建 2200 12164 江西 1669 10463 山東 1820 17829 河南 1306 11247 湖北 1829 15745 湖南 1272 13161 309廣東 2959 16259 334廣西 1732 12441 四川 1310 11703 貴州 1068 9710 云南 1447 12517 陜西 1731 11369 甘肅 926 13084 青海 1055 9246 寧夏 834 10406 新疆 1041 10983 266To t a l V a r i a n c e Ex p l a i n e d6 . 3 6 3 7 0 . 7 0 3 7 0 . 7 0 3 6 . 3 6 3 7 0 . 7 0 3 7 0 . 7 0 31 . 4 7 0 1 6 . 3 3 3 8 7 . 0 3 6 1 . 4 7 0 1 6 . 3 3 3 8 7 . 0 3 6. 6 6 4 7 . 3 8 0 9 4 . 4 1 6. 2 2 7 2 . 5 1 9 9 6 . 9 3 4. 1 3 9 1 . 5 4 6 9 8 . 4 8 07 . 6 3 6 E 0 2 . 8 4 8 9 9 . 3 2 93 . 1 3 9 E 0 2 . 3 4 9 9 9 . 6 7 72 . 7 0 0 E 0 2 . 3 0 0 9 9 . 9 7 72 . 0 3 5 E 0 3 2 . 2 6 1 E 0 2 1 0 0 . 0 0 0C o m p o n e n t123456789T o t a l % o f V a r ia n c e C u m u la t iv e % T o t a l % o f V a r ia n c e C u m u la t iv e %I n it ia l E ig e n v a lu e s E x t r a c t io n S u m s o f S q u a r e d L o a d in g sE x t r a c t io n Me t h o d : P r in c ip a l C o m p o n e n t A n a ly s is .C o m p o n e n t M a t r i xa. 9 2 8 . 3 2 9. 9 7 7 . 1 5 0. 9 3 5 . 3 1 0. 2 3 2 . 8 7 3. 4 6 0 . 5 6 8. 9 3 4 . 2 1 0. 8 9 4 . 2 8 8. 9 5 9 1 . 6 7 9 E 0 2. 9 0 4 . 1 7 4100 元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值100 元固定資產(chǎn)原值實(shí)現(xiàn)利稅100 元資金實(shí)現(xiàn)利稅100 元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅100 元銷售收入實(shí)現(xiàn)利稅每噸標(biāo)