【正文】
主成分分析 寧波大學(xué)商學(xué)院 綜合得分: 1 1 2 21( * * * ) /mi i m m i jjy y y? ? ? ??? ? ? ? ?i綜合得分引言 ? 變量太多會增加計算的復(fù)雜性 ? 變量太多給分析問題和解釋問題帶來困難 ? 變量提供的信息在一定程度上會有所重疊 用為數(shù)較少的互不相關(guān)的新變量來反映原變量所提供的絕大部分信息 引言 1 1 22 1 2c o s s i ns i n c o sY X XY X X???????? ???總體主成分 ? 設(shè) 為某實際問題所涉及的 個隨機變量。記 ,其協(xié)方差矩陣為 它是一個 階負定矩陣。設(shè) 為 個常數(shù)向量,考慮如下線性組合: 12, , , pX X X p12( , , , ) TpX X X X?( ) ( ( ) ) ( ( ) ) Tij p p E X E X X E X? ? ??? ? ? ????p 12( , , , ) ( 1 , 2 , , )Ti i i ipl l l l i p??p1 1 1 1 1 1 2 2 12 2 2 1 1 2 2 2 21 1 2 2,.TppTppTp p p p p p pY l X l X l X l XY l X l X l X l XY l X l X l X l X? ? ? ? ? ??? ? ? ? ?????? ? ? ? ??總體主成分 ? 易知有 我們希望用 代替原來 個變量 ,這就要求 盡可能地反映原來 個變量的信息。這里用方差來度量。即要求 達到最大。 對任意常數(shù) ,若取 ,則 。 ( ) ( ) , 1 , 2 , , ,TTi i i iVar Y Var l X l l i p? ? ? ?( , ) ( , ) , 1 , 2 , , .T T Ti j i j i jC o v Y Y C o v l X l X l l j p? ? ? ?1Ypp1Y12, , , pX X X1 1 1() TV a r Y l l??k 11l kl?221 1 1 1( ) ( )T TTV a r l X k V a r l X k l l? ? ?總體主成分 因此,必須對 加以限制,否則 無界。最方便的限制是要求 具有單位長度,即我們在約束條件 之下,求 使 達到最大,因此 所確定的隨機變量 稱為 的第一主成分。 1l 1()Var Y1l11 1Tll? 1l 1()Var Y1l 11TY l X?12, , , pX X X總體主成分 ? 如果第一主成分 還不足以反映原變量的信息,進一步求 。 ? 在約束條件 求使 達到最大。 第二主成分 : 依次類推 …… 1Y2Y1 2 1 222( , ) 01TTC o v Y Y l lll? ? ? ??? ???22TY l X?22TY l X?總體主成分的求法 ? 設(shè) 是 的協(xié)方差矩陣, 的特征值及相應(yīng)的正交單位化特征向量分別為 及 ,則 的第 個主成分為 其中 。易見: 事實上,令 ,則 為一正交矩陣,且 ? 12( , , , ) TpX X X X? ?12 0p? ? ?? ? ? ?12, , , pe e e X i1 1 2 2 , 1 , 2 , , ,Ti i i i i p pY e X e X e X e X i p? ? ? ? ? ?()12( , , , ) Ti i i ipe e e e?( ) , 1 , 2 , , ,( , ) 0 , .TTi i i i i i iTTi k i k k i kVa r Y e e e e i pC ov Y Y e e e e i k???? ? ? ? ? ??? ? ? ? ? ???12( , , , )pP e e e?PP12( , , , )T pP P D i a g ? ? ?? ? ? ?總體主成分的求法 ? 設(shè) 為 X的第一主成分,其中 。令 則 并且當 時,等號成立。這時 11TY l X?11 1Tll?1 1 1 1 2 1 1( , , , ) ,TTpZ z z z P l??2 2 21 1 1 1 1 1 11 2 12 11 1 1 1 1 1 ` 1(),T T TppT T TVar Y l l z P Pz z z zz z l PP l? ? ?? ? ?? ? ? ? ? ? ? ?? ? ?1 (1 , 0 , , 0) Tz ?1 1 1 .l P z e??總體主成分的求法 ? 在約束條件 下,當 時, 達到最大,且 設(shè) 為 X的第二主成分,則有 即有 且 11 1Tll? 11le? 1()Var Y111 1 1 1 1 .1m a x { ( ) } ( )TTTll V a r Y V a r e X e e ?? ? ? ? ?22TY l X?22 1Tll ? 2 1 2 1 1 2 1( , ) 0TTC ov Y Y l e l e?? ? ? ?22 1Tll ? 21 0Tle ?總體主成分的求法 ? 令