【正文】
要性的分析 第五節(jié) 實例分析與計算機實現(xiàn) 第一節(jié) 引言 ? 一般認為因子分析是從 Charles Spearman在 1904年發(fā)表的文章 《 對智力測驗得分進行統(tǒng)計分析 》 開始,他提出這種方法用來解決智力測驗得分的統(tǒng)計方法。這幾個抽象的變量被稱作“因子”,能反映原來眾多變量的主要信息。這三個方面除了價格外,商店的環(huán)境和服務質量,都是客觀存在的、抽象的影響因素,都不便于直接測量,只能通過其它具體指標進行間接反映。 ? 因子分析的內容非常豐富,常用的因子分析類型是 R型因子分析和 Q型因子分析。該模型可用矩陣表示為: ??X A F ε ( 7. 2 ) 這里 1 1 1 2 12 1 2 2 21212( , , , )mmmp p p ma a aa a aA A Aa a a????????????????A 12pXXX???????????????X, 12mFFF?????????????F, 12p??????????????????ε 且滿足: ( 1 )mp?; ( 2 )C o v ( , ) 0?F ε,即公共因子與特殊因子是不相關的; ( 3 )101()01FmD??????? ? ???????D F I,即各個公共因子不相關且方差為 1 ; ( 4 )212220()0pD????????????????????D ε,即各個特殊因子不相關,方差不要求相等。我們下面將看到,因子分析的求解過程同主成分分析類似,也是從一個協(xié)方差陣出發(fā)的。正因為因子分析是一個提練潛在因子的過程,因子的個數(shù) m取多大是要通過一定規(guī)則確定的,并且因子的形式也不是唯一確定的。這是因為對于mm?的正交矩陣 T ,令 *?A A T, * ??F T F,則模型可以表示為 **??X A F ε 由于 *( ) ( )mmDD ???? ? ?F T F T T T I **C o v ( , ) ( ) ( ) 0EE ? ? ?? ? ?F ε F ε TF ε 所以仍然滿足模型的條件。 1 .因子載荷ija的統(tǒng)計意義 對于因子模型 1 1 2 2i i i ij j im m iX a F a F a F a F ?? ? ? ? ? ? ? 1 , 2 , ,ip? 我們可以得到,iX與jF的協(xié)方差為: 1C o v( , ) C o v( , )mi j i k k i jkX F a F F???? ? =1C o v( , ) C o v( , )mi k k j i jka F F F???? =ija 如果對iX作了標準化處理,iX的標準差為 1 ,且jF的標準差為 1 ,因此 ,Co v ( , )Co v ( , )( ) ( )ijijX F i j ijijXFr X F aD X D F? ? ? ( 7 . 6 ) 那么,從上面的分析,我們知道對于標準化后的iX,ija是iX與jF的相關系數(shù),它一方面表示iX對jF的依賴程度,絕對值越大,密切程度越高;另一方面也反映了變量iX對公共因子jF的相對重要性。第二部分為特殊因子i?對變量iX的方差的貢獻,通常稱為個性方差。 這里我們假定原始向量12( , , , )pX X X ??X已作了標準化變換。這種方法要求得到的解使得第一公共因子1F對X的貢獻22111piiga?? ?達到最大,第二 共因子2F對 X 的貢獻22221piiga?? ?達到次之, ,第m個公共因子mF對 X 的貢獻最小。于是有 : 111110 , 1 , 2 , ,0 , 1pi ij jjipij jtjita a i paata??????? ?? ? ? ???????? ? ? ?????? 兩式合并,得到 1110pij jt t ijaa??????, 1 , 2 , ,ip?;1 , 2 , ,tm? ( 7. 12 ) 其中 11101ttt???? ??? 用1ia乘 ( 7. 12 ) 式,并對i求和,得 21 1 111( ) 0p p pi j i j t t ij i ia a a??? ? ???? ? ?, 1 , 2 , ,tm? 這里我們應該注意到, 22111piiga?? ?,1 1 111ppi j i j i i jija a a????????, 即有 21 1 110pj j t tja a g?????, 1 , 2 , ,tm? ( 7. 13 ) 用ita乘 ( 7. 13 ) 式,并對t求和,得 21 1 11 1 1( ) 0p mmj j t i t t i tj t ta a a a g?? ? ???? ? ?, 1 , 2 , ,ip? 由于*1mi j i t j ttr a a?? ?,那么 *21 1 11pi j j ijr a a g???, 1 , 2 , ,ip? 用向量表示為 11* * * 21 2 1 11( , , , )i i i p ipar r r a ga???????????, 1 , 2 , ,ip? 則有 *211( ) 0gA??RI 因此,21g是約相關陣 *R的最大特征根,1A是相應于21g的特征向量。 為了求得載荷矩陣A中其余1m ?列,應該注意到約相關陣 *R的譜分解式為 * * * * * * *1112ppi i i i i iiiAA?????? ?? ? ???R t t t t ( 7. 14 ) 并注意到, 約相關陣 *R還可以分解為 ? ?1*11,mm t ttmAA A A AA????????? ? ?????????R AA 因此,求出1A后,將 *R 減去11AA ?,就得 *111mtttA A A A????? ?R 對于*11AA ??R重復上面的討論,從 ( 7 . 1 4 ) 可以看出,要求的2*22g ??,**2 2 2A ?? t,即22g是約相關陣 *R 的第二大特征根*2?,2A是相應于*2?且滿足2 2 *2 2 2 2 11piig a A A ???? ? ??的特征向量。2i?(或2ih)的較好估計一般很難直接得到,通常是先給出它的一個初始估計2?i?(或2?ih),待載荷矩陣 A 估計好之后再給出2i?(或2ih)的最終估計。這樣得到的 ?A ,實際上是針對 R 主成分解。取*?R 的前 m 個正特征值* * *12 0m? ? ?? ? ? ?及相應的正交單位特征向量* * *12, , , mt t t,可以分解式 * ? ?? ??R A A 其中* * * * * *1 1 2 2? ? ? ?? ? ? ?( , , ) ( )m m i j p ma? ? ? ???A t t t,這樣可以得到2i?的最終估計為 2 2 21?? ?1 1 1 , 2 , ,mi i i jjh a i p??? ? ? ? ?? 在此,我們稱 ?A 和2 2 212? ? ? ?( , , , )pd i a g ? ? ??D為因子模型的主因 子解。這種因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很難對因子的實際背景進行合理的解釋。 ? 因子旋轉方法有正交旋轉和斜交旋轉兩類,這里我們重點介紹正交旋轉。實踐中,我們常用的方法是最大方差旋轉法,下面我們主要介紹這一方法。 1 1 1 2 1 1 1 22 1 2 2 2 1 2 2*1 2 1 2c o s s in s in c o sc o s s in s in c o sc o s s in s in c o sp p p pa a a aa a a a