【正文】
第七章 因子分析 第一節(jié) 引言 第二節(jié) 因子分析模型 第三節(jié) 因子載荷矩陣求解 第四節(jié) 公因子重要性的分析 第五節(jié) 實例分析與計算機實現(xiàn) 第一節(jié) 引言 ? 一般認為因子分析是從 Charles Spearman在 1904年發(fā)表的文章 《 對智力測驗得分進行統(tǒng)計分析 》 開始,他提出這種方法用來解決智力測驗得分的統(tǒng)計方法。目前因子分析在心理學(xué)、社會學(xué)、經(jīng)濟學(xué)等學(xué)科中都取得了成功的應(yīng)用,是多元統(tǒng)計分析中典型方法之一。 ? 因子分析 (factor analysis)也是一種降維、簡化數(shù)據(jù)的技術(shù)。它通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個“抽象”的變量來表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個抽象的變量被稱作“因子”,能反映原來眾多變量的主要信息。原始的變量是可觀測的顯在變量,而因子一般是不可觀測的潛在變量。 ? 例如,在商業(yè)企業(yè)的形象評價中,消費者可以通過一系列指標構(gòu)成的一個評價指標體系,評價百貨商場的各個方面的優(yōu)劣。但消費者真正關(guān)心的只是三個方面:商店的環(huán)境、商店的服務(wù)和商品的價格。這三個方面除了價格外,商店的環(huán)境和服務(wù)質(zhì)量,都是客觀存在的、抽象的影響因素,都不便于直接測量,只能通過其它具體指標進行間接反映。因子分析就是一種通過顯在變量測評潛在變量,通過具體指標測評抽象因子的統(tǒng)計分析方法。又比如,在研究區(qū)域社會經(jīng)濟發(fā)展中,描述社會與經(jīng)濟現(xiàn)象的指標很多,過多的指標容易導(dǎo)致分析過程復(fù)雜化。一個合適的做法就是從這些關(guān)系錯綜復(fù)雜的社會經(jīng)濟指標中提取少數(shù)幾個主要因子,每一個主要因子都能反映相互依賴的社會經(jīng)濟指標間共同作用,抓住這些主要因素就可以幫助我們對復(fù)雜的社會經(jīng)濟發(fā)展問題進行深入分析、合理解釋和正確評價。 ? 因子分析的內(nèi)容非常豐富,常用的因子分析類型是 R型因子分析和 Q型因子分析。 R型的因子分析是對變量作因子分析,Q型因子分析是對樣品作因子分析。本章側(cè)重討論 R型因子分析。 第二節(jié) 因子分析模型 一 因子分析的數(shù)學(xué)模型 二 因子載荷陣的統(tǒng)計意義 一、因子分析的數(shù)學(xué)模型 (一) R 型因子分析模型 R 因子分析中的公共因子是不可直接觀測但又客觀存在的共同影響因素,每一個變量都可以表示成公共因子的線性函數(shù)與特殊因子之和,即 1 1 2 2i i i i m m iX a F a F a F ?? ? ? ? ?,(1 , 2 , ,ip?)( 7. 1 ) ( 7. 1 ) 式中的1F,?,2F,mF稱為公共因子,i?稱為iX的特殊因子。該模型可用矩陣表示為: ??X A F ε ( 7. 2 ) 這里 1 1 1 2 12 1 2 2 21212( , , , )mmmp p p ma a aa a aA A Aa a a????????????????A 12pXXX???????????????X, 12mFFF?????????????F, 12p??????????????????ε 且滿足: ( 1 )mp?; ( 2 )C o v ( , ) 0?F ε,即公共因子與特殊因子是不相關(guān)的; ( 3 )101()01FmD??????? ? ???????D F I,即各個公共因子不相關(guān)且方差為 1 ; ( 4 )212220()0pD????????????????????D ε,即各個特殊因子不相關(guān),方差不要求相等。 模型中的ija稱為因子“載荷”,是第i個變量在第j個因子上的負荷,如果把變量iX看成m維空間中的一個點,則ija表示它在坐標軸jF上的投影,因此矩陣 A 稱為因子載荷矩陣。 (二) Q 型因子分析 類似地, Q 型因子分析的數(shù)學(xué)模型可表示為: 1 1 2 2i i i i m m iX a F a F a F ?? ? ? ? ?, (1 , 2 , ,in?) ( 7. 3) Q 型因子 分析與 R 型因子 分析模 型的差 異體現(xiàn)在 ,nXXX , 21 ?表示的是n個樣品。 ? 無論是 R型或 Q型因子分析,都用公共因子 F代替 X,一般要求 mp, mn,因此,因子分析與主成分分析一樣,也是一種降低變量維數(shù)的方法。我們下面將看到,因子分析的求解過程同主成分分析類似,也是從一個協(xié)方差陣出發(fā)的。 ? 因子分析與主成分分析有許多相似之處,但這兩種模型又存在明顯的不同。主成分分析的數(shù)學(xué)模型本質(zhì)上是一種線性變換,是將原始坐標變換到變異程度大的方向上去,相當(dāng)于從空間上轉(zhuǎn)換觀看數(shù)據(jù)的角度,突出數(shù)據(jù)變異的方向,歸納重要信息。而因子分析從本質(zhì)上看是從顯在變量去“提練”潛在因子的過程。正因為因子分析是一個提練潛在因子的過程,因子的個數(shù) m取多大是要通過一定規(guī)則確定的,并且因子的形式也不是唯一確定的。一般說來,作為“自變量”的因子F1, F2, … , Fm是不可直接觀測的。這里我們應(yīng)該注意幾個問題。 第一,變量 X 的協(xié)差陣Σ的分解式為 ( ) ( ) [ ( ) ( ) ]D D E ?? ? ? ? ?X A F ε AF ε AF ε ( ) ( ) ( ) ( )E E E E? ? ? ? ? ?? ? ? ?A F F A A F ε ε FA ε ε ( ) ( )DD ???A F A ε 由模型 ( 7. 2 ) 式所滿足的條件知 ????Σ A A D ( 7. 4 ) 如果 X 為標準化了隨機向量,則 Σ 就是相關(guān)矩陣() ij??R,即 ????R A A D ( 7. 5 ) 第二,因子載荷是不唯一的。這是因為對于mm?的正交矩陣 T ,令 *?A A T, * ??F T F,則模型可以表示為 **??X A F ε 由于 *( ) ( )mmDD ???? ? ?F T F T T T I **C o v ( , ) ( ) ( ) 0EE ? ? ?? ? ?F ε F ε TF ε 所以仍然滿足模型的條件。同樣 Σ 也可以分解為 **????Σ A A D 因此,因子載荷矩陣 A 不是唯一的,在實際的應(yīng)用中常常利用這一點,通過因子的變換,使得新的因子有更好的實際意義。 二、因子載荷陣的統(tǒng)計意義 ? 前面的因子分析模型中出現(xiàn)了一個概念叫因子載荷矩陣,實際上因子載荷矩陣存在明顯的統(tǒng)計意義。為了對因子分析過程和計算結(jié)果做詳細的解釋,我們對因子載荷矩陣的統(tǒng)計意義加以說明。 1 .因子載荷ija的統(tǒng)計意義 對于因子模型 1 1 2 2i i i ij j im m iX a F a F a F a F ?? ? ? ? ? ? ? 1 , 2 , ,ip? 我們可以得到,iX與jF的協(xié)方差為: 1C o v( , ) C o v( , )mi j i k k i jkX F a F F???? ? =1C o v( , ) C o v( , )mi k k j i jka F F F???? =ija 如果對iX作了標準化處理,iX的標準差為 1 ,且jF的標準差為 1 ,因此 ,Co v ( , )Co v ( , )( ) ( )ijijX F i j ijijXFr X F aD X D F? ? ? ( 7 . 6 ) 那么,從上面的分析,我們知道對于標準化后的iX,ija是iX與jF的相關(guān)系數(shù),它一方面表示iX對jF的依賴程度,絕對值越大,密切程度越高;另一方面也反映了變量iX對公共因子jF的相對重要性。了解這一點對我們理解抽象的因子含義有非常重要的作用。 2 .變量共同度2ih的統(tǒng)計意義 設(shè)因子載荷矩陣為A,稱第i行元素的平方和,即 2211 , 2 , ,mi i jjh a i p???? ( 7. 7 ) 為變量iX的共同度。 由因子模型,知 2 2 21 1 2 2( ) ( ) ( ) ( ) ( )i i i im m iD X a D F a D F a D F D ?? ? ? ? ? 2 2 212 ()i i im ia a a D ?? ? ? ? ? 22iih ??? ( 7. 8 ) 這里應(yīng)該注意, ( 7 . 8 ) 式說明變量iX的方差由兩部分組成:第一部分為共同度2ih,它描述了全部公共因子對變量iX的總方差所作的貢獻,反映了公共因子對變量iX的影響程度。第二部分為特殊因子i?對變量iX的方差的貢獻,通常稱為個性方差。 如果對iX作了標準化處理,有 221iih ??? ( 7. 9 ) 3 、公因子jF的方差貢獻2jg的統(tǒng)計意義