【正文】
因此上述矩陣表達式的 左端恰好是負載矩陣的第 j列 aj =(a1j, a2j, …, akj)T。 因子值的求法 1. 因子值的概念與用途 在應用因子分析時,求出經過旋轉后的因子負載矩陣,并解釋公共因子的含義,常常并不是目的。解釋的方式,統(tǒng)計學并不提供標準的模式,因具體問題而異。 ( 1)正交旋轉 正交旋轉的主要方法有以下三種: ?四次方最大法 (Quartimax):使每個變量只有一個因子有較高的負載,其余因子負載盡可能小。但是 (AT)(AT)T=ATTTAT=AAT=R*(X)。 ?僅取特征值大于 1所對應的長度為 1的特征向量 ,來計算公共因子的負載。然后像上面一樣求出 R(X)的最大特征根 λ1以及對應的模長為 1的特征向量 b1, 。 公共因子負載的求法 1. 公共因子負載的求法 ( 1)若 ε已知,求負載矩陣 A的方法 在求公共因子 F時,為了使 X=(X1, X2, …, Xk)T的方差不受損失,所以要考察 X的協(xié)方差矩陣(由于 X1, X2, …, Xk的相關性,所以考察協(xié)方差矩陣)。 由于偏相關系數是在控制了其他變量對兩變量影響的條件下,計算出來的凈相關系數,如果變量之間確實存在較強的相互重疊傳遞影響,即如果變量中確實能夠提取出公共因子,那么控制了這此影響后的偏相關系數必然比較小。 變量 x1, x2, …, xk之間的相關性檢驗 因子分析的 前提是變量 X1, X2, …, Xk之間的相關性 ,如果 X1, X2, …, Xk之間正交,則它們之間就不會存在公共因子,因此作因子分析就失去意義了。 事實上,由于 xi與 fj都是標準化了的(其方差都為 1),所以,它們之間的簡單相關系數為 ijjikikjijiji afefafxfDxDfx ???? ? ),c o v (),c o v ()()(),c o v (( 2) xi與 xj的簡單相關系數 rij,是兩個變量的公共因子對應系數的乘積之和。 數學描述與主要特征 由于數據的標準化不改變原來變量之間的相關關系,而又常常能使問題簡化,因此 以下的討論都建立在已標準化的數據之上 。 24個變量共享這三個因子 , 但是每個變量又有自己的個性 , 不被公共因子 包含的部分 , 稱為特殊因子 。 例 在企業(yè)經濟效益的評價中 ,涉及的指標往往很多 .為了簡化系統(tǒng)結構 ,抓住經濟效益評價中的主要問題 ,我們可由原始數據矩陣出發(fā)求主成分 .在對我國部分省 ,市 ,自治區(qū)獨立核算的工業(yè)企業(yè)的經濟效益評價中 ,涉及到 9項指標 ,x1— 100元固定資產原值實現(xiàn)產值 ,X2— 100元固定資產原值實現(xiàn)利稅 ,X3— 100元資金實現(xiàn)利稅 ,X4—100元工業(yè)總產值實現(xiàn)利稅 ,X5— 100元銷售收入實現(xiàn)利稅 ,X6— 每噸標準煤實現(xiàn)工業(yè)產值 ,X7— 每千瓦時電力實現(xiàn)工業(yè)產值 ,X8— 全員勞動生產率 ,X9— 100元流動資金實現(xiàn)產值 (數據見 ex1102) 北京 2178 21006 天津 2852 20254 河北 1167 12607 山西 882 10166 內蒙 894 7564 遼寧 1416 13386 吉林 1306 9400 黑龍江 1267 9832 267上海 4346 31246 江蘇 3202 23377 浙江 3811 22054 安徽 1468 12578 福建 2200 12164 江西 1669 10463 山東 1820 17829 河南 1306 11247 湖北 1829 15745 湖南 1272 13161 309廣東 2959 16259 334廣西 1732 12441 四川 1310 11703 貴州 1068 9710 云南 1447 12517 陜西 1731 11369 甘肅 926 13084 青海 1055 9246 寧夏 834 10406 新疆 1041 10983 266To t a l V a r i a n c e Ex p l a i n e d6 . 3 6 3 7 0 . 7 0 3 7 0 . 7 0 3 6 . 3 6 3 7 0 . 7 0 3 7 0 . 7 0 31 . 4 7 0 1 6 . 3 3 3 8 7 . 0 3 6 1 . 4 7 0 1 6 . 3 3 3 8 7 . 0 3 6. 6 6 4 7 . 3 8 0 9 4 . 4 1 6. 2 2 7 2 . 5 1 9 9 6 . 9 3 4. 1 3 9 1 . 5 4 6 9 8 . 4 8 07 . 6 3 6 E 0 2 . 8 4 8 9 9 . 3 2 93 . 1 3 9 E 0 2 . 3 4 9 9 9 . 6 7 72 . 7 0 0 E 0 2 . 3 0 0 9 9 . 9 7 72 . 0 3 5 E 0 3 2 . 2 6 1 E 0 2 1 0 0 . 0 0 0C o m p o n e n t123456789T o t a l % o f V a r ia n c e C u m u la t iv e % T o t a l % o f V a r ia n c e C u m u la t iv e %I n it ia l E ig e n v a lu e s E x t r a c t io n S u m s o f S q u a r e d L o a d in g sE x t r a c t io n Me t h o d : P r in c ip a l C o m p o n e n t A n a ly s is .C o m p o n e n t M a t r i xa. 9 2 8 . 3 2 9. 9 7 7 . 1 5 0. 9 3 5 . 3 1 0. 2 3 2 . 8 7 3. 4 6 0 . 5 6 8. 9 3 4 . 2 1 0. 8 9 4 . 2 8 8. 9 5 9 1 . 6 7 9 E 0 2. 9 0 4 . 1 7 4100 元固定資產原值實現(xiàn)產值100 元固定資產原值實現(xiàn)利稅100 元資金實現(xiàn)利稅100 元工業(yè)總產值實現(xiàn)利稅100 元銷售收入實現(xiàn)利稅每噸標準煤實現(xiàn)工業(yè)產值每千瓦時電力實現(xiàn)工業(yè)產值全員勞動生產率100 元流動資金實現(xiàn)產值1 2C o mp o n e n tE x t r a ct io n M e t h o d : P r in c ip a l C o m p o n e n t A n a ly s is .2 c o mp o n e n t s e x t r a c t e d .a . ? Y1=[*x1+*x2+*x3+*x4+*x5 +*x6+*x7+*x8+*x9]/()1/2 ? Y2=[*x1+*x2+*x3+*x4+*x5 ****x9]/()1/2 注 : SPSS實際上計算的并非主成分的系數 b, 而是因子分析的因子系數 a, 兩者之間的關系是 具體請見后面的因子分析 . jjj ba ?? 因子分析 概述 因子分析 (factor analysis)是一種數據簡化的技術。 ??kiii1?? 2)累積貢獻率:前 s個主成分共有多大的綜合能力,用這 s個主成分的方差和在全部方差中所占比重 來描述,稱為累積貢獻率。因為 。二維平面上的個點的方差大部分都歸結在Yl軸上,而 Y2軸上的方差很小。 由圖可以看出這 n個 樣本點無論是沿著 Xl 軸方向或 X2軸方向都具有較大的離散性,其離散的程度可以分別用觀測變量 Xl 的方差和 X2 的方差定量地表示。則它的期望值為 ?????????????)()()()(21kXEXEXEE?XX的方差(方差 — 協(xié)方差矩陣)為 ? ??????????????????????????????????????????????????)(),(),(),()(),(),(),()()()()()()()(]))() ) (([()(212212121122112211kkkkkkkkkTXV a rXXC o vXXC o vXXC o vXV a rXXC o vXXC o vXXC o vXV a rXEXXEXXEXXEXXEXXEXEEEEV a r?????????XXXXX由于通過這一表達式計算得到的矩陣不僅包括方差也包括協(xié)方差,所以常稱它為方差 — 協(xié)方差矩陣,記為VarCov(X)(在不引起混淆的情況下也稱為方差矩陣或協(xié)方差矩陣,記為 Var(X) 或 Cov(X)). 樣本描述 調查 n個個體(樣本)在這 k (k n)個指標下的數值(或者用這 k個指標來評價 n個對象),就可得到數據矩陣 Xk?n: ????????????knkknnkxxxxxxxxxXXXn????????21222211121121...21對象: