【文章內(nèi)容簡(jiǎn)介】
T YYY ??? . .. , 2211對(duì)于步驟( 3),也可以按如下方式進(jìn)行: 取所有特征根大于 1的特征向量(設(shè)有 s個(gè))來(lái)計(jì)算主成分,即 XbXbXb TssTT YYY ??? . . . , 2211注:這種方法計(jì)算得到的主成分個(gè)數(shù),可能與( 3)中不同,因而有可能累積貢獻(xiàn)率達(dá)不到 85%以上。 例 在企業(yè)經(jīng)濟(jì)效益的評(píng)價(jià)中 ,涉及的指標(biāo)往往很多 .為了簡(jiǎn)化系統(tǒng)結(jié)構(gòu) ,抓住經(jīng)濟(jì)效益評(píng)價(jià)中的主要問(wèn)題 ,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分 .在對(duì)我國(guó)部分省 ,市 ,自治區(qū)獨(dú)立核算的工業(yè)企業(yè)的經(jīng)濟(jì)效益評(píng)價(jià)中 ,涉及到 9項(xiàng)指標(biāo) ,x1— 100元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值 ,X2— 100元固定資產(chǎn)原值實(shí)現(xiàn)利稅 ,X3— 100元資金實(shí)現(xiàn)利稅 ,X4—100元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅 ,X5— 100元銷(xiāo)售收入實(shí)現(xiàn)利稅 ,X6— 每噸標(biāo)準(zhǔn)煤實(shí)現(xiàn)工業(yè)產(chǎn)值 ,X7— 每千瓦時(shí)電力實(shí)現(xiàn)工業(yè)產(chǎn)值 ,X8— 全員勞動(dòng)生產(chǎn)率 ,X9— 100元流動(dòng)資金實(shí)現(xiàn)產(chǎn)值 (數(shù)據(jù)見(jiàn) ex1102) 北京 2178 21006 天津 2852 20254 河北 1167 12607 山西 882 10166 內(nèi)蒙 894 7564 遼寧 1416 13386 吉林 1306 9400 黑龍江 1267 9832 267上海 4346 31246 江蘇 3202 23377 浙江 3811 22054 安徽 1468 12578 福建 2200 12164 江西 1669 10463 山東 1820 17829 河南 1306 11247 湖北 1829 15745 湖南 1272 13161 309廣東 2959 16259 334廣西 1732 12441 四川 1310 11703 貴州 1068 9710 云南 1447 12517 陜西 1731 11369 甘肅 926 13084 青海 1055 9246 寧夏 834 10406 新疆 1041 10983 266To t a l V a r i a n c e Ex p l a i n e d6 . 3 6 3 7 0 . 7 0 3 7 0 . 7 0 3 6 . 3 6 3 7 0 . 7 0 3 7 0 . 7 0 31 . 4 7 0 1 6 . 3 3 3 8 7 . 0 3 6 1 . 4 7 0 1 6 . 3 3 3 8 7 . 0 3 6. 6 6 4 7 . 3 8 0 9 4 . 4 1 6. 2 2 7 2 . 5 1 9 9 6 . 9 3 4. 1 3 9 1 . 5 4 6 9 8 . 4 8 07 . 6 3 6 E 0 2 . 8 4 8 9 9 . 3 2 93 . 1 3 9 E 0 2 . 3 4 9 9 9 . 6 7 72 . 7 0 0 E 0 2 . 3 0 0 9 9 . 9 7 72 . 0 3 5 E 0 3 2 . 2 6 1 E 0 2 1 0 0 . 0 0 0C o m p o n e n t123456789T o t a l % o f V a r ia n c e C u m u la t iv e % T o t a l % o f V a r ia n c e C u m u la t iv e %I n it ia l E ig e n v a lu e s E x t r a c t io n S u m s o f S q u a r e d L o a d in g sE x t r a c t io n Me t h o d : P r in c ip a l C o m p o n e n t A n a ly s is .C o m p o n e n t M a t r i xa. 9 2 8 . 3 2 9. 9 7 7 . 1 5 0. 9 3 5 . 3 1 0. 2 3 2 . 8 7 3. 4 6 0 . 5 6 8. 9 3 4 . 2 1 0. 8 9 4 . 2 8 8. 9 5 9 1 . 6 7 9 E 0 2. 9 0 4 . 1 7 4100 元固定資產(chǎn)原值實(shí)現(xiàn)產(chǎn)值100 元固定資產(chǎn)原值實(shí)現(xiàn)利稅100 元資金實(shí)現(xiàn)利稅100 元工業(yè)總產(chǎn)值實(shí)現(xiàn)利稅100 元銷(xiāo)售收入實(shí)現(xiàn)利稅每噸標(biāo)準(zhǔn)煤實(shí)現(xiàn)工業(yè)產(chǎn)值每千瓦時(shí)電力實(shí)現(xiàn)工業(yè)產(chǎn)值全員勞動(dòng)生產(chǎn)率100 元流動(dòng)資金實(shí)現(xiàn)產(chǎn)值1 2C o mp o n e n tE x t r a ct io n M e t h o d : P r in c ip a l C o m p o n e n t A n a ly s is .2 c o mp o n e n t s e x t r a c t e d .a . ? Y1=[*x1+*x2+*x3+*x4+*x5 +*x6+*x7+*x8+*x9]/()1/2 ? Y2=[*x1+*x2+*x3+*x4+*x5 ****x9]/()1/2 注 : SPSS實(shí)際上計(jì)算的并非主成分的系數(shù) b, 而是因子分析的因子系數(shù) a, 兩者之間的關(guān)系是 具體請(qǐng)見(jiàn)后面的因子分析 . jjj ba ?? 因子分析 概述 因子分析 (factor analysis)是一種數(shù)據(jù)簡(jiǎn)化的技術(shù)。它通過(guò)研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測(cè)數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個(gè)假想變量來(lái)表示其基本的數(shù)據(jù)結(jié)構(gòu)。這幾個(gè)假想變量能夠反映原來(lái)眾多變量的主要信息。原始的變量是可觀測(cè)的顯在變量,而假想變量是 不可觀測(cè)的潛在變量 ,稱為(公共)因子。 例如,在企業(yè)形象或品牌形象的研究中,消費(fèi)者可以通過(guò)一個(gè)有 24個(gè)指標(biāo)構(gòu)成的評(píng)價(jià)體系,評(píng)價(jià)百貨商場(chǎng)的 24個(gè)方面的優(yōu)劣。 但消費(fèi)者主要關(guān)心的是三個(gè)方面,即商店的環(huán)境、商店的服務(wù)和商品的價(jià)格。因子分析方法可以通過(guò) 24個(gè)變量,找出反映商店環(huán)境、商店服務(wù)水平和商品價(jià)格等少數(shù)幾個(gè)潛在的因子(例如三個(gè)),對(duì)商店進(jìn)行綜合評(píng)價(jià)。 而原來(lái)變量可用這三個(gè)公共因子可以表示為: niFFFx iiiii , . .. ,2,1332211 ????? ????公共因子 是不可觀測(cè)的潛在因子 。 24個(gè)變量共享這三個(gè)因子 , 但是每個(gè)變量又有自己的個(gè)性 , 不被公共因子 包含的部分 , 稱為特殊因子 。 321 FFF 、i?因子分析的主要作用: ( 1) 尋求基本結(jié)構(gòu) 在多元統(tǒng)計(jì)分析中我們經(jīng)常遇到諸多變量之間存在強(qiáng)相關(guān)的問(wèn)題。這會(huì)對(duì)分析帶來(lái)許多麻煩。例如回歸分析中的多重共線性問(wèn)題。通過(guò)因子分析,我們可以找出幾個(gè)較少的有實(shí)際意義的因子,反映出原來(lái)數(shù)據(jù)的基本結(jié)構(gòu)。 ( 2) 數(shù)據(jù)化簡(jiǎn) 通過(guò)因子分析可以用所找出的少數(shù)幾個(gè)因子代替原來(lái)的變量做回歸分析、聚類分析、判別分析等。 注: 因子分析與回歸分析不同,因子分析中的因子是一個(gè)比較抽象的概念,而回歸因子有非常明確的實(shí)際意義; 主成分分析分析與因子分析也有不同,主成分分析僅僅是變量變換,而因子分析需要構(gòu)造因子模型。 主成分分析 :原始變量的線性組合表示新的綜合變量,即主成分; 因子分析:潛在的假想變量和隨機(jī)影響變量的線性組合表示原始變量。 數(shù)學(xué)描述與主要特征 由于數(shù)據(jù)的標(biāo)準(zhǔn)化不改變?cè)瓉?lái)變量之間的相關(guān)關(guān)系,而又常常能使問(wèn)題簡(jiǎn)化,因此 以下的討論都建立在已標(biāo)準(zhǔn)化的數(shù)據(jù)之上 。 因子分析最初由英國(guó)心理學(xué)家 C. Spearman提出。他提出的問(wèn)題是:學(xué)生的 k門(mén)功課的成績(jī) xi是由一個(gè)起公共作用的智力因子 f與起特殊作用的因子 ei所決定的。 kiefax iii , . . . ,2,1, ???后來(lái),美國(guó)心理學(xué)家 L. Thurstone認(rèn)為智力因子多于一個(gè),于是模型成為 kiefafafax imimiii , .. . ,2,1,2211 ?????? ?因此,我們現(xiàn)在面臨的數(shù)據(jù)矩陣 Xk?n (k n)是 ????????????knkknnkxxxxxxxxxXXXn????????21222211121121. . .21指標(biāo)指標(biāo)指標(biāo)對(duì)象:所面臨的 因子分析的(樣本觀察值的)數(shù)學(xué)模型 是 kiefafafax imimiii , .. . ,2,1,2211 ?????? ?其中 m k。 fj是公共因子 (Common Factors), 它們之間是兩兩正交的 (Orthogonal). ei是特殊因子 (Unique Factors), 只對(duì)相應(yīng)的 xi起作用的因子 它們都已經(jīng)標(biāo)準(zhǔn)化 aij是公共因子的負(fù)載 (Factor Loadings), 是第 i個(gè)變量在第 j個(gè)因子上的負(fù)載,相當(dāng)于多元回歸中的標(biāo)準(zhǔn)化回歸系數(shù)(注意 我們假設(shè) fj也是標(biāo)準(zhǔn)化了的 )。 矩陣 ????????????kmkkmmaaaaaaaaa???????212222111211稱為 公共因子的負(fù)載矩陣 。 除了假設(shè)公共因子之間互不相關(guān)(兩兩正交)外,進(jìn)一步還假設(shè)特殊因子也互不相關(guān),并且公共因子與特殊因子之間也互不相關(guān)。 基于這樣的假設(shè),可以證明 ( 1) aij也是 xi與 fj之間的簡(jiǎn)單相關(guān)系數(shù) 。 事實(shí)上,由于 xi與 fj都是標(biāo)準(zhǔn)化了的(其方差都為 1),所以,它們之間的簡(jiǎn)單相關(guān)系數(shù)為 ijjikikjijiji afefafxfDx