【正文】
. 9 5 0 . 9 9 1 . 0 0 )?v a r ( 1? 1 . 0 1 . 0 4 1 . 3 3 1 . 9 6 2 . 7 8 5 . 2 6 1 0 . 2 6 5 0 . 2 5 ∞ 167。 多重共線性對(duì)回歸模型的影響 在例 ,我們建立的中國(guó)民航客運(yùn)量回歸方程為: =+++ 其中: y— 民航客運(yùn)量 (萬(wàn)人 ), x1— 國(guó)民收入 (億元 ), x2— 消費(fèi)額 (億元 ), x3— 鐵路客運(yùn)量 (萬(wàn)人 ), x4— 民航航線里程 (萬(wàn)公里 ), x5— 來(lái)華旅游入境人數(shù) (萬(wàn)人 )。 5個(gè)自變量都通過(guò)了 t檢驗(yàn),但是 x2的回歸系數(shù)是負(fù)值, x2是消費(fèi)額,從經(jīng)濟(jì)學(xué)的定性分析看,消費(fèi)額與民航客運(yùn)量應(yīng)該是正相關(guān),負(fù)的回歸系數(shù)無(wú)法解釋。問(wèn)題出在哪里?這正是由于自變量之間的復(fù)共線性造成的。 y?167。 多重共線性的診斷 一、方差擴(kuò)大因子法 對(duì)自變量做中心標(biāo)準(zhǔn)化,則 X*′X*=(rij)為自變量的相關(guān)陣。記 C=(cij)=(X*′X*)1 () 稱(chēng)其主對(duì)角線元素 VIFj=cjj為自變量 xj的方差擴(kuò)大因子 (Variance Inflation Factor,簡(jiǎn)記為 VIF)。根據(jù)( )式可知, pjLc jjjjj ,1 ,/)?v a r ( 2 ??? ??其中 Ljj是 xj的離差平方和,由( )式可知用 cjj做為衡量自變量 xj的方差擴(kuò)大程度的因子是恰如其分的。 167。 多重共線性的診斷 記2jR為自變量 x j 對(duì)其余 p 1 個(gè)自變量的復(fù)判定系數(shù) , 可以證明 211jjjRc?? ( 6. 7 ) ( 6. 7 )式同樣也可以作為為方差擴(kuò)大因子 V I Fj的定義, 由此 可知 V I Fj≥ 1 。 167。 多重共線性的診斷 C o e f f i c i e n t sa4 5 0 . 9 0 9 1 7 8 . 0 7 8 2 . 5 3 2 . 0 3 0. 3 5 4 . 0 8 5 2 . 4 4 7 4 . 1 5 2 . 0 0 2 . 0 0 1 1 9 6 3 . 5 6 1 . 1 2 5 2 . 4 8 5 4 . 4 7 8 . 0 0 1 . 0 0 1 1 7 4 1 7 . E 0 3 . 0 0 2 . 0 8 3 3 . 5 1 0 . 0 0 6 . 3 1 5 3 . 1 7 12 1 . 5 7 8 4 . 0 3 0 . 5 3 1 5 . 3 5 4 . 0 0 0 . 0 1 8 5 5 . 5. 4 3 5 . 0 5 2 . 5 6 4 8 . 4 4 0 . 0 0 0 . 0 4 0 2 5 . 2( C o n s t a n t )X1X2X3X4X5BS t d .E r r o rU n s t a n d a r d i z e dC o e f f i c i e n t sB e t aS t a n d a rd i z e dC o e f f i c ie n t st S i g .T o l e r an c e V I FC o l l i n e a r i t yS t a t i s t i c sD e p e n d e n t V a r i a b l e : Ya . 167。 多重共線性的診斷 M o de l S u m m a r y. 9 9 9 7 4 5 2 9 9 1 a . 9 9 9 . 9 9 9 1 7 5 . 0 8 6 0 1M o d e l1R R S q u a r eA d j u s t e dR S q u a r eS t d . E r r o r o ft h e E s t i m a t eP r e d i c t o r s : ( C o n s t a n t ) , x 5 , x 3 , x 4 , x 2a . V a r i a b l e s E n t e re d / R e m o v e dbx 5 , x 3 , x 4 , x 2a. E n t e rM o d e l1V a r i a b l e s E n t e r e dV a r i a b l e sR e m o v e d M e t h o dA l l r e q u e s t e d v a r i a b l e s e n t e r e d .a . D e p e n d e n t V a r i a b l e : x 1b . 167。 多重共線性的診斷 經(jīng)驗(yàn)表明 ,當(dāng) VIFj≥10時(shí) ,就說(shuō)明自變量 xj與其余自變量之間有嚴(yán)重的多重共線性 ,且這種多重共線性可能會(huì)過(guò)度 還可用 p個(gè)自變量所對(duì)應(yīng)的方差擴(kuò)大因子的平均數(shù)來(lái)度量多重共線性。當(dāng) ???pjjV IFpV IF11遠(yuǎn)遠(yuǎn)大于 1時(shí)就表示存在嚴(yán)重的多重共線性問(wèn)題。 167。 多重共線性的診斷 當(dāng)某自變量 x j 對(duì)其余 p 1 個(gè)自變量的復(fù)判定系數(shù)2jR超過(guò)一定界限時(shí), SPSS 軟件將拒絕這個(gè)自變量x j 進(jìn)入回歸模型。 稱(chēng) T o l j =1 2jR為自變量 x j 的容忍度( T o l e r a n c e ),S P S S 軟件的默認(rèn)容忍度為 0 . 0 0 0 1 。也就是說(shuō),當(dāng)2jR> 0 . 9 9 9 9 時(shí),自變量 x j 將被自動(dòng)拒絕在回歸方程之外,除非我們修改容忍度的默認(rèn)值。 167。 多重共線性的診斷 以下用 SPSS軟件診斷例 。 C o e f f i c i e n t sa4 5 0 . 9 0 9 1 7 8 . 0 7 8 2 . 5 3 2 . 0 3 0. 3 5 4 . 0 8 5 2 . 4 4 7 4 . 1 5 2 . 0 0 2 . 0 0 1 1 9 6 3 . 5 6 1 . 1 2 5 2 . 4 8 5 4 . 4 7 8 . 0 0 1 . 0