【正文】
i=1,2,…, n 設(shè)計(jì)矩陣 X的秩 rank( X) p+1,此時(shí) |x′x|=0,正規(guī)方程組的解不唯一,( x′x) 1不存在,回歸參數(shù)的最小二乘估計(jì)表達(dá)式 不成立。 多重共線性對(duì)回歸模型的影響 對(duì) 非 完全 共線性 , 即存在不全為零的一組數(shù) c 0 ,c 1, c 2, … , c p , 使得 c 0 + c 1 x i1 + c 2 x i2 + … + c px ip ≈ 0 , i = 1, 2, … ,n 此時(shí)設(shè)計(jì)矩陣 X 的秩 r a n k ( X ) = p + 1 雖然成立,但是此時(shí) |x ′ x |≈ 0 , ( x ′ x ) 1的對(duì)角線元素很大,β ?的方差陣 D (β ?)= σ2( X ′ X ) 1的 對(duì)角線元素很大,而 D (β ?) 的對(duì)角線元素即為)?v a r ( ,),?v a r ( , )?v a r ( p10 ??? ? 因而 β0, β1,… , βp的估計(jì)精度很低。 對(duì)非完全共線性 , 存在不全為零的一組數(shù) c0,c1,c2,…, cp ,使得 c0+c1xi1+c2xi2+…+ cpxip≈0 , i=1,2,…, n 167。 多重共線性對(duì)回歸模型的影響 )?,?(? 21 ?????的協(xié)方差陣為 cov (β ?)= σ2( X ′ X ) 1 ??????????22121211 LLLLXX ????????????111212221 1)(LLLLXXXX??????????111212222122211 1LLLLLLL ??????????111212222122211 )1(1 LLLLrLL 167。 當(dāng) x1與 x2完全相關(guān)時(shí) , r = 1 ,方差將變?yōu)闊o窮大。 多重共線性對(duì)回歸模型的影響 當(dāng)給不同的 r12值時(shí) ,由表 。 表 6 . 1 r 12 0 . 0 0 . 2 0 . 5 0 0 . 7 0 0 . 8 0 0 . 9 0 0 . 9 5 0 . 9 9 1 . 0 0 )?v a r ( 1? 1 . 0 1 . 0 4 1 . 3 3 1 . 9 6 2 . 7 8 5 . 2 6 1 0 . 2 6 5 0 . 2 5 ∞ 167。 5個(gè)自變量都通過了 t檢驗(yàn),但是 x2的回歸系數(shù)是負(fù)值, x2是消費(fèi)額,從經(jīng)濟(jì)學(xué)的定性分析看,消費(fèi)額與民航客運(yùn)量應(yīng)該是正相關(guān),負(fù)的回歸系數(shù)無法解釋。 y?167。記 C=(cij)=(X*′X*)1 () 稱其主對(duì)角線元素 VIFj=cjj為自變量 xj的方差擴(kuò)大因子 (Variance Inflation Factor,簡(jiǎn)記為 VIF)。 167。 167。 多重共線性的診斷 M o de l S u m m a r y. 9 9 9 7 4 5 2 9 9 1 a . 9 9 9 . 9 9 9 1 7 5 . 0 8 6 0 1M o d e l1R R S q u a r eA d j u s t e dR S q u a r eS t d . E r r o r o ft h e E s t i m a t eP r e d i c t o r s : ( C o n s t a n t ) , x 5 , x 3 , x 4 , x 2a . V a r i a b l e s E n t e re d / R e m o v e dbx 5 , x 3 , x 4 , x 2a. E n t e rM o d e l1V a r i a b l e s E n t e r e dV a r i a b l e sR e m o v e d M e t h o dA l l r e q u e s t e d v a r i a b l e s e n t e r e d .a . D e p e n d e n t V a r i a b l e : x 1b . 167。當(dāng) ???pjjV IFpV IF11遠(yuǎn)遠(yuǎn)大于 1時(shí)就表示存在嚴(yán)重的多重共線性問題。 多重共線性的診斷 當(dāng)某自變量 x j 對(duì)其余 p 1 個(gè)自變量的復(fù)判定系數(shù)2jR超過一定界限時(shí), SPSS 軟件將拒絕這個(gè)自變量x j 進(jìn)入回歸模型。也就是說,當(dāng)2jR> 0 . 9 9 9 9 時(shí),自變量 x j 將被自動(dòng)拒絕在回歸方程之外,除非我們修改容忍度的默認(rèn)值。 多重共線性的診斷 以下用 SPSS軟件診斷例 。 多重共線性的診斷 二、特征根判定法 (一)特征根分析 根據(jù)矩陣行列式的性質(zhì),矩陣的行列式等于其特征根的連乘積。反之可以證明,當(dāng)矩陣 X′ X至少有一個(gè)特征根近似為零時(shí), X 的列向量間必存在復(fù)共線性,證明如下: 167。 λ 是矩陣 X′ X的一個(gè)近似為零的特征根, λ≈0 c=(c0,c1, …,cp)′ 是對(duì)應(yīng)于特征根 λ 的單位特征向量,則 X′ X c=λ c≈ 0 167。 167。那么特征根近似為零的標(biāo)準(zhǔn)如何確定哪?這可以用下面介紹的條件數(shù)確定。 167。 10≤k< 100時(shí) ,認(rèn)為 X存在較強(qiáng)的多重共線性 。 用條件數(shù)判斷多重共線性的準(zhǔn)則 167。 多重共線性的診斷 方差比例是用于判斷哪幾個(gè)自變量之間存在共線性的。 把特征向量按照特征值由大到小排成行向量,每個(gè)數(shù)值平方后再除以特征值,然后再把每列數(shù)據(jù)除以列數(shù)據(jù)之和,使得每列數(shù)據(jù)之和為 1,這樣就得到了輸出結(jié)果 。 167。 。 消除多重共線性的方法