【正文】
1 )??~當(dāng) 時,拒絕 H0 i。 1i F ( 1F 1 , n p )? ??37 關(guān)于線性回歸的幾個高級話題 自變量的選擇標(biāo)準(zhǔn)及逐步回歸 選擇標(biāo)準(zhǔn): ? 剩余標(biāo)準(zhǔn)差 ( Residual Standard Deviation ) 又稱均方誤差( MSE ); ?赤池信息準(zhǔn)則 ( AIC準(zhǔn)則 ) ; —— 越小越好 ?Cp 統(tǒng)計(jì)量; —— 比較權(quán)威,越接近于 p 越好 ? 復(fù)相關(guān)系數(shù) R 與校正復(fù)相關(guān)系數(shù) ; pR38 強(qiáng)影響點(diǎn)的診斷及對策 診斷方法: ? 做散點(diǎn)圖,觀察有無離群值; ? 使用殘差診斷指標(biāo); 處理對策: ? 去除;(只有一兩個強(qiáng)影響點(diǎn) ) 39 ? 變量變換;(如倒數(shù)變換、對數(shù)變換等 ) ? 非參數(shù)分析;(略 ) ? 最小一乘法;(非線性回歸) ? 加權(quán)最小二乘法;(穩(wěn)健回歸) 40 多重共線性問題 問題的確認(rèn): ? 自變量間或系數(shù)間的相關(guān)矩陣,相關(guān)系數(shù)在 以上可能有問題; ? 容忍度( Tolerance);該指標(biāo)越小,共線性可能越大,不能小于 41 ? 特征根( Eigenvalue)多維度特征根近似于零,可能存在共線性; ? 條件指數(shù)( Condition Index )該指標(biāo)大于 30時,可能存在共線性; ? 方差膨脹因子( Variance inflation factor, VIF );該指標(biāo)越大,共線性可能越大,不能小于 42 處理對策: ? 增大樣本量; ? 建立最優(yōu)的逐步回歸方程; ? 人為去除; ? 主成分分析; … … 43 分類自變量與啞變量( Dummy Variable) 44 多項(xiàng)式回歸 2p0 1 2 py = x x x? ? ? ? ?…? ? ? ? ?2p1 2 px = x , x = x , x = x… ,2p1 1 12p2 2 22pn n n1 x x x1 x x xX1 x x x?????????????? ? 1TTXX? Xy? ?45 Determining the faire market value of real estate : LESLIE SALT PROPERTY 案 例 46 Variable name Description PRICE Sale price in $000 per acre COUNTY San Mateo = 0 , Santa Clara = 1 SIZE Size of the property in acre ELEVATION Average elevation in feet above sea level SEWER Distance ( in feet ) to nearest connection DATE Date of sale counting backward from current time FLOOD Subject to flooding by tidal action = 0 。 otherwise = 1 DISTANCE Distance in miles from Leslie property