【正文】
系數(shù) R2來說明回歸模型的好壞, R2 =SS回 /SS總 。 (二 )多元線性回歸分析的應(yīng)用條件 (linear) (indedpendent) (此條件可以放寬) (normality) (homogeneity or equal variance) 簡(jiǎn)稱為 LINE 多元線性回歸 多元線性回歸是用線性方程表達(dá)一個(gè)因變量與多個(gè)自變量之間數(shù)量關(guān)系的統(tǒng)計(jì)分析方法。 經(jīng) t檢驗(yàn),體重對(duì)肺活量有影響, P = 。 選擇變量的方法有強(qiáng)迫引入法 (系統(tǒng)默認(rèn) )、強(qiáng)迫剔除法、向前引入法、向后剔除法、逐步回歸法。 在回歸分析中, y方面的總變異 lyy分解為回歸貢獻(xiàn) U和剩余變異 Q: lyy=U + Q Q是總變異中不能由自變量解釋的殘差平方和, U是總變異中由自變量所引起的一部分變異。 赤池信息準(zhǔn)則( AIC) Cp統(tǒng)計(jì)量 衡量回歸方程的標(biāo)準(zhǔn) 根據(jù) R2大小判斷方程優(yōu)劣時(shí)的缺點(diǎn)是:變量最多的方程最好,即使所增加的變量無統(tǒng)計(jì)學(xué)意義。 t α,( nm1) * s bi , 樣本含量為 n,自變量數(shù)為 m。 自變量的貢獻(xiàn)(二) 一個(gè)自變量對(duì)因變量 y的作用除了直接作用外,還有該變量通過其它自變量對(duì) y的間接作用。 s D is t a n c eC e n t e r e d L e v e r a g e V a lu eMin im u m Ma x im u m Me a n S t d . D e v ia t io n ND e p e n d e n t V a r ia b le : 肺活量a . 逐步回歸(一) Stepwise(逐步回歸法)是一種從眾多的回歸模型中快速選擇 “ 最優(yōu) ” 模型的統(tǒng)計(jì)思維方法或建模策略,保證 “ 最優(yōu) ” 模型中的自變量少而精。 對(duì)定量指標(biāo):符合線性要求的,直接以原變量形式進(jìn)入分析;若不符合線性要求的,作適當(dāng)變量變換,直到符合線性關(guān)系時(shí),方可作回歸分析。 原因主要有: 數(shù)據(jù)中有離群值或異常值; 樣本含量不夠,或自變量數(shù)太多; 自變量的觀察范圍太窄,或方差太小; 自變量之間 存在共線性 。當(dāng) VIFi很大時(shí) ,表明自變量間存在多重共線性。 不同嶺參數(shù)時(shí)各自變量的回歸系數(shù) K RSQ X1 X2 X3 VIF_1 VIF_2 VIF_3 .000 .975 .751090 .010 .959 .607980 .657896 .020 .954 .426266 .616119 .030 .952 .363391 .026211 .584518 .040 .951 .333852 .077547 .558977 .050 .949 .317746 .111300 .537699 .060 .948 .308130 .135457 .519612 .070 .947 .302021 .153711 .503999 .9648 .8881 .080 .946 .297930 .168027 .490351 .8319 .7639 .090 .946 .295087 .179562 .478294 .7294 .6689 .100 .945 .293032 .189047 .467544 .6482 .5940 嶺跡圖 嶺跡圖K.1 0 7 5 2 50 . 0 0 0嶺回歸系數(shù)2 . 3 9 3 51 . 2 5 6 2.1 1 8 9 1 .0 1 8 4 2 .1 5 5 7X 3 w i t h KX 2 w i t h KX 1 w i t h K B SE(B) Beta T=B/SEB X1 .236110 .049566 .333852 .000078 X2 .077659 .068015 .077547 .134251 X3 .005561 .001041 .558977 .000022 常數(shù)項(xiàng) .000000 .000038 。其取值在 0~ 1之間, Tol越接近 1,說明自變量間的共線性越弱; Tol越接近 0,說明自變量間的共線性越強(qiáng)。 懷疑 3個(gè)自變量之間 存在共線性 。 指標(biāo)的量化(二) ( 2)多分類指