【正文】
SPSS線性回歸 回歸( Regression,或 Linear Regression)和相關(guān)都用來分析兩個定距變量間的關(guān)系,但回歸有明確的因果關(guān)系假設(shè)。即要假設(shè)一個變量為自變量,一個為因變量,自變量對因變量的影響就用回歸表示。如年齡對收入的影響。由于回歸構(gòu)建了變量間因果關(guān)系的數(shù)學(xué)表達(dá),它具有統(tǒng)計預(yù)測功能。 一、回歸的原理 線性回歸的統(tǒng)計原理: 兩個定距變量的回歸是用函數(shù) y= f( x) 來分析的。我們最常用的是一元回歸方程 bxay ??其中 x為自變量; y為因變量; a為截距,即常量; b為回歸系數(shù),表明自變量對因變量的影響程度。 3603703803904004104204304400 1 2 3 4 5工齡工資Y=350+20x 在統(tǒng)計學(xué)中,這一方程中的系數(shù)是靠 x與 y變量的大量數(shù)據(jù)擬合出來的。 X Y Y=a+bx ( x, y) 由圖中可以看出,回歸直線應(yīng)該是到所有數(shù)據(jù)點(diǎn)最短距離的直線。該直線的求得即使用“最小二乘方法”,使 : ? ? 0? 2 ??? ii yy在擬合的回歸直線方程中,回歸系數(shù): ??????2)())((xxyyxxiiib表示 x每變化一個單位時, x與 y共同變化的程度。 xbya ??常數(shù) : 比如通過上學(xué)年數(shù)和工資的關(guān)系計算得出下列的回歸公式: y=472+ 可知上學(xué)年數(shù)每增長 1年,工資會增加 ; 也可推測,上學(xué)年數(shù)為 15年的人,工資收入應(yīng)為 472 + *15=694元。 二、線性回歸的適用條件 ? 線性趨勢:即自變量與因變量的關(guān)系是線性的。 ? 獨(dú)立性:因變量 Y的取值相互獨(dú)立。反映在方程中即殘差獨(dú)立。 ? 正態(tài)性:即自變量的任何一個線性組合, Y應(yīng)該服從正態(tài)分布。反映在方程中即殘差 Ei服從正態(tài)分布。 ? 方差齊性 :自變量的任何一個線性組合, Y的方差相同。 三、線性回歸菜單簡介 Linear Regression對話框 ? Enter:進(jìn)入法。 默認(rèn)選項。所有所選自變量都進(jìn)入回歸模型,不作任何篩選。 ? Stepwise:逐步法。 根據(jù)在 Option框中設(shè)頂?shù)募{入和排除標(biāo)準(zhǔn)進(jìn)行變量篩選。具體做法是首先分別計算各自變量 X對 Y的貢獻(xiàn)大小,按由大到小的順序挑選貢獻(xiàn)最大的一個先進(jìn)入方程;隨后重新計算各自變量 X對 Y的貢獻(xiàn),引入方程,同時考察已在方程中的變量是否由于新變量的引入而不再有統(tǒng)計意義。如果是,則將它剔除。如此重復(fù),直到方程內(nèi)沒有變量可剔除,方程外沒有變量可引入為止。 ? Remove:剔除法(移去法)。 只出不進(jìn)。注意其篩選以 Block為單位。 ? Backward:向后法。 步驟類逐步法,但只出不進(jìn)。即對已納入方程的變量按對 Y貢獻(xiàn)的由小到大依次剔除,每剔除一個變量,重新計算對 Y貢獻(xiàn)的大小。直到方程中所有變量都符合選入的標(biāo)準(zhǔn)為止。 ? Forward:向前法。 與逐步法類似,但只進(jìn)不出。即對納入方程的變量不再考察它的顯著性。直到方程外變量均達(dá)不到進(jìn)入標(biāo)準(zhǔn),沒有自變量引入方程為止。 變量篩選方法的選擇應(yīng)注意 ? ,不能脫離研究的目的進(jìn)行。 ? ,對不同方法之間所結(jié)果的差異認(rèn)真思考。 Statistics 對話框 Plots 對話框 X軸或 Y軸中有一個是因變量 標(biāo)準(zhǔn)化的預(yù)測值 標(biāo)準(zhǔn)化的殘差 刪除的殘差 修正后的預(yù)測值。 用戶的殘差 用戶的刪除的殘差 輸出帶有正態(tài)曲線的標(biāo)準(zhǔn)化殘差的直方圖。 輸出標(biāo)準(zhǔn)化殘差的正態(tài)概率圖。 對每一個自變量,會產(chǎn)生一個自變量與因變量殘差的散點(diǎn)圖,主要用于回歸診斷。 Options 對話框 如一個變量的 F統(tǒng)計量的 p值是小于 Entry值的,這個變量就進(jìn)入模型。如一個變量的 F統(tǒng)計量的 p值是大于 Removal值的,這個變量就從模型中刪除。 Entry值必須小于 Removal值且都為正。如想模型中有更多的變量就提高 Entry值;如想模型中減少變量就減少 Removal值。 用 F統(tǒng)計量的值,同上 選擇此項不顯示回歸方程中常數(shù)項。 Save 對話框 四、回歸分析的步驟 ? ,觀察變量間的趨勢; ? ,進(jìn)行必要的預(yù)處理; ? ; ? ; ? 。 ?例 1:以 SPSS自帶的數(shù)據(jù)文件 “ 1991 . General Social ”為例分析影響職業(yè)聲望的因素。 H ig h e s t Y e a r o f S ch o o l C o m p le t e d3020220 1 0R39。s Occupational Prestige Score (1980)908070605040302010A g e o f R e s p o n d e n t100806040200R39。s Occupational Prestige Score (1980)908070605040302010H ig h e s t Y e a r S ch o o l C o m p le t e d , Mo t h e r3020220 1 0R39。s Occupational Prestige Score (1980)908070605040302010H ig h e s t Y e a r S ch o o l C o m p le t e d , F a t h e r3020220 1 0R39。s Occupational Prestige Score (1980)908070605040302010H ig h e s t Y e a r S ch o o l C o m p le t e d , S p o u s e3020220 1 0R39。s Occupational Prestige Score (1980)908070605040302010D e s c r i pt i v e S t a t