【正文】
1 11 1所有樣本點數(shù)據(jù)代入模型后可寫成如下矩陣形式: C o e f f i c i e n t sa. 3 6 6 1 . 3 6 7 . 2 6 8 . 7 9 1 . 0 4 8 . 0 2 4 . 2 0 9 1 . 9 6 2 . 0 6 2. 0 0 1 . 0 4 9 . 0 0 3 . 0 2 3 . 9 8 2. 0 3 3 . 0 0 4 . 9 5 1 8 . 0 7 9 . 0 0 0 . 6 4 2 1 . 1 3 2 . 0 4 9 . 5 6 8 . 5 7 6. 5 0 7 . 7 5 4 . 0 7 3 . 6 7 2 . 5 0 8( C o n s t a n t )鈣鎂鐵錳銅M o d e l1B S t d . E r r o rU n s t a n d a r d i z e dC o e f f ic i e n t sB e t aS t a n d a r d iz e dC o e f f ic i e n t st S i g .D e p e n d e n t V a r i a b l e : 血紅蛋白a . A N O V Ab1 1 3 . 2 5 9 5 2 2 . 6 5 2 2 6 . 3 0 6 . 0 0 0a1 9 . 8 0 5 23 . 8 6 11 3 3 . 0 6 4 28R e g r e s s i o nR e s i d u a lT o t a lM o d e l1S u m o fS q u a r e s df M e a n S q u a r e F S i g .P r e d i c t o r s : ( C o n s t a n t ) , 銅 , 錳 , 鐵 , 鈣 , 鎂a . D e p e n d e n t V a r i a b l e : 血紅蛋白b . SPSS回歸分析輸出結(jié)果 : H0: β1= β2= … = βm = 0 殘回殘殘回回MSMSSSSSF ????//: H0: βi= 0 bb st b?三、方程的顯著性檢驗: 對整個方程的檢驗: H0: 回歸系數(shù)全為零 β1=β2=…=β m=0 H1: 回歸系數(shù)不全為零 α= F= MSreg/MSE= 自由度 dfreg= 5, dfe= 23, P 拒絕 H0, 接受 H1,認為此回歸模型有意義。 采用最小二乘法( LS)估計回歸系數(shù) b 即要求殘差平方和: 達到最小值。如有明顯的曲線關(guān)系,則不能直接做線性回歸模型。 試以血紅蛋白為因變量 , 其它為自變量 , 建立回歸模型 。 但如果是多分類變量 , 則不能直接進入回歸方程 , 而要先進行啞變量設(shè)置 ( 略 ) 。 數(shù)據(jù)類型要求 因變量必須是數(shù)值型變量(連續(xù)變量)。 殘差 e: y 的變化中不能為自變量所解釋的部分。 eXXY mm ????? ??? ?110樣本回歸模型: mm xbxbxbby ????? ....? 22110偏回歸系數(shù) : b0為常數(shù)項, b1, b2, … , bm為樣本偏回歸系數(shù)。 這里提及的回歸模型中,都只有一個因變量。 一、多重線性回歸模型 多重線性回歸模型可視為簡單直線模型的直接推廣。 第二節(jié) 多重(多元)線性回歸 在醫(yī)學研究中 , 影響某個結(jié)局指標的因素常常有很多個 , 特別對于慢性非傳染性疾病更是如此 , 例如心血管疾病 、 腫瘤等 。 ? 由于對 r進行假設(shè)檢驗的統(tǒng)計量 t值計算公式比較簡便,而且還可以直接查表。 ? r與 b的假設(shè)檢驗結(jié)果一致。 r為正時, b也為正,表示兩變量是正相關(guān),是同向變化。所以,對于兩組新數(shù)據(jù)(兩個變量)可先做散點圖,求出它們的相關(guān)系數(shù),對于確有相關(guān)關(guān)系的變量再進行回歸分析,求出回歸方程。反之也是一樣。 r的絕對值越大,散點圖中的點越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。 回歸是對兩個變量做定量描述,研究兩個變量的數(shù)量關(guān)系,已知一個變量值可以預測出另一個變量值,可以得到定量結(jié)果。研究兩個變量的依存關(guān)系用回歸分析。 ? 回歸是反映兩個變量的依存關(guān)系,一個變量的改變會引起另一個變量的變化,是一種單向的關(guān)系。 4. 變量范圍 相關(guān)分析和回歸方程僅適用于樣本的原始數(shù)據(jù)范圍之內(nèi),超出了這個范圍,我們不能得出兩變量的相關(guān)關(guān)系和回歸關(guān)系。 2. 相關(guān)關(guān)系 相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,并不能證明事物間有內(nèi)在聯(lián)系。 利用回歸方程進行逆估計,即要求因變量 y的容許取值范圍,逆向估計 X的取值范圍。 ? 對于一元線性回歸來說,方差分析與 t檢驗是完全等價的,且有關(guān)系式: Ft ?利用 SPSS實現(xiàn)直線回歸: ? SPSS操作步驟: Analyze Regression Linear dependent: 因變量 independent: 自變量 method: 可選擇 enter forward backward stepwise 點擊 statistics: 出現(xiàn)若干統(tǒng)計選項可供選擇 Continue OK A N O V Ab2 . 5 0 6 1 2 . 5 0 6 1 7 . 1 6 2 . 0 0 0a4 . 2 3 4 29 . 1 4 66 . 7 4 0 30R e g r e s s i o nR e s i d u a lT o t a lM o d e l1S u m o fS q u a r e s df M e a n S q u a r e F S i g .P r e d i c t o r s : ( C o n s t a n t ) , 尿雌三醇( m g / 2 4 h )a . D e p e n d e n t V a r i a b l e : 產(chǎn)兒體重 ( k g )b . C oe f f i c i e nt s a2 . 1 5 2 . 2 6 2 8 . 2 1 4 . 0 0 0. 0 6 1 . 0 1 5 . 6 1 0 4 . 1 4 3 . 0 0 0( C o n s t a n t )尿雌三醇( m g / 2 4 h )M o d e l1B S t d . E r r o rU n s t a n d a r d i z e dC o e f f ic i e n t sB e t aS t a n d a r d i z e dC o e f f ic i e n t st S i g .D e p e n d e n t V a r i a b l e : 產(chǎn)兒體重 ( k g )a . 四、直線回歸的應用 1. 描述兩變量之間的依存關(guān)系 通過回歸系數(shù)的假設(shè)檢驗 ,若認為兩變量之間存在直線回歸關(guān)系 ,則可用直線回歸來描述。 求得 F值后查 F界值表得到 P值,最后按所取 ?水準作出總體回歸關(guān)系是否成立的推斷結(jié)論。 )?()?( YYYYYY ?????(1) 方差分析 因變量 Y的變異的分解 Y的分解: 移項: 考慮全部樣本: 上式用符號表示: )?()?( YYYYYY ?????)?()?( YYYYYY ?????222 )?()?()( YYYYYY ????? ???殘回總 SSSSSS ??SS總 稱為 Y的總離均差平方和 SS回 稱為回歸平方和 SS殘 稱為殘差平方和或剩余平方和 不考慮回歸時, Y的總變異 SS總 全部視為隨機誤差;而回歸以后,回歸的貢獻使得隨機誤差減小為 SS剩 。 ? 總體的回歸系數(shù)一般用 β表示。 Y,X?Y =+ 是否一定能說明雌三醇與產(chǎn)兒體重之間存在回歸關(guān)系? 三、回歸系數(shù)的假設(shè)檢驗 ? 與直線相關(guān)一樣,直線回歸方程也是從樣本資料計算而得的,同樣也存在抽樣誤差問題。 ? 回歸直線一定經(jīng)過( 0, a ),( )。 xxxyllXXYYXXb ???????2)())((XbYa ??bX X Y YX Xa Y b XY a bX X?? ????? ?? ? ? ? ? ?? ? ? ?( )( )( )... . . .?. .241 2677. 420 0613 2 0 061 17 23 2 152 15 0 061 這就是我們求得的二者關(guān)系的回歸方程 從公式可求得: 根