【正文】
(29) =, 查 t值表, (29) =, 上述計算 t=,由 t所推斷的 P值小于 按 ?= ??,接受 ?? 認為待產婦 24小時內尿中雌三醇濃度與產兒體重之間有正相關關系。 身高與肺活量的簡單相關系數 體重與肺活量的簡單相關系數 身高與體重的簡單相關系數 第一節(jié) 偏相關 一、概念 當有多個變量存在時,為了研究任何兩個變量之間的關系,而使與這兩個變量有聯系的其它變量都保持不變。 二、偏相關系數 偏相關系數是用來衡量任何兩個變量之間的關系的大小。 AnalyzeCorrelationPartial 把分析變量選入 Variable 框 把控制變量選入 Controlling for 框 點擊 Options 點擊 Statistics:選擇 Mean and standard deviation Zeroorder correlation Continue OK 三、 SPSS操作步驟 結 果: D e s c r i pt i v e S t a t i s t i c s1 5 2 . 5 9 3 1 8 . 3 5 5 9 6 292 . 1 8 9 7 . 4 5 1 4 6 293 7 . 1 2 7 6 5 . 5 3 2 7 5 29身高肺活量體重M e a n S t d . D e v i a t io n N身高與肺活量的偏相關系數 (體重為控制變量) P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S Controlling for.. X2 (體重) Y(肺活量) X1(身高) Y (肺活量) .098 ( 0) ( 26) P= . P= .619 X1 (身高) .098 ( 26) ( 0) P= .619 P= . P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S Controlling for.. X1(身高) Y(肺活量) X2(體重) Y .569 ( 0) ( 26) P= . P= .002 X2 .569 ( 26) ( 0) P= .002 P= . 肺活量與體重的偏相關系數 (身高作為控制變量) ? 在待產婦尿中雌三醇含量和產兒體重之間的關系中,知道了二者之間成正相關。 一、回歸方程 二、回歸系數 三、回歸系數的假設檢驗 四、直線回歸的應用 復習: 直線回歸 Linear Regression ? 知道了兩個變量之間有直線相關關系 , 并且一個變量的變化會引起另一個變量的變化 , 這時 , 如果它們之間存在準確 、 嚴格的關系 , 它們的變化可用函數方程來表示 ,叫它們是 函數關系 , 它們之間的關系式叫函數方程 。 ?其任務就是要找出一個變量隨另一個變量變化的直線方程,我們把這個直線方程叫做 直線回歸方程 。 bXaY ???這里兩變量的地位是不同的,其中 X為自變量,可隨機變動亦可人為取值;而 Y被視為依賴于 X而變化的因變量。 b稱為回歸系數 (regression coefficient)或直線的斜率 (slope),表示 X每變化一個單位時,Y平均改變 b個單位。求解 a和 b實際上就是怎樣”找到一條直線使所有數據點與它的平均距離“最近”。 SPSS程序 ? ANALYZEREGRESSION–LINEAR C oe f f i c i e nt s a2 . 1 5 2 . 2 6 2 8 . 2 1 4 . 0 0 0. 0 6 1 . 0 1 5 . 6 1 0 4 . 1 4 3 . 0 0 0( C o n s t a n t )尿雌三醇M o d e l1B S t d . E r r o rU n s t a n d a r d i z e dC o e f f ic i e n t sB e t aS t a n d a r d iz e dC o e f f ic i e n t st S i g .D e p e n d e n t V a r i a b l e : 產兒體重a . 回歸直線的描繪 ? 根據求得的回歸方程,可以在自變量 X的實測范圍內任取兩個值,代入方程中,求得相應的兩個Y值,以這兩對數據找出對應的兩個坐標點,將兩點連接為一條直線,就是該方程的回歸直線。 ? 這兩點可以用來核對圖線繪制是否正確。所以,需要對樣本的回歸系數 b進行假設檢驗,以判斷 b是否從回歸系數為零的總體中抽得。 回歸系數的檢驗方法有兩種: (1) 方差分析 (2) t檢驗 兩種方法是等價的。如果兩變量間總體回歸關系確實存在,回歸的貢獻就應當大于隨機誤差;大到何種程度時可以認為具有統計意義,可計算如下的 F統計量: 自由度分別是: ν回 = 1, ν殘 = n2 MS回 與 MS殘 分別稱為回歸均方和殘差均方。 殘回殘殘回回MSMSSSSSF ????//( 2) t檢驗: ? H0: β=0 ? H1: β≠0 ? α= 統計量 t的計算公式為: 自由度 ?=n2 bbstb?xxblss ?22)?( 2????? ?nSSnYYs 殘例 1: ? H0: β=0 ? H1: β≠0 ? α= 0 1 ?bs??bt自由度 ?=312=29,查 t界值表, ( 29) =, P,按 ?=,拒絕 H0,接受 H1,認為待產婦 24小時尿中雌三醇含量與產兒體重之間存在直線回歸關系。 2. 利用回歸方程進行預測 把自變量代入回歸方程,對因變量進行估計,并可求出因變量的波動范圍。 五、應用直線相關與回歸的注意事項 (一)注意事項 進行相關回歸分析要有實際意義,不可把毫無關系的兩個事物或現象用來做相關回歸分析。 3. 利用散點圖 對于性質不明確的兩組數據,可先做散點圖,在圖上看它們有無關系、關系的密切程度、是正相關還是負相關,然后再進行相關回歸分析。 (二)相關與回歸的區(qū)別 1. 意義 ? 相關反映兩變量的相互關系,即在兩個變量中,任何一個的變化都會引起另一個的變化,是一種雙向變化的關系。 2. 應用 研究兩個變量的相互關系用相關分析。 3. 性質 相關是對兩個變量之間的關系進行描述,看兩個變量是否有關,關系是否密切,關系的性質是什么,是正相關還是負相關。 4. 相關系數 r與回歸系數 b r與 b的絕對值反映的意義不同。 b的絕對值越大,回歸直線越陡,說明當 X變化一個單位時, Y的平均變化就越大。 (三)相關與回歸的聯系 1. 關系 能進行回歸分析的變量之間存在相關關系。 2. 相關系數 r與回歸系數 b r與 b的符號一致。 r為負時,b也為負,表示兩變量是負相關,是反向變化。對同一資料,可以證明 r與 b假設檢驗的統計量 t值的大小相等,因而結果總是相同的。所以,可用 r的顯著檢驗代替 b的顯著性檢驗。 多重線性回歸分析可以用來發(fā)現影響某個結局變量的多個因素 , 并有可能建立有效的預測模型 。簡單的說,只有一個自變量的線性模型為簡單直線回歸模型,具有兩個以上自變量的線性模型即為多重線性回歸模型。 總體回歸模型: β 0為常數項, β 1 , … ,β m 稱為總體偏回歸系數。 偏回歸系數表示在其它所有自變量固定不變的情況下,某一個自變量變化一個單位時引起因變量 y變化的平均大小。 eyy ?? ? 線性回歸的適用條件: :線性 ——自變量 x與應變量 y之間存在線性關系; :獨立性 ——y值相互獨