【正文】
Co e f f ic ie n tst S ig .例題分析 首先剔除 , 用 與其余 11個(gè)自變量作回歸 1x y61 依次剔除對(duì) y影響不顯著的自變量 , 最終方程中只 保留 3 8 9 1 1, , ,x x x xS ta n d a r d iz e d C o e f f ic ie n tsB S td . E r r o r B e ta( C o n s ta n t) 2 0 1 . 6 9 0 1 0 1 . 9 9 8 1 . 9 7 7 0 . 0 5 9X3 3 . 6 1 6 0 . 8 1 3 0 . 8 2 1 4 . 4 4 8 0 . 0 0 0X8 2 1 . 6 2 8 7 . 3 4 0 0 . 7 3 0 2 . 9 4 6 0 . 0 0 7X9 2 7 . 8 6 1 4 . 2 2 8 1 . 6 6 8 6 . 5 8 9 0 . 0 0 0X 1 1 1 7 . 2 4 8 2 . 7 7 7 1 . 2 7 7 6 . 2 1 2 0 . 0 0 0a . D e p e n d e n t Va r ia b le : YCo e f f i c i e n t s ( a) U n s ta n d a r d iz e d C o e f f ic ie n tst S ig .62 在一元線性回歸中 , 回歸系數(shù)顯著性的 t檢驗(yàn) 與回歸方程顯著性的 F檢驗(yàn)是等價(jià)的 , 而在多 元線性回歸中 , 這兩種檢驗(yàn)是不等價(jià)的 。 樣本數(shù)據(jù)的標(biāo)準(zhǔn)化公式為 , 1 , 2 , , 。 2 , ,2( , , ) ( , , , )( , , )ppyppS S E x x S S E x x xrS S E x x??偏決定系數(shù)與回歸系數(shù)顯著性檢驗(yàn)的偏 F值是 等價(jià)的 76 偏相關(guān)系數(shù)反映的是變量間的相關(guān)性,因而并 不需要處于特殊地位的變量 y, 可以對(duì)任意變 量 定義它們之間的偏相關(guān)系數(shù);記 12, , , px x xijiji i j jLrLL?表示兩個(gè)變量 之間的簡(jiǎn)單相關(guān)系數(shù) , 則在 除去 的影響后 , 之間的 偏相關(guān)系數(shù) 為 ,ijxx3 , pxx 12,xx偏相關(guān)系數(shù) 77 說明 :簡(jiǎn)單相關(guān)系數(shù)只是兩個(gè)變量局部的相關(guān) 性質(zhì) , 而并非整體性質(zhì) 。 4 , ,()( 1 ) ( 1 )p p ppppr r rrrr????78 本章總結(jié) 結(jié)合實(shí)例介紹多元回歸模型的建立過程: (1) 提出因變量與自變量 , 搜集數(shù)據(jù); (2) 作相關(guān)分析 , 設(shè)定理論模型;用 SPSS計(jì) 算增廣相關(guān)陣; (3) 用 SPSS計(jì)算回歸分析結(jié)果; 回歸方程: 復(fù)相關(guān)系數(shù): 方差分析表: 回歸系數(shù)的顯著性檢驗(yàn): (4) 回歸應(yīng)用 。 3 , , 2213 。 12, , ,y x x, px74 二元線性回歸模型為 0 1 1 2 2i i iy x x? ? ? ?? ? ? ?記 是模型中含有自變量 時(shí) 的殘差平 方和 , 是模型中含有 和 時(shí) 的殘 差平方和;因此 , 模型中已含有 時(shí) , 再加入 使 的剩余變差的相對(duì)減少量為 2()S S E x 2x y12( , )S S E x x 1x 2x y2x1x y2 2 1 21 。 少了一個(gè)未知參數(shù) , 減少工作量 。 變差來源于兩個(gè)方面 ■ 由于自變量 x 的取值不同造成的 ■ 除 x 以外的其他因素 (如 x對(duì) y的非線性影響 、測(cè)量誤差等 )的影響 2. 對(duì)一個(gè)具體的觀測(cè)值來說 , 變差的大小可以通過該實(shí)際觀測(cè)值與其均值之差 來表示 yy?44 變差的分解 (圖示 ) x y y ???? xy 10 ??? ??yy ? { } } yy ??yy??? ),( ii yx45 離差平方和的分解 (三個(gè)平方和的關(guān)系 ) SST = SSR + SSE ? ? ? ? ? ?2 2 21 1 1? ?n n ni i i ii i iy y y y y y? ? ?? ? ? ? ?? ? ?總平方和 (SST) { 回歸平方和 (SSR) 殘差平方和 (SSE) { { 46 離差平方和的分解 (三個(gè)平方和的意義 ) 1. 總平方和 (SST) ? 反映因變量的 n 個(gè)觀察值與其均值的總離差 2. 回歸平方和 (SSR) ? 反映自變量 x 的變化對(duì)因變量 y 取值變化的影響 , 或者說 , 是由于 x 與 y 之間的線性關(guān)系引起的 y 的取值變化 , 也稱為可解釋的平方和 3. 殘差平方和 (SSE) ? 反映除 x 以外的其他因素對(duì) y 取值的影響 ,也稱為不可解釋的平方和或剩余平方和 47 多重判定系數(shù) 48 多重判定系數(shù) (multiple coefficient of determination) 1. 回歸平方和占總平方和的比例 2. 計(jì)算公式為 3. 因變量取值的變差中 , 能被估計(jì)的多元回歸方程所解釋的比例 稱 為 關(guān)于 的樣本復(fù)相關(guān)系數(shù) R ypxxx , 21 ?49 修正多重判定系數(shù) (adjusted multiple coefficient of determination) 1. 用樣本容量 n和自變量的個(gè)數(shù) p去修正 得到 2. 計(jì)算公式為 3. 避免增加自變量而高估 4. 意義與 類似 5. 數(shù)值小于 ? Excel 輸出結(jié)果的分析 50 估計(jì)標(biāo)準(zhǔn)誤差 Sy 1. 對(duì)誤差項(xiàng) ?的標(biāo)準(zhǔn)差 ? 的一個(gè)估計(jì)值 2. 衡量多元回歸方程的擬合優(yōu)度 3. 計(jì)算公式為 ? Excel 輸出結(jié)果的分析 51 顯著性檢驗(yàn) 線性關(guān)系檢驗(yàn) 回歸系數(shù)檢驗(yàn)和推斷 52 線性關(guān)系檢驗(yàn) 53 線性關(guān)系檢驗(yàn) 1. 檢驗(yàn)因變量與所有自變量之間的線性關(guān)系是否顯著 2. 也被稱為 總體的顯著性 檢驗(yàn) 3. 檢驗(yàn)方法是將回歸離差平方和 (SSR)同剩余離差平方和 (SSE)加以比較 , 應(yīng)用 F 檢驗(yàn) 來分析二者之間的差別是否顯著 ? 如果是顯著的 , 因變量與自變量之間存在線性關(guān)系 ? 如果不顯著 , 因變量與自變量之間不存在線性關(guān)系 54 線性關(guān)系檢驗(yàn) 1. 提出 假設(shè) ? H0: ?1??2??? ?p=0 線性關(guān)系不顯著 ? H1: ?1, ?2, ? , ?p至少有一個(gè)不等于 0 2. 計(jì)算 檢驗(yàn)統(tǒng)計(jì)量 F 3. 確定 顯著性水平 ?和分子自由度 p、 分母自由度 np1找出臨界值 F ? 4. 作出 決策:若 FF ?, 拒絕 H0 ? Excel 輸出結(jié)果的分析 55 M o d e l S u m o f S q u a r e s df M e a n S q u a r e F S ig .R e g r e s s io n 1 1 , 6 8 7 , 1 0 2 . 9 1 8 12 9 7 3 , 9 2 5 . 2 4 3 1 0 . 4 9 2 0 . 0 0 0R e s id u a l 1 , 6 7 0 , 9 3 5 . 7 9 2 18 9 2 , 8 2 9 . 7 6 6T o tal 1 3 , 3 5 8 , 0 3 8 . 7 1 0 30A N O V A ( b )1a . P r e d icto r s : ( Co n s tan t) , X 1 2 , X 1 0 , X 1 , X 2 , X 4 , X 6 , X 1 1 , X 3 , X 8 , X 9 , X 7 , X 5b . D e p e n d e n t Va r ia b le : Y例題分析 對(duì)例 56 回歸系數(shù)檢驗(yàn)和推斷 57 回歸系數(shù)的檢驗(yàn) 1. 線性關(guān)系檢驗(yàn)通過后 , 對(duì)各個(gè)回歸系數(shù)有選擇地進(jìn)行一次或多次檢驗(yàn) 2. 對(duì)每一個(gè)自變量都要單獨(dú)進(jìn)行檢驗(yàn) 3. 應(yīng)用 t 檢驗(yàn)統(tǒng)計(jì)量 58 回歸系數(shù)的檢驗(yàn) (步驟 ) 1. 提出假設(shè) ? H0: ?i = 0 (自變量 xi 與 因變量 y 沒有線性關(guān)系 ) ? H1: ?i ? 0 (自變量 xi 與 因變量 y有線性關(guān)系 ) 2. 計(jì)算檢驗(yàn)的統(tǒng)計(jì)量 t 3. 確定顯著性水平 ?,并進(jìn)行決策 ? ? t?t???, 拒絕 H0; ? t?t???, 不能拒絕 H0 ? Excel 輸出結(jié)果的分析 59 例題分析 對(duì)于例 , 由 F檢驗(yàn)知回歸方 程的整體是顯著的 , 這種顯著是 12個(gè)自變量作為一個(gè) 整體對(duì)因變量 y有十分顯著的影響;并不是每個(gè)自變量 對(duì) Y都有顯著影響 。 第三產(chǎn)業(yè)由 12個(gè)組成部分 , 分別是 農(nóng)林牧漁服務(wù)業(yè) , 地質(zhì) 勘探水利管理業(yè) , 交通運(yùn)輸倉儲(chǔ)和郵電通信業(yè) , 批發(fā)零售貿(mào)易和餐飲業(yè) , 金融保險(xiǎn)業(yè) , 房地產(chǎn)業(yè) , 社會(huì)服務(wù)業(yè) , 衛(wèi)生體育和社會(huì)福利業(yè) , 教育文 化藝術(shù)和廣播 , 科學(xué)研究和綜合藝術(shù) , 黨政機(jī)關(guān) , 其他行業(yè) 。 12, , , px x x??2??( ) 0E ? ?7 多元回歸模型 (基本假定 ) 解釋變量 是確定性變量, , 是滿秩矩陣 ■ 正態(tài)分布的假定 12, , , px x x1np?? X212( 0 , ), , ,inN??? ? ????? 相互獨(dú)立 8 多元回歸方程 (multiple regression equation) 1. 描 述因變量 y 的平均值或期望值如何依賴于自變量 的方程 2. 多 元線性回歸方程的形式為 : ? 稱為回歸系數(shù) ? 表示假定其他變量不變 , 當(dāng) 每變動(dòng)一個(gè)單位時(shí) , y 的平均變動(dòng)值 ()iiEyx?? ??0 1 1 2 2() ppE y x x x? ? ? ?? ? ? ? ?12, , , px x x01, , , , p? ? ?i? ix9 二元回歸方程的直觀解釋 二元線性回歸模型 ???? ???? 22110 xxy(觀察到的 y) 22110)( xxyE ??? ???回歸面 ?0 ?i x1 y x2 (x1,x2) } 10 如果我們獲得 n組觀測(cè)數(shù)據(jù) 12(