【正文】
回歸線上的點(diǎn)與樣本均值離差的平方和 實(shí)際觀測(cè)點(diǎn)與回歸線上的點(diǎn)的離差的平方和 反映因變量的 n 個(gè)觀察值與其均值的總誤差。 反映自變量 x 的變化對(duì)因變量 y 取值變化的影響,或者說(shuō),是由于 x 與 y 之間的線性關(guān)系引起的 y 的取值變化,也稱為可解釋的平方和。 反映除 x 以外的其他因素對(duì) y 取值的影響,也稱為不可解釋的平方和或剩余平方和。 119 167。 樣本可決系數(shù) (coefficient of determination) 22222222?? ()()?11iiiiiiy Y YR S SRTS S y Y YuE S SRTS S y?? ? ??? ? ? ???????或1. 回歸平方和占總離差平方和的比例 2. 對(duì)于一組數(shù)據(jù), TSS是不變的,所以 RSS↑( ↓), ESS↓( ↑)。 3. 反映回歸直線的擬合程度,取值范圍在 [0 , 1] 之間 4. R2 ?1,說(shuō)明回歸方程擬合的越好; R2?0,說(shuō)明擬合的越差。 5. 可決系數(shù)平方根等于相關(guān)系數(shù)。 RSS:舊指回歸平方和( Regression Sum of Squares), 現(xiàn)指殘差平方和( Sum of Squared Residuals) ESS:舊指殘差平方和( Error Sum of Squares (sum of squared errors)), 現(xiàn)指回歸平方和( Explained Sum of Squares) (第 3版教材第 25頁(yè)) 120 121 例題 人均鮮蛋需求量 Y與人均可支配收入 X關(guān)系 可決系數(shù) : (file: li21) 6 7 0 108 4 5 2 0 3 4 5 )111(..)111(..22222??????????????DSE S SDST S SE S ST S ST S SR S SR122 167。 樣本相關(guān)系數(shù)與可決系數(shù)的關(guān)系 ? 從數(shù)值上看: ? 取值范圍: 0 ? R2 ?1, 1 ? r ? 1 。 ? 可決系數(shù)說(shuō)明變量值的總離差平方和可以用回歸線來(lái)解釋的比例;相關(guān)系數(shù)只說(shuō)明兩變量間關(guān)聯(lián)程度及方向; ? 相關(guān)系數(shù)僅考察兩個(gè)變量的相關(guān)程度(對(duì)等),而不考慮因果關(guān)系;而樣本決定系數(shù)則考察的是因果關(guān)系,即由X可以解釋多少 Y。 2Rr ??123 167。 回歸系數(shù) 估計(jì)值的顯著性檢驗(yàn)與置信區(qū)間 167。 回歸參數(shù)估計(jì)值的顯著性檢驗(yàn) 167。 回歸參數(shù)的置信區(qū)間 南開(kāi)大學(xué) 124 ? 根據(jù)樣本信息判斷總體分布是否具有指定特征 ,這個(gè)過(guò)程叫假設(shè)檢驗(yàn)。即 先對(duì)總體的參數(shù) (或分布形式 )提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立。 假設(shè)檢驗(yàn)在統(tǒng)計(jì)模型的顯著性檢驗(yàn)中具有重要意義。 ? 邏輯上運(yùn)用反證法:即先假定假設(shè)成立,然后依據(jù)某種判別準(zhǔn)則看能得出什么樣的結(jié)果。如果得出合理結(jié)果,自然認(rèn)為假設(shè)成立;如果得出不合理結(jié)果,則認(rèn)為假設(shè)不成立。 ? 統(tǒng)計(jì)上依據(jù)小概率原理 :在一次試驗(yàn)中,小概率事件是幾乎不可能發(fā)生。在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)。 假設(shè)檢驗(yàn)的原理 先假定 假設(shè)成立 若是合理結(jié)果 若是不合理結(jié)果 原假設(shè)成立 原假設(shè)不成立 依據(jù)某種判別準(zhǔn)則 看會(huì)得出什么結(jié)果。 125 假設(shè)檢驗(yàn)步驟流程圖 南開(kāi)大學(xué) 126 ? 設(shè) X~N(0, 1) , Y~?2(n) ,且 X 和 Y 相互獨(dú)立,則隨機(jī)變量 ? t 分布是對(duì)稱分布,均值為 0,取值范圍 [∞,+∞]。 ? 樣本容量大于或等于 30時(shí), t 分布接近于標(biāo)準(zhǔn)正態(tài)分布。 ? t 分布是一個(gè)分布族,不同的樣本容量對(duì)應(yīng)不同的 t 分布。 ? 與標(biāo)準(zhǔn)正態(tài)分布相比, t分布的分散程度較大。 t 分布 ~ ( )/Xt t nYn?E(t)=0。 D(t)=n/(n2) 0 南開(kāi)大學(xué) 127 t 分布圖 不同的樣本容量對(duì)應(yīng)不同的自由度,因此對(duì)應(yīng)的 t 分布也不同。 ? 所謂“自由度”就是指可以自由取值的數(shù)據(jù)的個(gè)數(shù),或者指不受任何約束、可以自由變動(dòng)的變量的個(gè)數(shù)。 南開(kāi)大學(xué) 128 t 分布和正態(tài)分布之比較 ? t 分布的極限分布是正態(tài)分布 t(∞)=N(0,1)。 ? 例: 顯著性水平 N(0,1) t(40) t(4) 50% 0 0 0 5% % % 南開(kāi)大學(xué) 129 雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn) (假設(shè)的形式 ) 假設(shè) 研究的問(wèn)題 雙側(cè)檢驗(yàn) 左側(cè)檢驗(yàn) 右側(cè)檢驗(yàn) H0 ? = ?0 ? ? ?0 ? ? ?0 H1 ? ≠?0 ? ?0 ? ?0 130 f (x )9 5 % n o n re j e ct i o n re g i o n2 . 5 % re j e ct i o n re g i o n2 . 5 %re j e ct i o n re g i o n131 f(x )9 5 % n o n r e j e c ti o n reg i o n5 % rej e c ti o n re g i o nf( x )95 % non r ej ec ti on r eg i on5% r ej ec ti on r eg i on132 167。 回歸參數(shù)估計(jì)值的顯著性檢驗(yàn) (1) 提出假設(shè) H0: ?1 = 0; H1: ?1 ? 0 (2) 在 H0成立條件下,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量: (3) 統(tǒng)計(jì)推斷:給定顯著水平,將 t 值與自由度為 (n2)的臨界值 比較 若 ,則拒絕 H0: ?1 = 0 , 即認(rèn)為 X與 Y存在顯著的線性關(guān)系 。 若 , 則不能拒絕 H0: ?1 = 0 ,即 X與 Y之間的線性關(guān)系不顯著。 檢驗(yàn):回歸模型中是否存在線性關(guān)系?這種關(guān)系是顯著的嗎 ? ? ? ? ?111? ~2?t t nS? ? ????2?t2tt??2tt??接受域 H0 tα/2(n2) tα/2(n2) 一般估計(jì)的 ?1不等于零,但應(yīng)檢驗(yàn)這是否具有統(tǒng)計(jì)顯著性。 133 ?t 分布表的使用 3 2 1 1 2 3t?/2 (n) t?/2(n) ? ? ?/2 ?/2 2( 8 ) 1t ?查表:自由度為 8,顯著性水平為 t 統(tǒng)計(jì)量值是多少? 134 例題 人均鮮蛋需求量 Y與人均可支配收入 X關(guān)系 回歸參數(shù)的顯著性檢驗(yàn) : H0: ?1 = 0; H1: ?1 ? 0。在 H0成立條件下, )?(1)?(1111??????????sstH0: ?0 = 0; H1: ?0 ? 0。在 H0成立條件下, 7 0 8 9 6 7 6 6 )?(0)?(0000??????????sstProb=P {| t | | tStatistic | } 檢驗(yàn)結(jié)果: 回歸參數(shù)顯著不為零。 (第 3版教材第 29頁(yè)) 臨界值 (9) = 南開(kāi)大學(xué) 135 P 值 ? p值即概率值。計(jì)算的是當(dāng)統(tǒng)計(jì)量取值大于等于用樣本計(jì)算的統(tǒng)計(jì)量的值的概率。以統(tǒng)計(jì)量 U做雙側(cè)檢驗(yàn)為例,若樣本計(jì)算的統(tǒng)計(jì)量的值用 U0表示,那么 p 值的定義是 P{?U? ? U0}=p ? p值和檢驗(yàn)水平 ?是什么關(guān)系呢? ?是理論的顯著性水平,是人為設(shè)定的。 p值是實(shí)際的顯著性水平,是用樣本計(jì)算出來(lái)的。 ? P值告訴我們: 如果原假設(shè)是正確的話,我們得到得到目前這個(gè)樣本數(shù)據(jù)的可能性有多大,如果這個(gè)可能性很小,就應(yīng)該拒絕原假設(shè)。決策規(guī)則: 若 p值 ?, 拒絕 H0 南開(kāi)大學(xué) 136 雙側(cè)檢驗(yàn)的 P 值 ?/ 2 ?/ 2 Z 拒絕 拒絕 H0值 臨界值 計(jì)算出的樣本統(tǒng)計(jì)量 計(jì)算出的樣本統(tǒng)計(jì)量 臨界值 1/2 P 值 1/2 P 值 137 OLS估計(jì)表達(dá)式: ii XY ??( ) ( ) R2 = , DW=, T=11,( 1988?1998) (file: li21) 臨界值 (9) = 例題 人均鮮蛋需求量 Y與人均可支配收入 X關(guān)系 138 3210121415161718192088 89 90 91 92 93 94 95 96 97 98R e s i d u a l A c t u a l F i t t e d真實(shí)值 擬合值 殘差 . . (file: li21) 分析殘差: 例題 人均鮮蛋需求量 Y與人均可支配收入 X關(guān)系 分析殘差的正態(tài)分布性 139 012345 2 . 5 2 . 0 1 . 5 1 . 0 0 . 5 0 . 0 0 . 5 1 . 0 1 . 5S e r i e s : R E S I DS a m p l e 1 9 8 8 1 9 9 8O b s e r v a t i o n s 1 1M e a n 5 . 2 5 e 1 6M e d i a n 0 . 1 7 0 9 5 8M a x i m u m 1 . 2 4 5 9 2 7M i n i m u m 2 . 0 9 8 3 5 7St d . D e v . 1 . 0 5 8 4 5 8Sk e w n e s s 0 . 4 3 9 9 4 3Ku r t o s i s 2 . 3 5 1 7 1 5J a rq u e Be ra 0 . 5 4 7 4 6 7Pr o b a b i l i t y 0 . 7 6 0 5 3 5140 ( 第 3版 教材第 30頁(yè)) 167。 回歸參數(shù)的置信區(qū)間 還可以利用1??估計(jì) ?1的置信區(qū)間。由于 P {)?(111????s?? t? ( T 2) } = 1 ? 由大括號(hào)內(nèi)不等式得 ?1的置信區(qū)間 )]2(?),2(?[ )?(1)?(111???? TtsTts ???? ?? 其中)?( 1?s是)?(21?s=? ?2)(1XX t2?? 的算術(shù)根 。 — 2 — 2 — 2 141 ?1的置信區(qū)間: ?0的置信區(qū)間: 1?1 () 20 . 0 0 2 4? ( 2 ) 0 . 0 0 5 1 2 . 2 6 0 . 0 0 1 20 . 0 0 7 8s t T????? ? ? ? ? ? ??0?0 () 27 . 6 0 9 7? ( 2 ) 1 0 . 7 6 6 2 2 . 2 6 1 . 3 9 6 71 3 . 9 2 2 7s t T????? ? ? ? ? ? ??( 第 3版 教材第 31頁(yè)) (file: li21) 例題 人均鮮蛋需求量 Y與人均可支配收入 X關(guān)系 142 課堂練習(xí) 假設(shè)有回歸結(jié)果( T=22): 其中括號(hào)內(nèi)為標(biāo)準(zhǔn)差。 分別運(yùn)用顯著性檢驗(yàn)方法和置信區(qū)間方法,針對(duì)雙側(cè)備擇假設(shè)檢驗(yàn) H0: ?1 = 1(顯著性水平 =) )()( tt xy ??143 Performing the Test H0 : ? = 1 H1 : ? ? 1 顯著性檢驗(yàn)法: 置信區(qū)間法: t e s t s t a tSE????? ?$ *( $ ).. .? ??0 5 0 9 1 10 2 5 6 1 1 9 1 7)0 4 ,0 2 (2 5 0 )?(???????? ?? SEt c ri t144 167。 預(yù)測(cè) ? 點(diǎn)預(yù)測(cè) ? 區(qū)間預(yù)測(cè) 145 (第