【正文】
在簡(jiǎn)單回歸模型: y = b0 + b1x + u b0 , b1被稱為 回歸系數(shù) (regression coefficients )。 隨機(jī)誤差項(xiàng)主要包括下列因素的影響: 1)在解釋變量中被忽略的因素的影響; 2)變量觀測(cè)值的觀測(cè)誤差的影響; 3)模型關(guān)系的設(shè)定誤差的影響; 4)其它隨機(jī)因素的影響。 b1 :衡量了在其他條件不變的情況下,多接受一年教育,工資可以增加多少 . A Simple Assumption 關(guān)于 u的假定 ? 我們假定總體中誤差項(xiàng) u的平均值為零 .: E(u) = 0 () ? 思考:該假定是否具有很大的限制性( restrictive)呢 ? A Simple Assumption 關(guān)于 u的假定 ? If for example, E(u)=5. Then y = (b0 +5)+ b1x + (u5), therefore, E(u’)=E(u5)=0. ? 上述推導(dǎo)說(shuō)明我們總可以通過(guò)調(diào)整 常數(shù)項(xiàng) 來(lái)實(shí)現(xiàn)誤差項(xiàng)的均值為零 , 因此該假定的限制性不大 . Zero Conditional Mean Assumption 條件期望零值假定( ※ ) y = b0 + b1x + u 我們需要對(duì) u和 x之間的關(guān)系做一個(gè)關(guān)鍵假定。則: ? E( Y|x=12):是總體中所有受了 12年教育的工人的平均小時(shí)工資。 . . x1=5 x2 =10 E(y|x) = b0 + b1x y f(y) 給定 x時(shí) y的 條件分布 ? 下標(biāo)的使用慣例: –橫截面數(shù)據(jù)-- i –時(shí)間序列數(shù)據(jù)-- t 例 2: 一個(gè)假想的社區(qū)有 100戶家庭組成,要研究該社區(qū)每月 家庭消費(fèi)支出 Y與每月 家庭可支配收入 X的關(guān)系。這條直線稱為 總體回歸線 。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響 。 即,給定收入水平 Xi ,個(gè)別家庭的支出可表示為兩部分之和 : (*) 01( | )i i i i iY E Y X u X ubb? ? ? ? ?Sample Regression Function, SRF 樣本回歸函數(shù) 問(wèn)題: 能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息? 問(wèn):能否從該樣本估計(jì)總體回歸函數(shù) PRF? 回答:能 例 : 在例 , 表 2 . 1 . 3 家庭消費(fèi)支出與可支 配收入的一個(gè)隨機(jī)樣本 Y 8 00 1 1 0 0 1400 1700 2022 2300 2600 2900 3200 3500 X 594 638 1 1 2 2 1 1 5 5 1408 1595 1969 2078 2585 2530 總體的信息往往無(wú)法掌握,現(xiàn)實(shí)的情況只能是在一次觀測(cè)中得到總體的一個(gè)樣本。 這里將 樣本回歸線 看成 總體回歸線 的近似替代 注意: 01( | )i i i i iY E Y X u X ubb? ? ? ? ? 樣本回歸函數(shù)的隨機(jī)形式 /樣本回歸模型 : 同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式: 由于方程中引入了隨機(jī)項(xiàng),稱為 樣本回歸模型 ( sample regression model) 。 即,根據(jù) 估計(jì) 01( | )Y E Y X u X ubb? ? ? ? ?01? ?? ? ?i i i i iy y u x ubb? ? ? ? ?四個(gè)概念 ? 總體回歸模型 ? 總體回歸函數(shù) ? 樣本回歸模型 ? 樣本回歸函數(shù) 四個(gè)概念 ? 總體回歸模型 ? 總體回歸函數(shù) ? 樣本回歸模型 ? 樣本回歸函數(shù) 01? ?? ? ?i i i i iy y u x ubb? ? ? ? ?01Y X ubb? ? ?01( | )E y x xbb??估計(jì) Deriving the Ordinary Least Squares Estimates 普通最小二乘法的推導(dǎo) 回歸的基本思想是從樣本去估計(jì)總體參數(shù)。 . . . . y4 y1 y2 y3 x1 x2 x3 x4 } } { { u1 u2 u3 u4 x y Population regression line, sample data points and the associated error terms 總體回歸線,樣本觀察點(diǎn)和相應(yīng)誤差 E(y|x) = b0 + b1x Deriving OLS Estimates 普通最小二乘法的推導(dǎo) ? 假定: E(u|x) = E(u) = 0 可以得到: ? Cov(x,u) = E(xu) = 0 since u = y – b0 – b1x, 所以有: E(y – b0 – b1x) = 0 E[x(y – b0 – b1x)] = 0 These are called moment (矩) restrictions Deriving OLS using . 使用矩方法推導(dǎo)普通最小二乘法 矩方法是將總體的矩限制應(yīng)用于樣本中。 Alternate approach to derivation 推導(dǎo)方法二 ? ? ? ????????niiinii xyu121012 ??? bb? 給定一組樣本觀測(cè)值( Xi, Yi)( i=1,2,…n )要求樣本回歸函數(shù)盡可能好地?cái)M合這組值 . ? 普通最小二乘法 ( Ordinary least squares, OLS)給出的判斷標(biāo)準(zhǔn)是:二者之差的平方和最小 ?? ????? n iiin i XYYYQ121021))??(()?( bb方程組( *)稱為 正規(guī)方程組 ( normal equations) ? 為什么不是殘差的其他某個(gè)函數(shù)的最小化? Using Eviews for OLS regressions 使用 Eviews 進(jìn)行 OLS回歸 ? 我們已經(jīng)推導(dǎo)出公式計(jì)算參數(shù)的 OLS估計(jì)值,所幸的是我們不必親手去計(jì)算它們。 – If roe=30, what is the estimated salary? 思考 :兩條線分別代表什么意思? 擬合值和殘差 obsno salar y roe salar y hat uhat 1 1095 1224 129 2 1001 1 165 164 3 1 122 1398 276 4 578 1072 494 5 1368 1219 149 6 1 145 20 1333 188 7 1078 1267 189 8 1094 1265 171 9 1237 1 157 80 10 833 1450 617 11 567 1442 875 12 933 1459 526 13 1339 1237 102 14 937 1375 439 15 201 1 2022 6 Salaryhat是擬合值, uhat是殘差 第二章 簡(jiǎn)單回歸模型( 2) Chapter Outline 本章大綱 ? Definition of the Simple Regression Model 簡(jiǎn)單回歸模型的定義 ? Deriving the Ordinary Least Squares Estimates 推導(dǎo)普通最小二乘法的估計(jì)量 ? Mechanics of OLS OLS的操作技巧 ? Unites of Measurement and Functional Form 測(cè)量單位和回歸方程形式 ? Expected Values and Variances of the OLS estimators OLS估計(jì)量的期望值和方差 Algebraic Properties of OLS OLS的代數(shù)性質(zhì) ( 1) OLS 殘差和為零 (一階條件 ) ? 因此 OLS 的樣本殘差平均值也為零 . 01111? ?? ( ) 0 ( 2 .3 0 )1?a n d t h u s , 0nnniiiiniiu y xubb???? ? ? ????? Algebraic Properties of OLS OLS的代數(shù)性質(zhì) ( 2)回歸元(解釋變量)和 OLS殘差之間的樣本協(xié)方差為零 (一階條件 ) 1 ? 0 ( 2 . 3 1 )n iii xu? ?? ( 3) OLS回歸線總是通過(guò)樣本的均值。 SST, SSR and SSE ? y 的總變動(dòng)可以表示為已解釋的變動(dòng) SSE和 未解釋的變動(dòng) SSR之和,即 ? SST=SSE+SSR 證明 SST = SSE + SSR ? ? ? ? ? ?? ?? ? ? ?? ?? ?222220 1 0 1? ?? ?? ? ? ?2? ? S S R 2 S S E? ? ? ? ? ? ? ? ? ? ?? ? ?( ) 0i i i iiii i i iiii i i i i i ii i i i iy y y y y yu y yu u y y y yu y yu y y u y y u u yu x u u xb b b b? ? ? ? ?????? ? ?????? ? ? ? ?? ? ? ?? ? ? ?? ? ? ????? ? ??? ? ? ?? ? ?=GoodnessofFit 擬合優(yōu)度 ? 我們?nèi)绾魏饬繕颖净貧w線是否很好地?cái)M合了樣本數(shù)據(jù)呢 ? 2 1S S E S S RRS S T S S T? ? ?稱 R2 為 (樣本) 判定系數(shù) ( coefficient of determination)。意 味 著 薪 水 變 異 中 還 有 % 懸 而 未 決 。 在簡(jiǎn)單回歸中加入非線性 ? 線性關(guān)系并不適合所有的經(jīng)濟(jì)學(xué)運(yùn)用 ? 然而,通過(guò)對(duì)因變量和自變量進(jìn)行恰當(dāng)?shù)亩x , 我們可以在簡(jiǎn)單回歸分析中非常容易地處理許多 y和 x之間的非線性關(guān)系 . The Natural Logarithm 自然對(duì)數(shù) l og( )yx?1 2 1 21 2 1 2l og( ) l og( ) l og( )l og( / ) l og( ) l og( )l og( ) l og( )cx x x xx x x xx c x?????l og ( 1 )xx?? 0for x ?1 0 1 0 0 0l og( ) l og( ) ( ) / /x x x x x x x? ? ? ? ?01 0 0 * l o g % 1 0 0 ( x )xxx x???? ? ? ????= 的 百 分 比 變 化Loglog 形式,彈性 011111l og l ogl og l og100 l og 100 l og%%xy/ l og/ l ogy x uyxyxyxy x y y yx y x x xbbbbbb? ? ?? ? ?? ? ? ? ?? ? ?? ? ?? ? ? ?? ? ?的 百 分 比 變 化 引 起 的 的 百 分 比 的 改 變經(jīng) 濟(jì) : 彈 性 =Loglevel形式,半彈性 011111l o gl o g1 0 0 l o g 1 0 0% ( 1 0 0 )xy%100y x uyxyxyxyxbbbbb