【正文】
xXXxnXYV a r ??????????? ????? ?? 202122222 XXXXn XnXx ii?))(( 20222XXn xx ii??? ??? ))(1( 2202 ????ixXXn?故 )))(1(,(~? 2 2020210 ? ???ixXXnXNY ???)2(~)(?0?0100 ???? ntSXYtY?? ))(1(? 2 202?0 ????iY xXXnS ?其中 于是,在 1?的置信度下, 總體均值 E(Y|X0)的置信區(qū)間為 0202 ?00?0?)|(? YY StYXYEStY ?????? ??總體個值預測值的預測區(qū)間 由 Y0=?0+?1X0+? 知 : ),(~ 20210 ??? XNY ?于是 )))(11(,0(~?220200 ?????ixXXnNYY ?)2(~?00?00 ????ntS YYtYY式中 : ))(11(? 2202?00 ??????iYY xXXnS ?從而在 1?的置信度下, Y0的置信區(qū)間 為 00202 ?000?0?? YYYY StYYStY ?? ?????? ??在上述 收入 消費支出 例中,得到的樣本回歸函數為 ii XY 7 7 7 0 3? ??? 則在 X0=1000處, ?0 = –+ 1000= )21501000(10 113402)?( 20 ??????? ???YVa r而 )?( 0 ?YS 因此, 總體均值 E(Y|X=1000)的 95%的置信區(qū)間為: ? E(Y|X=1000) +? 或 ( , ) 同樣地,對于 Y在 X=1000的 個體值 ,其 95%的置信區(qū)間為: ?Yx=1000 + ? 或 (, ) ? 總體回歸函數的 置信帶(域) ( confidence band) ? 個體的 置信帶(域) 對于 Y的總體均值 E(Y|X)與個體值的預測區(qū)間 ( 置信區(qū)間 ) : ( 1) 樣本容量 n越大 , 預測精度越高 , 反之預測精度越低; ( 2) 樣本容量一定時 , 置信帶的寬度當在 X均值處最小 , 其附近進行預測 ( 插值預測 )精度越大; X越遠離其均值 , 置信帶越寬 ,預測可信度下降 。 167。 案例:時間序列問題 一、中國居民人均消費模型 二、時間序列問題 一、中國居民人均消費模型 例 考察中國居民收入與消費支出的關系 。 表 2 . 5 . 1 中國居民人均消費支出與人均 G D P (元 / 人) 年份 人均居民消費 CONS P 人均 GDP GDPP 年份 人均居民消費 CONS P 人均 GDP GDPP 1978 1990 1979 1991 1980 1992 1981 1 993 1982 1994 1983 1995 1984 1996 1985 1997 1986 1998 1987 1999 1988 2021 1989 GDPP: 人均國內生產總值 ( 1990年不變價 ) CONSP: 人均居民消費 ( 以居民消費價格指數 ( 1990=100) 縮減 ) 。 該兩組數據是 1978~2021年的 時間序列數據( time series data) ; 建立模型 擬建立如下一元回歸模型 ?? ??? G D P PCC O N S P采用 Eviews軟件 進行回歸分析的結果見下表 前述 收入 消費支出例 中的數據是 截面數據( crosssectional data)。 表 2 . 5 . 2 中國居民人均消費支出對人均 G D P 的回歸( 1 9 7 8 ~ 2 0 0 0 ) L S / / De p e n d e n t V a r i a b le is C ON S P S a m p le : 1 9 7 8 2 0 0 0 I n c l u d e d o b s e r v a t io n s : 2 3 V a r i a b le C o e f f i c ie n t S t d . E r r o r t S t a ti s ti c P r o b . C 2 0 1 . 1 0 7 1 1 4 . 8 8 5 1 4 1 3 . 5 1 0 6 0 0 . 0 0 0 0 GD P P 1 0 . 3 8 6 1 8 7 0 . 0 0 7 2 2 2 5 3 . 4 7 1 8 2 0 . 0 0 0 0 R s q u a r e d 0 . 9 9 2 7 0 9 M e a n d e p e n d e n t v a r 9 0 5 . 3 3 3 1 Ad j u s t e d R s q u a r e d 0 . 9 9 2 3 6 2 S . D. d e p e n d e n t v a r 3 8 0 . 6 4 2 8 S . E . o f r e g r e s s i o n 3 3 . 2 6 7 1 1 Ak a i k e i n f o c r it e r i o n 7 . 0 9 2 0 7 9 S u m s q u a r e d r e s i d 2 3 2 4 0 . 7 1 S c h wa r z c r it e r i o n 7 . 1 9 0 8 1 8 L o g li k e l ih o o d 1 1 2 . 1 9 4 5 F s t a t is t i c 2 8 5 9 . 2 3 5 Du r b i n W a t s o n s t a t 0 . 5 5 0 2 8 8 P r o b ( F s t a t is ti c ) 0 . 0 0 0 0 0 0 一般可寫出如下回歸分析結果: () () R2= F= DW= 模型檢驗 R2= T值 : C: , GDPP: 臨界值 : (21)= 斜率項: 01,符合 絕對收入假說 預測 2021年: GDPP=(元)( 90年不變價) 點估計: CONSP2021= + ? = (元) 2021年 實測 的 CONSP( 1990年價) :, 相對誤差 : %。 2021年人均居民消費的 預測區(qū)間 人均 GDP的 樣本均值 與 樣本方差 : E(GDPP)= Var(GDPP)== 在 95%的置信度下, E(CONSP2021)的預測區(qū)間 為: ) 6 4 4 1 0)123( )(231(223 3 2 4 2?? ?????? =? 或: ( ,) 同樣地,在 95%的置信度下, CONSP2021的預測區(qū)間 為: ) 6 4 4 1 0)123( ) 8 2 0 3 3(2311(223 3 2 4 7 5 8 2?? ??????? =? 或 ( , ) 二、時間序列問題 上述實例表明,時間序列完全可以進行類似于截面數據的回歸分析。 然而,在時間序列回歸分析中,有兩個需注意的問題: 第一,關于抽樣分布的理解問題。 能把表 抽出的一個樣本嗎? 可決系數 R2,考察被解釋變量 Y的變化中可由解釋變量 X的變化 “ 解釋 ” 的部分。 這里 “ 解釋 ” 能否換為 “ 引起 ” ? 第二,關于 “ 偽回歸問題 ” ( spurious regression problem)。 在現實經濟問題中,對時間序列數據作回歸,即使兩個變量間沒有任何的實際聯系,也往往會得到較高的可決系數,尤其對于 具有相同變化趨勢(同時上升或下降)的變量 ,更是如此。 這種現象被稱為 “ 偽回歸 ” 或 “ 虛假回歸 ” 。