【正文】
前面討論的簡單隨機(jī)抽樣和分層抽樣,我們所關(guān)心的參數(shù)都是單指標(biāo)的,給出的估計量也是線性形式。這一章我們將要討論比較復(fù)雜的情況, 我們關(guān)心的參數(shù) 不再是單指標(biāo)的而是兩個或兩個以上的指標(biāo) 。此時,遇到的 統(tǒng)計量不再是線性形式,往往呈現(xiàn)出非線性形式,比如兩個變量之比,或呈現(xiàn)變量之間的回歸關(guān)系 。 第六章 比估計與回歸估計 所謂回歸關(guān)系就是變量之間的關(guān)系不是確定的,是帶有 隨機(jī)影響的。比如身高和體重的關(guān)系,身高增加時,一般來 說,體重也會增加,但又不能說一定如此。要確定身高和體 重的關(guān)系,一般用回歸的方法。這類問題首先是由英國統(tǒng)計 學(xué)家高爾頓研究兒子的身高與父親身高關(guān)系時提出的,他發(fā) 現(xiàn) 兒子的身高有回到家族平均身高的趨勢 ,因而 把所得關(guān)系 式稱為回歸方程 ,于是回歸的名詞就沿用下來了。 167。 1 比估計及其性質(zhì) 設(shè)有一個二元變量的總體 : ( , )XY1 1 2 2( , ) , ( , ) , , ( , )NNX Y X Y X Y有 4 個參數(shù)是我們所熟悉的: XY、 ———— 指標(biāo) 的平均數(shù) XY、2211 ()1NXiiS X XN???? ?2211 ()1NYiiS Y YN???? ?—— 指標(biāo) 的方差 XY、如果簡單隨機(jī)樣本為 ,則 及 的估計為: ( , ) ( 1 , 2 , , )iix y i n? ( ,C ov X Y? 在研究比估計之前,再引進(jìn)一個新的參數(shù) —— 變量之間 的協(xié)方差: 11( , ) ( ) ( )1NiiiC o v X Y X X Y YN?? ? ?? ?() XY、 之間的 相關(guān)系數(shù) 定義為: ( , )( ) ( )Cov X YV ar X V ar Y? ??1112211( ) ( )( ) ( )NiiiNNiiiiX X Y YX X Y Y??????? ? ? ???? ? ? ?? ? ? ????() 11 ( ) ( )1nx y i iiS x x y yn?? ? ?? ?() 1112211( ) ( )?( ) ( )niiinniiiix x y yx x y y???????? ? ? ???? ? ? ?? ? ? ????() 在討論比估計之前,先考察總體的兩個平均數(shù)之比,即 R Y X?由于 分別是 的無偏估計, 的估計自然定義為 ,xy XY, R?R y x?假如 或 已知,總體平均數(shù) 與總體總和 的比估計 量定義為: X X Y Y?Ryyy R X X Xxx? ? ? ?() ?Ryyy R X X Xxx? ? ? ?() 通常的比估計是指 () 式與 () 式,而 則稱為比值 的 估計。 ?R R由 () 式與 () 式可知, 與 的習(xí)性主要依賴于估計量 ,因此在不少場合,我們常用 來說明。 ?R ?RRy Ry盡管 分別是 的無偏估計,由于 的非線性形式,因 此 關(guān)于 是有偏的,從而 關(guān)于 也是有偏的。 ,xy XY, ?R?R R ,RRyy ,YY一個合理的估計量,應(yīng)該隨著樣本容量 n 的增加,估計量的 期望與參數(shù)之差應(yīng)該越來越小并漸漸趨于零,即“漸近無偏” 比估計是否漸近無偏呢? 利用 Taylor展開式,有 將比估計 表示為: ?R y x??( 1 )yyRxXxXX????2? 1y y x X x XRx X X X?? ??????? ? ? ? ??? ??????21y x X x XX X X?? ??????? ? ??? ??????() 當(dāng) n 相當(dāng)大時, 與 相當(dāng)接近,而 是常數(shù),又 是 的 無偏估計,因此,實(shí)質(zhì)上 ,所以 。 x X X Yy?()E R R??R y X? ()式的好處不單單告訴我們 這一事實(shí),而且告 訴了我們,當(dāng) n 相當(dāng)大時, ,表明 可以表示成 的平均數(shù),因此 的分布可近似正態(tài)分布 ?()E R R??R y X? ?R( 1 , 2 , , )iy X i n? ?R因此,可利用 近似標(biāo)準(zhǔn)正態(tài)分布獲得 的置信區(qū)間 ??()RRVar R? R而 2 2