【正文】
因此,在構(gòu)造一個好的合理的估計量時,必須相當小 心謹慎,在計算和作出估計量方差估計的過程中尤其要注 意,通常大規(guī)模的抽樣調(diào)查就是這種復雜的多階抽樣。 1 , 2, ,i N j M t K???i j t 11 Kij ijttYYK?? ?— 第 初級單元中第 次級單元總體平均數(shù) i j 11 kij ijttyyk?? ?— 第 初級單元中第 次級單元樣本平均數(shù) i j— 第 初級單元總體平均數(shù) i 111 MKi ijtjtMK ??? ??111 mki ijtjtmk ??? ??— 第 初級單元樣本平均數(shù) i 1 1 11 N M Kijti j tN MK ? ? ?? ???—— 總體平均數(shù) 1 1 11 n m kijti j tn m k ? ? ?? ???—— 樣本平均數(shù) 22111 ()1NiiS Y YN???? ?111 ()1niis y yn???2111 ()( 1 )NMij iijS Y YNM?????2111 ()( 1 )nmij iijs y ynm?????31 1 11 ()( 1 )N M Kijt iji j tS Y YN M K? ? ?????31 1 11 ()( 1 )n m kijt iji j ts y yn m k? ? ????? 如果三階抽樣均為簡單隨機抽樣,則有以下結(jié)論: y Y即 是總體平均數(shù) 的無偏估計。 3 三階及多階抽樣 將有關二階抽樣的一些公式與估計推廣到三階乃至更高 階的情況是很現(xiàn)實的,其實基本上是依樣畫葫蘆,只不過在 符號與計算方面更為復雜些,尤其是對于各級單元大小都相 等時更是如此,下面以三階為例。 iiMy 現(xiàn)在考慮初級單元是按不放回不等概率抽取,而第二階 抽取仍為在抽取的初級單元中實行簡單隨機抽樣。 ( 1)初級單元按多項抽樣方法抽取 設初級單元以給定的一組概率 逐個放回地 1( , 1 )NiiiZZ???imim抽取 n 次,在每個被抽中的初級單元里實施容量為 的簡 單隨機抽樣:假若第 i 個初級單元在第一階抽樣中被抽中二 次或二次以上,那么在第 i 個初級單元中將獨立地對全體次 級單元進行二次或二次以上的容量為 的簡單隨機抽樣。 IIyIII 這兩個事實也表明了“無偏性”對于估計量的誤差判斷并 非是決定性的,有時為了使均方誤差小一些,人們寧可放棄 無偏性, 作為有偏估計其效果幾乎不亞于 。 若取 ,則 。 IIyIyiY iM iyiMMIIy Iy(2)不等概率抽取初級單元 用等概率方法抽取初級單元對于大小不等的初級單元情 形顯然不太合理,精度較差是可想而知的。這個估計的 意義很清楚,它的 乘以 成為第 i 個初級單元內(nèi)總和的 估計,再乘以 N 成為總體總和的估計,這個估計除以 作 為 的估計量是合理的。 由于第 i 個抽樣單元是等概率抽取,相當于從盒子 中等可能抽取一次,那么所得之數(shù)一定是這個盒子平均數(shù)的 無偏估計,即 iyiY 1( , , )NYY11() NIiiE y Y YN ?????YY??而 ,那么 不是 的無偏估計,而是有偏估計! YIy Y因此,對 只能求均方誤差: 2 2 221111( ) ( ) ( )NN iiI i iii iiMmMS E y Y Y Y Y SN N M m?? ???? ? ? ? ???作為 的有偏估計, 的均方誤差由三部分構(gòu)成:一是由偏 倚引起的平方和,這就是 ()式右邊的第一項;二是按初級 單元 (此時初級單元的特征指標當然只能是其平均數(shù) )而計算的 總體方差, ()式右邊的第二項恰好體現(xiàn)出這一點;最后一 部分是初級單元中次級單元的方差平方和,這恰好是 ()式 右邊的第三項。因此,我們只能面對初級單元大小不等的情形,由于初級單元大小不一樣,合理的手段是對初級單元采用不等概率抽樣。 21hS22h 21hs22hs顯然,總體總和的分層二階抽樣估計為: 1kst h h hhy N M y?? ?() 其方差及其方差估計為: 2 2 2 21212111( ) ( )k hhst h h h hh h h hffV ar y N M S Sn n m?????? 2 2 2 21 1 21211 ( 1 )( ) ( )k h h hst h h h hh h h hf f fv y N M s sn n m??????在分層二階抽樣中當然也存在最優(yōu)抽樣比的問題,不過此 時假定費用函數(shù)一般應當與“層”有關系: 0 1 1 2 211kkh h h h hhhC c c n c n m??? ? ???() 固定費用 C而使方差達到最小或方差有一定精度要求下使 費用達到最小,此時 的最優(yōu)選擇為: hm2122212hhhhh h hScmcS S M? ??() 其中總假設對所有的 h , 都有 。設第 h 層含 個初級單元, 每個初級單元包含 個次級單元,于是總體中共含有 個次級單元。 optm [ ] 1optmm??optm ? 由 m 的選取,代入 ()或 ()立即可以得到 n 的數(shù)值。但這里要求 。 yY 其方差為: 22121211() ffV ar y S Sn n m????() 其中 , 1nfN?2mfM?方差的無偏估計為: 221 1 2121 ( 1 )() f f fv y s sn n m????() 總體總數(shù) 的估計為: Yy N M y??方差的無偏估計為: 2( ) ( ) ( )v y N M v y??總體平均數(shù) 95%的置信區(qū)間為 ( ( ) , ( ) )y v y y v y? ? ? ?總體總數(shù) 95%的置信區(qū)間為 ( ( ) , ( ) )y v y y v y? ? ? ? 例 : 新華書店某柜臺上月共用去發(fā)票 70本,每本 100張, 現(xiàn)隨機從中抽出 10本,每本隨機抽出 15張發(fā)票,得到數(shù)據(jù) 如下表:給出上月柜臺營業(yè)總額的估計及