【正文】
Lilliefor正態(tài)性檢驗(yàn) K-S正態(tài)性檢驗(yàn) 擬合優(yōu)度檢驗(yàn) Wilcoxon符號(hào)秩檢驗(yàn) 單樣本推斷 ? 單一總體位置的 點(diǎn)估計(jì),置信區(qū)間估計(jì) 和 假設(shè)檢驗(yàn) 是參數(shù)統(tǒng)計(jì)推斷的基本內(nèi)容 ? 在經(jīng)典統(tǒng)計(jì)中,人們關(guān)心 總體均值(位置變量,描述總體的“中心”位置); 方差、標(biāo)準(zhǔn)差和極差(關(guān)于數(shù)據(jù)散步的參數(shù),描述總體的“尺度”的變量) ? 在非參數(shù)統(tǒng)計(jì)中,我們也關(guān)心 數(shù)據(jù)所包含的關(guān)于總體的位置和尺度的信息: ( a)對(duì)總體位置參數(shù)的推斷:均值、中位數(shù)、眾數(shù)、分位數(shù) ( b)數(shù)據(jù)的走勢(shì)或走向,或者看一下這些數(shù)目是否完全是隨機(jī)的 在以前我們接觸的統(tǒng)計(jì)方法中,得到一個(gè)樣本,很自然的想知道它的“平均水平”是多少,這就涉及到統(tǒng)計(jì)中對(duì)總體的均值、中位數(shù)、眾數(shù)等位置參數(shù)的推斷。 nsXt ??? 如果總體是均值為 μ 正態(tài)分布時(shí),一個(gè)典型方法就是 t檢驗(yàn),它的檢驗(yàn)統(tǒng)計(jì)量定義為: 其中, s為樣本標(biāo)準(zhǔn)差,為樣本均值。這時(shí)就要考慮使用非參數(shù)方法了。 ? t檢驗(yàn)統(tǒng)計(jì)量是用樣本標(biāo)準(zhǔn)差 s 代替了標(biāo)準(zhǔn)正態(tài)分布的總體標(biāo)準(zhǔn)差 之后而產(chǎn)生的。 ? 符號(hào)檢驗(yàn)雖然是最簡(jiǎn)單的非參數(shù)檢驗(yàn),但它體現(xiàn)了非參數(shù)統(tǒng)計(jì)的一些基本思路。如果排除樣本中等于 Me的點(diǎn),該概率應(yīng)該為 。這顯然是一系列伯努利( Bernoulli)試驗(yàn)。 ?S?S?S?S{}1 inX M eiSI? ??? ? {}1 inX M eiSI? ??? ?令 以例題 1(樓盤價(jià)格問題)為例理解“符號(hào)檢驗(yàn)的基本原理” 如果假設(shè)問題的結(jié)構(gòu)是一般連續(xù)分布,將 37(百元)理解為總體的中位數(shù),則假設(shè)檢驗(yàn)問題表示為: 01: 37 : 37H M e H M e? ? ?其中 Me 是總體的中位數(shù)。 ?S? 同樣的,在零假設(shè)和獨(dú)立同分布的隨機(jī)抽樣的條件下,也有 ? ?~ , b n?下面給出規(guī)范的符號(hào)檢驗(yàn)推斷過程: 假設(shè) Me是總體的中位數(shù),對(duì)于假設(shè)檢驗(yàn)問題: 0 0 1 0::H M e M H M e M? ? ?其中 M0是待檢驗(yàn)的中位數(shù)值。 單邊檢驗(yàn): 右側(cè)檢驗(yàn) 左側(cè)檢驗(yàn) 0 0 1 0::H M e M H M e M? ? ?0 0 1 0::H M e M H M e M? ? ?0 0 1 0::H M e M H M e M? ? ?雙邊檢驗(yàn): 類似地,給出單邊假設(shè)檢驗(yàn)問題的結(jié)果 : 其中 c 是滿足上式的最小值 0 0 1 0::H M e M H M e M? ? ?0 0 1 0::H M e M H M e M? ? ?? ?, 0 .5P S c n p ?? ?? ? ?? ?, 0 .5P S k n p ?? ?? ? ?或 其中 k 是滿足上式的最大值 單邊符號(hào)檢驗(yàn)問題 0 0 1 0::H M e M H M e M? ? ?0 0 1 0::H M e M H M e M? ? ?? ?, 0 .5P S k n p ?? ?? ? ?? ?, 0 .5P S k n p ?? ?? ? ?對(duì)于符號(hào)檢驗(yàn),使用檢驗(yàn)的 p值 進(jìn)行檢驗(yàn)將會(huì)比較簡(jiǎn)單: 單邊符號(hào)檢驗(yàn)問題 0 0 1 0::H M e M H M e M? ? ?0 0 1 0::H M e M H M e M? ? ?? ? ? ?~ , 0 .5P K s K b n?? , 其 中? ? ? ?~ , 0 .5P K s K b n?? , 其 中0 0 1 0::H M e M H M e M? ? ?雙邊符號(hào)檢驗(yàn)問題 ? ? ? ?? ? ? ?2 ~ , / 2=2 ~ , / 2P K s K b n S npP K s K b n S n??? ? ? ???? ? ???, 其 中 當(dāng) 時(shí)值, 其 中 當(dāng) 時(shí)? ? ? ?m in , . =K S S K k p P K k??? ? ?或 者 寫 成 其 中 的 值 是 , 則 有 值 2? 右側(cè)檢驗(yàn)思路: ? 對(duì)于檢驗(yàn)假設(shè) ,當(dāng) 很大時(shí)(即很多觀察值大于 M0),基于零假設(shè)的概率,即 p值,也不大。如果上述概率小于指定的顯著性水平,就可以拒絕零假設(shè)。 S?? 在顯著性水平 下,檢驗(yàn)的拒絕域?yàn)椋? 其中, ? Sc? ?** 1in f { : ( ) }2nnicncci ???????????? p值還可以通過 Excel中的函數(shù) Binomdist(S+- 1,n, p,t/F)計(jì)算。 ? 與參數(shù)的假設(shè)檢驗(yàn)相同,也可以計(jì)算檢驗(yàn)的 p 值,它等于一分布為二項(xiàng)分布 b(n,1/2) 的隨機(jī)變量大于等于 的概率: ?s? ?P K s ??? ?~ , 0. 5K b n其 中? 判別規(guī)則為: p 值大于 ,則不能拒絕零假設(shè)。 ??? 左側(cè)檢驗(yàn)思路: ? 對(duì)于檢驗(yàn)假設(shè) ,當(dāng) 很小時(shí) (即只有少數(shù)觀察值大于 M0),基于零假設(shè)的概率,即 p值,也不大。如果上述概率小于指定的顯著性水平 ,就可以拒絕零假設(shè)。 S??? 在顯著性水平 下,檢驗(yàn)的拒絕域?yàn)椋? 其中, ? Sd? ?**11s u p { : ( ) }2dninddi ???????????? p 值還可以通過 Excel中的函數(shù) Binomdist(S+,n,p,t/F)計(jì)算。 ? 與參數(shù)的假設(shè)檢驗(yàn)相同,也可以計(jì)算檢驗(yàn)的 p 值,它等于一分布為二項(xiàng)分布 b(n,1/2) 的隨機(jī)變量 小于等于 的概率: ?s? ?P K s ??? ?~ , 0. 5K b n其 中? 判別規(guī)則為: p 值大于 ,則不能拒絕零假設(shè)。 ??? 雙側(cè)檢驗(yàn)思路: ? 對(duì)于假設(shè)檢驗(yàn) ,當(dāng) 不很大或不很小時(shí),不能拒絕零假設(shè)。當(dāng) ,它等于二項(xiàng)分布 b(n,1/2)的隨機(jī)變量大于 的概率的 2倍: /2Sn? ? ?S? ?2 P K s ??? ?~ , 0. 5K b n其 中? 當(dāng)