【文章內(nèi)容簡介】
定義為 , 統(tǒng)計(jì)量 取該值或更極端的值 的概率等于 a。 也就是說 ,“ 統(tǒng)計(jì)量的實(shí)現(xiàn)值比臨界值更極端 ”等價于 “ p值小于 a”。 使用臨界值的概念進(jìn)行的檢驗(yàn)不計(jì)算 p值 。 只比較統(tǒng)計(jì)量的取值和臨界值的大小 。 167。 假設(shè)檢驗(yàn)的過程和邏輯 ? 使用臨界值而不是 p值來判斷拒絕與否是前計(jì)算機(jī)時代的產(chǎn)物 。 當(dāng)時計(jì)算 p值不易 ,只采用臨界值的概念 。 但從給定的 a求臨界值同樣也不容易 , 好在習(xí)慣上僅僅在教科書中列出相應(yīng)于特定分布的幾個有限的a臨界值 ( 比如 a=, a=, a=,a=, a= ) , 或者根據(jù)分布表反過來查臨界值 ( 很不方便也很粗糙 ) 。 ? 現(xiàn)在計(jì)算機(jī)軟件大都不給出 a和臨界值 ,但都給出 p值和統(tǒng)計(jì)量的實(shí)現(xiàn)值 , 讓用戶自己決定顯著性水平是多少 。 167。 假設(shè)檢驗(yàn)的過程和邏輯 ? 在一些統(tǒng)計(jì)教科書中會有不能拒絕零假設(shè)就 “ 接受零假設(shè) ” 的說法 。 這種說法是不嚴(yán)格的 。 ? 首先 , 如果你說 “ 接受零假設(shè) ” , 那么就應(yīng)該負(fù)責(zé)任地提供接受零假設(shè)時可能犯第二類錯誤的概率 。 這就要算出在備選假設(shè)正確的情況下錯誤接受零假設(shè)的概率 。 但是 , 這只有在備選假設(shè)僅僅是一個與零假設(shè)不同的確定值 ( 而不是范圍 ) 時才有可能 。 ? 多數(shù)基本統(tǒng)計(jì)教科書的備選假設(shè)是一個范圍而根本無法確定犯第二類錯誤的概率 。 167。 假設(shè)檢驗(yàn)的過程和邏輯 ? 在許多統(tǒng)計(jì)教科書中 , 往往把一系列不能拒絕零假設(shè)的檢驗(yàn)當(dāng)成接受這些假設(shè)的通行證 。 ? 比如不能拒絕某樣本的正態(tài)性就變成了證明了該樣本是正態(tài)的等等 。 ? 不能拒絕這些零假設(shè) , 僅僅說明根據(jù)所使用的檢驗(yàn)方法 ( 或檢驗(yàn)統(tǒng)計(jì)量 )和當(dāng)前的數(shù)據(jù)沒有足夠證據(jù)拒絕這些假設(shè)而已 。 167。 假設(shè)檢驗(yàn)的過程和邏輯 ? 對于同一個假設(shè)檢驗(yàn)問題 , 往往都有多個檢驗(yàn)統(tǒng)計(jì)量;而且人們還在構(gòu)造更優(yōu)良的檢驗(yàn)統(tǒng)計(jì)量 。 ? 人們不可能把所有的目前存在的和將來可能存在的檢驗(yàn)都實(shí)施 。 ? 因此 , 只能夠說 , 按照目前的證據(jù) ,不足以拒絕零假設(shè)而已 。 后面將會用例子說明 “ 接受零假設(shè) ” 的說法是不妥當(dāng)?shù)?。 167。 對于正態(tài)總體均值的檢驗(yàn) 167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 例 500g重的一包紅糖 , 覺得份量不足 , 于是找到監(jiān)督部門;當(dāng)然他們會覺得一包份量不夠可能是隨機(jī)的 。 于是監(jiān)督部門就去商店稱了 50包紅糖 ( 數(shù)據(jù)在 ) ;其中均值 ( 平均重量 ) 是 ;這的確比 500g少 ,但這是否能夠說明廠家生產(chǎn)的這批紅糖平均起來不夠份量呢 ? 于是需要統(tǒng)計(jì)檢驗(yàn) ??梢援嫵鲞@些重量的直方圖 50包紅糖重量的直方圖 H i s t o g r a m o f S u g a r W e i g h tw e i g h tFrequency490 495 500 5050246810167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 這個直方圖看上去象是正態(tài)分布的樣本 。不妨假定這一批袋裝紅糖有正態(tài)分布 。 ? 由于廠家聲稱每袋 500g( 標(biāo)明重量 ) , 因此零假設(shè)為總體均值等于 500g( 被懷疑對象總是放在零假設(shè) ) ; ? 而且由于樣本均值少于 500g(這是懷疑的根據(jù) ), 把備選假設(shè)定為總體均值少于500g( 備選假設(shè)為單向不等式的檢驗(yàn)稱為單尾檢驗(yàn) ,為不等號 “ ≠” 的稱為雙尾檢驗(yàn) ) 01: 500 : 500HHmm? ? ?167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 檢驗(yàn)統(tǒng)計(jì)量就是第四章引進(jìn)的作為對均值的某種標(biāo)準(zhǔn)化的 ? 符號中的 m0通常表示為零假設(shè)中的均值 ( 這里是 500) 。 在零假設(shè)之下 ,它有自由度為 n1=49的 t分布 。 當(dāng)然實(shí)際上不必代入這個公式去手工計(jì)算了 ,讓計(jì)算機(jī)去代勞好了 。 0/xtsnm??167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 計(jì)算結(jié)果是 t=( 也稱為 t值 ) , 同時得到 p值為 ( 由于計(jì)算機(jī)輸出的為雙尾檢驗(yàn)的 p值 , 比單尾的大一倍 , 應(yīng)該除以2) 。 看來可以選擇顯著性水平為 ,并宣稱拒絕零假設(shè) , 而錯誤拒絕的概率為。 O ne S a m pl e T e s t 2 . 6 9 6 49 . 0 1 0 1 . 6 5 2 8 0 2 . 8 8 4 7 . 4 2 0 9w e i g h tt df S i g . ( 2 t a i l e d )M e a nD i f f e r e n c e L o w e r U p p e r9 5 % C o n f i d e n c eI n t e r v a l o f t h eD i f f e r e n c eT e s t V a l u e = 5 0 05 4 3 2 1 0 1 2 3 4 500 . 0 50 . 10 . 1 50 . 20 . 2 50 . 30 . 3 50 . 4t v a l u eDensity of t(59)T a i l P r o b a b i l i t y f o r t ( 5 9 )t = 2 . 6 9 6p v a l u e = 0 . 0 0 5統(tǒng)計(jì)量 t=尾概率( p值) 167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 上面例子的備選假設(shè)為小于( “ ”) 某個值 。 同樣也可能有備選假設(shè)為均值大于 ( “ ”) 某個值的情況 。 ? 取備選假設(shè)為均值大于或小于某個值的檢驗(yàn)稱為 單尾檢驗(yàn) (onetailed test, 也稱為 單側(cè)檢驗(yàn)或單邊檢驗(yàn) )。 下面舉一個選假設(shè)為均值大于 ( “ ”) 某個值的例子 。 167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 例 ( ) 汽車廠商聲稱其發(fā)動機(jī)排放標(biāo)準(zhǔn)的一個指標(biāo)平均低于 20個單位 。 在抽查了 10臺發(fā)動機(jī)之后 , 得到下面的排放數(shù)據(jù): 、 、 、 、 、 、 、 、 。 該樣本均值為 。 究竟能否由此認(rèn)為該指標(biāo)均值超過 20? 這次的假設(shè)檢驗(yàn)問題就是 01: 2 0 : 2 0HHmm? ? ?167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 和前面的例子的方法類似 , 可以發(fā)現(xiàn) p值為 ( 計(jì)算機(jī)輸出的雙尾檢驗(yàn)的 p值除以 2) , 因此 , 沒有證據(jù)否定零假設(shè) 。這時的檢驗(yàn)統(tǒng)計(jì)量 t=。 也可以畫出類似于圖 ( 圖 ) 這時的 t分布的自由度為 9。 下面是結(jié)果的計(jì)算機(jī)輸出: O ne S a m pl e T e s t1 . 2 3 4 9 . 2 4 9 1 . 1 3 0 0 0 . 9 4 2 2 3 . 2 0 2 2e x ht df S i g . ( 2 t a i l e d )M e a nD i f f e r e n c e L o w e r U p p e r9 5 % C o n f i d e n c eI n t e r v a l o f t h eD i f f e r e n c eT e s t V a l u e = 2 05 4 3 2 1 0 1 2 3 4 500 . 0 50 . 10 . 1 50 . 20 . 2 50 . 30 . 3 50 . 4t v a l u eDensity of t(9)T a i l P r o b a b i l i t y f o r t ( 9 )t = 1 . 2 3 4p v a l u e = 0 . 1 2 4 3t = 1 . 2 3 3 6統(tǒng)計(jì)量 t=尾概率( p值) 167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 注意:在假設(shè)檢驗(yàn)中往往也用帶等號的不等式來表示零假設(shè) , 比如上述的檢驗(yàn)記為 ? 但這里用于計(jì)算 p值的零假設(shè)還是m=20;但如果能夠拒絕零假設(shè) m=20,那么對于任何 m小于 20的零假設(shè)就更有理由拒絕了 。 這和以拒絕零假設(shè)為初衷的假設(shè)檢驗(yàn)思維方式是一致的 。 01: 2 0 : 2 0HHmm? ? ?167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 還有所謂的 雙尾檢驗(yàn) (two tailed test,也稱為 雙側(cè)檢驗(yàn) 或 雙邊檢驗(yàn) )問題 , 即 ? 在這種情況下 , 尾概率不僅是左邊或右邊的一個尾概率 , 而是兩邊尾概率之和 。 因此如果是一個單尾檢驗(yàn)問題 ,用了雙尾檢驗(yàn)的模式 , p值就比用單尾檢驗(yàn)時大了一倍 。 0 0 1 0::HHm m m m? ? ?167。 根據(jù)一個樣本對其總體均值大小進(jìn)行檢驗(yàn) ? 如果上面發(fā)動機(jī)排放指標(biāo)例子的檢驗(yàn)問題改為是否該發(fā)動機(jī)的排放指標(biāo)均值等于 20。 即 ? 這時 t統(tǒng)計(jì)量還是取原來的值 ,但 p值為 2=。 圖 變成圖 01: 2 0 : 2 0HHmm? ? ?5 4 3 2 1 0 1 2 3 4 500 . 0 50 . 10 . 1 50 . 20 . 2 50 . 30 . 3 50 . 4t v a l u eDensity of t