【正文】
D1 = x 11 x 21 2 x 12 x 22 D2 = x 12 x 22 M M M M i x 1i x 2i Di = x 1i x 2i M M M M n x 1n x 2n Dn = x 1n x 2n 三、配對樣本的 t 檢驗 數(shù)據(jù) 形式 2020/9/15 27 樣本差值均值 樣本差值標(biāo)準(zhǔn)差 自由度 df = n 1 統(tǒng)計量 0DDDtSn?1niiDDn??? 21()1niiDDDSn???D0:假設(shè)的差值 檢驗統(tǒng)計量 2020/9/15 28 從源變量框中選取成對變量移入。配對樣本 T檢驗實際上是先求出每對觀測值之差值,對差值變量求平均。 第三節(jié) 配對樣本 T檢驗 2020/9/15 25 二、 兩配對樣本 T檢驗的實現(xiàn)思路 提出原假設(shè):兩總體均值不存在顯著差異; 選擇檢驗統(tǒng)計量。所謂 配對樣本 ,可以是個案在“前”、“后”兩種狀態(tài)下某屬性的兩種不同特征,也可以是對某事物兩個不同側(cè)面的描述。可看出, P值為 ,所以認(rèn)為均值是不等的。 s T e s t f o rE q u a l i t y o f V a r i a n c e st dfS i g .( 2 t a i l e d )M e a nD i f f e r e n c eS t d . E r r o rD i f f e r e n c e L o w e r U p p e r9 5 % C o n f i d e n c eI n t e r v a l o f t h eD i f f e r e n c et t e s t f o r E q u a l i t y o f M e a n s 從表 54可看出, Equal variances assumed 行是假設(shè)方差相等進行的檢驗,當(dāng)方差相等時考察這一行的結(jié)果;Equal variances not assumed行是假設(shè)方差不等進行的檢驗,當(dāng)方差不等時考察這一行的結(jié)果。 2020/9/15 22 G r o u p S t a t i s t i c s21 1 2 . 6 5 2 9 2 . 0 5 3 1 . 4 4 8 019 1 0 . 1 0 9 5 1 . 6 9 8 9 . 3 8 9 81 ,212HBN M e a nS t d .D e v i a t i o nS t d . E r r o rM e a n結(jié)果分析 表 53 是血紅蛋白值的觀測量個數(shù)、均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤等統(tǒng)計量。 3)在 sex選入 Grouping Variable框中作為檢驗變量。 按 Analyze— Compare Means— IndependentSample T Test順序,打開主對話框。 新電池(日): , , , , , , , , , , , , , 舊電池(日): , , , , , , , , , , 2020/9/15 21 (二) 仍以 [047]的資料來說明,要求檢驗?zāi)猩团t蛋白平均含量是否相等。 2020/9/15 20 三、例題分析 (一) [052] 某一個新的制造過程可以增加電池的使用壽命,假設(shè)電池使用壽命服從正態(tài)分布。 圖 55 IndependentSample T Test的 Options對話框 圖 5— 4 Define Groups 主對話框 分別輸入分組變量的取值條件,如 1為男, 2為女等。 二、完全窗口分析 按 Analyze— Compare Means— IndependentSample T Test順序,打開 Independent Sample T Test主對話框(如圖 53) 2020/9/15 19 在檢驗變量中含有缺失值的觀測將不被計算。 2020/9/15 18 圖 5— 3 獨立樣本 T檢驗主對話框 從源變量框中選取要作檢驗的變量。用戶需要 根據(jù) F檢驗的結(jié)果,自己選擇 t檢驗輸出中的結(jié)果 ,得出最后結(jié)論。 第二節(jié) 獨立樣本 T檢驗 12 2020/9/15 兩個獨立樣本之差的抽樣分布 m 1 s 1 總體 1 s 2 m 2 總體 2 抽取簡單隨機樣樣本容量 n1 計算 X1 抽取簡單隨機樣樣本容量 n2 計算 X2 計算每一對樣本 的 X1X2 所有可能樣本 的 X1X2 m1 m2 抽樣分布 13 2020/9/15 兩個總體均值之差的 檢驗 (s1 s22 已知 ) ? ? 兩個樣本是獨立的隨機樣本 ? 兩個 總體都是正態(tài)分布 ? 若不是正態(tài)分布 , 可以用正態(tài)分布來近似 (n1?30和 n2?30) )1,0(~)()(2221212121 NnnXXZssmm??14 2020/9/15 兩個總體均值之差的 檢驗 (s1 s22 未知,大樣本 ) ? 檢驗統(tǒng)計量為 )1,0(~)()(2221212121 NnsnsXXZ??mm15 2020/9/15 兩個總體均值之差的 檢驗 (s1 s22 未知但相等 ,小樣本 ) 1. 檢驗具有等方差的兩個總體的均值 2. 假定條件 ? 兩個樣本是獨立的隨機樣本 ? 兩個 總體都是正態(tài)分布 ? 兩個總體方差未知但相等 3. 檢驗統(tǒng)計量 )2(~11)()(21212121 ??? nntnnSXXtpmm其中: 2)1()1(212222112??nnSnSnSp16 2020/9/15 兩個總體均值之差的 檢驗 (s1 s22 未知且不相等 ,小樣本 ) 1. 檢驗具有不等方差的兩個總體的均值 2. 假定 條件 ? 兩個樣本是獨立的隨機樣本 ? 兩個 總體都是正態(tài)分布 ? 兩個總體方差未知且不相等 s12 ? s22 3. 檢驗 統(tǒng)計量 22121 2 1 2 1222221212121212( ) 2( ) ( )~ ( )( ) 2 / ( 1 ) ( ) 2 / ( 1 )SSXX nnttSSSSnnnnnnmm? ? ? ?17 2020/9/15 方差齊性檢驗( Levene F方法): 計算兩組樣本的均值 計算各個樣本與本組均值的平均離差絕對值; 利用單因素方差分析推斷兩獨立總體平均離差絕對值是否有顯著差異。如果想比較的變量是分類變量,應(yīng)使用 Crosstabs功能。如果兩組樣本彼此不獨立,應(yīng)使用配對 T檢驗( Paired Sample T Test )??偞碓黾訌V告費三個月后想了解平均銷售情況,隨機抽取 16家零售店調(diào)查,發(fā)現(xiàn)每星期平均銷售量只有 15000箱,標(biāo)準(zhǔn)差為 6000箱。試求該村每戶農(nóng)民年平均收入 95%的置信區(qū)間。 2020/9/15 9 O n e S a m p l e T e s t . 5 9 2 39 . 5 5 8 . 2 1 2 2 . 9 3 7 9 . 5 1 3 4HBt dfS i g .( 2 t a i l e d )M e a nD i f f e r e n c e L o w e r U p p e r9 5 % C o n f i d e n c eI n t e r v a l o f t h eD i f f e r e n c eT e s t V a l u e = 1 1 . 6 5 7表 52 單個樣本檢驗 從表 52可看出, t值為 ,自由度為 39,顯著值為 ,樣本均值與檢驗值的差為 ,該差值 95%的置信區(qū)間是 ~。 3)在 Test Value中輸入 ,后單擊 OK。 ) 按 Analyze— Compare Means— One Sample T Test順序,打開主對話框。已知另一地區(qū)1618歲的少年血紅蛋白平均值為 ( g%),檢驗這一地區(qū) 1618歲少年血紅蛋白平均值是否與另一地區(qū)的平均值相等。 在任何一個變量中含有缺失值的觀測都將不被計算 2020/9/15 6 三、例題分析 (一) [051] 某校在對一項教學(xué)改革措施的評價中,隨機抽取了 60位學(xué)生進行態(tài)度調(diào)查,他們的10項態(tài)度 7級量表的態(tài)度反應(yīng)資料見下表: 教學(xué)改革態(tài)度反應(yīng)得分( x) 人數(shù)( f) 10- 20 2 20- 30 6 30- 40 10 40- 50 12 50- 60 20 60- 70 10 合計 60 試構(gòu)造學(xué)生態(tài)度得分平均值的 98%的置信區(qū)間。 二、完全窗口分析 按 Analyze— Compare Means— OneSample T Test順序,打開 OneSample T Test主對話框(如圖 51) 第一節(jié) 單一樣本 T檢驗 2020/9/15 5 圖 51 OneSample T Test主對話框 圖 52 Options對話框 Test Variables框:用于選取需要分析的變量 Test Value:輸入已知的總體均值,默認(rèn)值為0 Confidence Interval:輸入置信區(qū)間,一般取 90、9 99等。這就要進行均值比較。由此可以得到這樣的認(rèn)識: 均值不相等的兩組樣本不一定來自均值不同的總體 。2020/9/15 1 第五章 參數(shù)估計與假設(shè)檢驗 2020/9/15 2 主要內(nèi)容 第一節(jié) 單一樣本 T檢驗 (OneSample T Test) 第二節(jié) 獨立樣本 T檢驗 (IndependentSample T Test) 第三節(jié) 配對樣本 T檢驗 (PairedSample T Test) 2020/9/15 3 均值比較與均值比較的檢驗過程 均值比較的概念 統(tǒng)計分析常常采取抽樣研究的方法,即從總體中隨機抽取一定數(shù)量的樣本進行研究來推斷總體的特性。由于總體中的每個個體間均存在差異,即使嚴(yán)格遵守隨機抽樣原則也會由于多抽到一些數(shù)值較大或較小的個體致使樣本統(tǒng)計量與總體參數(shù)之間有所不同;又由于實驗者測量技術(shù)的差別或測量儀器精確程度的差別等等也會造成一定的偏差,使樣本統(tǒng)計量與總體參數(shù)之間存在差異。 能否用樣本均值估計總體均值?兩個變量均值接近的樣本是否來自均值相同的總體?換句話說, 兩組樣本某變量均值不同,其差異是否具有統(tǒng)計意義 ?能否說明總體具有顯著性差異?這是各種研究工作中經(jīng)常提出的問題。 2020/9/15 4 一、 簡介 主要用于檢驗單個變量的均值與假設(shè)檢驗值 (給定的常數(shù) )之間是否存在差異,也可進行單樣本的參數(shù)區(qū)間估計。 Missing Values: 在檢驗變量中含有缺失值的觀測將不被計算。 2020/9/15 7 (二) 以 [047]的資料來說明。 操作步驟 1) (打開數(shù)據(jù)文件“ 047血紅蛋白 .sav”。 2)將變量 hb選入 Test Va