【正文】
一元 /二元 /多元 ANOVA 檢驗(yàn)單個(gè)因子的 2個(gè)以上水平的平均值是否有顯著差異 一元 ANOVA 存在兩個(gè)(或更多)因子時(shí),檢驗(yàn)平均值是否有顯著差異 二元,多元ANOVA. 例:假設(shè)某餐廳經(jīng)理認(rèn)為,送餐的時(shí)間會(huì)受到員工的影響,也就是說,不同的員工送餐的時(shí)間是不同的(即使送餐的距離等其他因素完全相同),現(xiàn)在他需要比較三名不同員工: Jack,Bob,Rena的送餐時(shí)間有無統(tǒng)計(jì)差異,他該使用何種統(tǒng)計(jì)工具? Jack Bob Rena 1 2 3 4 5 6 方差比較:一元 ANOVA舉例 這種通過收集數(shù)據(jù)來比較同一因子的不同水平對 Y的影響是否存在差異的方法,就叫做單因子設(shè)計(jì),因?yàn)橛绊?Y輸入變量只有一種:即員工 該例中影響 Y的因子(輸入變量)有幾種?該因子有幾個(gè)不同的 Level? 假設(shè)員工 Jack,Bob,Rena 每人送 6份快餐的時(shí)間,記錄在上頁表格中,(假設(shè)每次送餐的距離等其他因素完全相同),即 Y=送一份快餐的時(shí)間,以分鐘為單位。作為替代,必須檢查標(biāo)準(zhǔn)差的置信區(qū)間并確定置信區(qū)間是否包含聲明值。同樣,兩種或多種分析方法的變異也是感興趣的話題。 一元 /二元 ANOVA應(yīng)用。各地點(diǎn)的酸性是否存在差異? 按照以下步驟: A) H0 : μ A = μ B= μ C; H1 :至少一個(gè)不同; B) α= B)隨機(jī)在各地點(diǎn)分別測量 7個(gè)數(shù)據(jù)。 例子: ? 在美國空軍學(xué)院進(jìn)行試驗(yàn),確定當(dāng)?shù)厥欠裼兴嵊辍? 相關(guān)樣本 均值比較:總結(jié) 成對 T檢驗(yàn) ? 利用 Minitab 軟件檢驗(yàn)兩個(gè)相關(guān)的樣本是否相等。你需要成對數(shù)據(jù)。使用雙樣本 t檢驗(yàn)的條件是: 1. 整體標(biāo)準(zhǔn)差未知。 Office A: n=80 y= s= Office B: n=80 y= s= D)計(jì)算 P值 Using Minitab…… StatBasic Statistics2sample t Tick ―Assume equal variance‖ E)比較 P值和顯著性水平。 舉例 —訂單生成 ? 某公司有兩個(gè)辦公室都生成訂單。所以,我們必須使用雙樣本 T檢驗(yàn)。 ? 我們沒有足夠的證據(jù)拒絕零假設(shè)。 P值 由于是大樣本( n30) ,我們可以用 S替代 σ,我們使用抽樣標(biāo)準(zhǔn)作為預(yù)測σ,那么: 均值比較:一個(gè)大樣本均值檢驗(yàn) ? 在下列情況下,要運(yùn)用單樣本 t檢驗(yàn) … ? 檢驗(yàn)抽樣對象均值和目標(biāo)數(shù)值是否相等,并且抽樣數(shù)量少 ? σ未知 ? 數(shù)據(jù)正態(tài)分布 Example :Metal wafer 舉例:金屬薄片 ? 問題: ? A .哪個(gè)更加合適?單邊檢驗(yàn)還是雙邊檢驗(yàn)? ? B .為什么在這個(gè)例子中使用的是 1 sample t test 1 sample t ,而不是 1sample Z test? 小樣本分析 均值比較:一個(gè)小樣本均值檢驗(yàn) 假設(shè)檢驗(yàn)和重要水平 ? 建立零假設(shè)和備選假設(shè) H0: μ = 3cm H1: μ ≠ 3cm ? 決定顯著水平 ,α= ? 隨機(jī)選擇樣本數(shù)據(jù)從 18個(gè)樣本中: y = S= 注意 :因?yàn)?t檢驗(yàn)要求數(shù)據(jù)為正態(tài),我們下一步是要進(jìn)行正態(tài)檢驗(yàn) ? 我們首先使用 AndersonDarling 檢驗(yàn)評估正態(tài)分布 ? StatBasic StatisticNormality test 正態(tài)性檢驗(yàn) P值計(jì)算 d) 計(jì)算 P值,使用 Minitab: StatBasic Statistics1Sample t OneSample T: Thickness Test of mu = 3 vs not = 3 Variable N Mean StDev SE Mean Thickness 18 Variable 95% CI T P Thickness (, ) e) 因?yàn)? ,我們否定零假設(shè)。 Minitab輸出結(jié)論 ? 我們現(xiàn)在展示進(jìn)行假設(shè)檢驗(yàn)的細(xì)節(jié) ? 我們在檢驗(yàn)關(guān)于抽樣對象均值的聲明 ? 由于 n 30,根據(jù)中心極限定理,抽樣均值的分布接近正態(tài)分布。數(shù)據(jù)不能提供足夠的證據(jù)否定平均強(qiáng)度等于 。 B)決定顯著性水平 ,α= C)隨機(jī)抽取數(shù)據(jù)收集了 49個(gè)數(shù)據(jù)。黏膠必須有足夠的強(qiáng)度(目標(biāo)平均值為 磅),隨機(jī)抽取 49個(gè)產(chǎn)品測量斷裂強(qiáng)度。 第二章 假設(shè)檢驗(yàn) ? 對計(jì)量型數(shù)據(jù)進(jìn)行假設(shè)檢驗(yàn)時(shí):抽樣數(shù)量 n ≥ 30時(shí),就算是大 抽樣數(shù)量 n 30時(shí),就算是小 ? 參數(shù)檢驗(yàn)基于總體的一些假定前提(例如,抽樣對象必須正態(tài)分布)。 如果 P值比 α大就無法否定零假設(shè):聲明應(yīng)該同下列陳述相似:在 α水平?jīng)]有足夠的證據(jù)證明備選假設(shè)是正確的。寫出比例的假設(shè)聲明: P(A)代表生產(chǎn)線 A的缺陷率; P(B) 代表生產(chǎn)線 B的缺陷率 H0: H1: ? 練習(xí) 2:塑料強(qiáng)度 ——你將測試塑料 A的樣本以確認(rèn)它的壓力強(qiáng)度是否大于 30kg/cm2 H0: H1: 假設(shè)檢驗(yàn)簡介:零假設(shè)與被選假設(shè) ? 只要進(jìn)行假設(shè)檢驗(yàn),在決策時(shí)就會(huì)有風(fēng)險(xiǎn)。 ? 例如: H0氧化物平均厚度等于 200 angstroms H1 氧化物的平均厚度不等于 200 angstroms 當(dāng)檢驗(yàn)總體均值時(shí) 序號 零假設(shè) …… 備選假設(shè) …… 1 H0: μ= target value H1: μ≠target value 2 H0: μ≤ target value H1: μ target value 3 H0: μ≥ target value H1: μ target value ? 交貨時(shí)間:以前, A型產(chǎn)品的交貨時(shí)間平均為 39天;改善措施實(shí)施后,收集新的數(shù)據(jù)。 ? C、 隨機(jī)抽取具有代表性的樣本 ? D、計(jì)算 P值。 ? 傳統(tǒng)的決策方式是基于具有高風(fēng)險(xiǎn)的主觀意識,統(tǒng)計(jì)檢驗(yàn)為我們提供了一個(gè)客觀的解決方案。 ? 980個(gè)女生 一般不會(huì)發(fā)生 1000個(gè)學(xué)生中有 980個(gè)女生的情況。 確定重大改變發(fā)生的時(shí)間。 ? 分別對三次結(jié)果進(jìn)行正態(tài)檢驗(yàn)。 ? 卡方分布(選擇自由度 =4) ? 指數(shù)分布(任選均值) 1) 對各種樣本容量,分別預(yù)測均值的標(biāo)準(zhǔn)誤。 x?n? )(m eanMS? nMS?2Total? 2Parts? 2MS?= + = = likewise Recall: % Contribution of MS = 22)(TotalmeanMS??中心極限定理定義:第一部分實(shí)際應(yīng)用 ? 測量系統(tǒng)的精度將提高,因?yàn)闃颖救萘浚ㄖ貜?fù)測量的次數(shù))的平方根。 中心極限定理定義:第一部分 此概念對正態(tài)和非正態(tài)同樣成立 ? 如果容量為 n的隨機(jī)樣本取自一個(gè)均值為 μ標(biāo)準(zhǔn)差為 σ的分布,則樣本的均值將形成一個(gè)小的分布,新分布的均值與原分布相同,但標(biāo)準(zhǔn)差將縮小為 。我們可以通過該定理用樣本的數(shù)據(jù)推斷總體的特性 中心極限定理:定理用途 跟隨老師進(jìn)行以下練習(xí) : 產(chǎn)生數(shù)據(jù): “ CalcRandom DataNormal?” 產(chǎn)生 100行 9( n=9)列隨機(jī)數(shù),均值 =標(biāo)準(zhǔn)差 =3 疊加數(shù)據(jù): “ DataStackColumns...” 產(chǎn)生數(shù)據(jù) 疊加數(shù)據(jù) 中心極限定理:引入練習(xí) 數(shù)據(jù)的均值 —— 數(shù)據(jù)的標(biāo)準(zhǔn)差 ——―σ‖ X ?“ ” 或 “ ”μ= σ= 計(jì)算數(shù)據(jù)的均值( μ )、標(biāo)準(zhǔn)差( σ )、觀察數(shù)據(jù)分布: “ StatBasic StatisticsGraphical Summary” 1 2 . 51 0 . 07 . 55 . 02 . 50 . 0 2 . 5M e d i a nM e a n5 . 45 . 35 . 25 . 15 . 04 . 9A n d e r s o n D a r l i n g N o r m a l i t y T e s tV a r i a n c e 8 . 6 9 2 3S k e w n e s s 0 . 0 7 7 1 1 1K u r t o s i s 0 . 2 1 7 7 8 8N 9 0 0M i n i m u m 3 . 7 3 4 2A S q u a r e d1 s t Q u a r t i l e 3 . 1 6 5 5M e d i a n 5 . 1 1 8 43 r d Q u a r t i l e 7 . 0 8 2 4M a x i m u m 1 3 . 4 5 4 59 5 % C o n f i d e n c e I n t e r v a l f o r M e a n4 . 9 4 1 80 . 2 75 . 3 2 7 69 5 % C o n f i d e n c e I n t e r v a l f o r M e d i a n4 . 8 8 7 9 5 . 3 8 8 49 5 % C o n f i d e n c e I n t e r v a l f o r S t D e v2 . 8 1 8 1 3 . 0 9 1 2P V a l u e 0 . 6 8 4M e a n 5 . 1 3 4 7S t D e v 2 . 9 4 8 39 5 % C o n f i d e n c e I n t e r v a l sS u m m a r y f o r 數(shù) 據(jù) 值中心極限定理:引入練習(xí) “ StatBasic Statistics Display Descriptive Statistics...” Descriptive Statistics: 數(shù)據(jù)值 Variable N N* Mean SE Mean StDev 數(shù)據(jù)值 900 0 數(shù) 據(jù) 值Frequency1 2 . 51 0 . 07 . 55 . 02 . 50 . 0 2 . 57 06 05 04 03 02 01 00M e a n 5 . 1 3 5S t D e v 2 . 9 4 8N 9 0 0H i s t o g r a m ( w i t h N o r m a l C u r v e ) o f 數(shù) 據(jù) 值μ= σ= 中心極限定理:引入練習(xí) 產(chǎn)生數(shù)據(jù)的均值數(shù)據(jù): “ CalcRow Statistics” 從 C1C9列隨機(jī)抓 9個(gè)數(shù)(每列 1個(gè)),求平均值,從而得出一組平均值的數(shù)據(jù) 中心極限定理:引入練習(xí) 計(jì)算均值數(shù)據(jù)的均值、均值數(shù)據(jù)的標(biāo)準(zhǔn)差、觀察均值數(shù)據(jù)的分布:―StatBasic StatisticsGraphical Summary‖ 均值數(shù)據(jù)的均值 —— X? X?76543M e d i a nM e a n5 . 45 . 35 . 25 . 15 . 04 . 9A n d e r s o n D a r l i n g N o r m a l i t y T e s tV a r i a n c e 0 . 9 4 7 7S k e w n e s s 0 . 0 3 4 5 5 2K u r t o s i s 0 . 1 0 4 2 5 5N 1 0 0M i n i m u m 2 . 7 1 1 0A S q u a r e d1 s t Q u a r t i l e 4 . 4 4 2 2M e d i a n 5 . 1 3 6 73 r d Q u a r t i l e 5 . 7 9 9 9M a x i m u m 7 . 5 8 4 89 5 % C o n f i d e n c e I n t e r v a l f o r M e a n4 . 9 4 1 50 . 1 15 . 3 2 7 99 5 % C o n f i d e n c e I n t e r