【正文】
假設(shè) 試驗 A. H0: 比例 A = 比例 B = 比例 C x178。試驗并分析結(jié)果 . 時間 : 15 分鐘 . 數(shù)據(jù) : C:\SixSigma\Hypo_Mod\ 背景 : 我們一直在跟蹤 3輛貨車在兩個制造廠間進行分總成運輸?shù)臅r間,運貨記錄表明已檢查了 12個月,結(jié)果匯總?cè)缦?: 貨車 24 小 時 以內(nèi)2 4 3 6 小 時 3 6 4 8 小 時A 1 8 1 0 6 7 9 5 5 1B 6 0 9 2 1 9 2 3 7C 1 7 6 85 5895 練習(xí) 5: 答案 Minitab 輸出 結(jié)論 : 貨車有差異 . 在 24至 36小時之間,貨車 C的發(fā)貨比期望值高,在 36至 48小時之間,貨車 B的發(fā)貨比期望值高 ??偤椭姓嫉谋戎刈畲? ChiSquare Test Expected counts are printed below observed counts NEast SEast Central West Total 1 46 17 5 21 89 2 270 186 102 223 781 Total 316 203 107 244 870 ChiSq = + + + + + + + = DF = 3, PValue = 抱怨 無抱怨 91 2. 確定為何小組比例不同 注意 ! 查詢差異的原因而非進行責(zé)備! 當(dāng)一組的錯誤率明顯比其他各組(系統(tǒng)〕高 ? 容易導(dǎo)致責(zé)備,但最好把它當(dāng)作改進的契機 ? 成為數(shù)據(jù)偵察員 ? 首先問如下 4方面的問題 ? 工作劃分 : 這類工作是否不同 ? (也許復(fù)雜的工作應(yīng)分配給經(jīng)驗豐富的人,提高錯誤率 .) ? 工作方法 : 工作軟件,硬件和方法與其他小組相比如何 ? ? 工作流程 : 是否有標(biāo)準(zhǔn)流程 , 是否使用 , 人員是否經(jīng)過培訓(xùn) ? ? 個人差異 : 生理差異 (視力 , 左撇子 , 等 .) 是否影響了工作能力 ? ? 下一步 , 它們“離群”的時間有多長? ? 如果只是現(xiàn)在 , 也許是由于最近的變化是導(dǎo)致的。值可以用來確定哪組的比例值與其他組的明顯不同。 ?如果 P .05 ? 拒絕 H0, 決定使用 Ha ? 至少有一組比例與其他組存在統(tǒng)計差異 87 使用 Minitab : X178。分析實例 續(xù) 地點 東北 東南 中部 西部 Obs . Exp . Obs . Exp . Obs . Exp . Obs . Exp . 總計 有抱怨發(fā)貨 46 17 5 21 89 無抱怨發(fā)貨 270 186 102 223 781 總發(fā)貨 316 203 107 244 870 82 X178。 否 , Y離散 比例 ) 是 是 76 Y ( 輸出) X ( 輸入) 連續(xù) 離散 (比例) 離散 (“ 組”) 連續(xù) Χ178。 ? 如果你進行配對比較 , 每次比較 2組 , 你最終會做 21個 t試驗 ? 這沒有有效的運用時間和數(shù)據(jù) (估計方差 ) ? 你也增加了犯 I類錯誤的可能性 (至少比較之中有一次 )* ? 我們必須尋求更好的方法 ? 來同步比較小組 ? 來有效利用所有的數(shù)據(jù) *Type I error rate = 1(.95)21=.66 =66%. 62 方差分析以尋找平均值差異 ? 有一種統(tǒng)計的方法是運用方差來同步比較多個小組的平均值 ? 稱為 ANOVA: 方差分析 ? 與配對比較平均值不同,它將組間方差與組內(nèi)方差進行比較 ? 組間方差即由該小組平均值的 s2獲得 ? 組內(nèi)方差即由各組的 s2 與所有小組合并后 (或與適當(dāng)?shù)淖杂啥冗M行平均〕 獲得 ? 如果組間方差與組內(nèi)方差相同,我們認各為組間平均值沒有差異 2within2bet weenSS63 分析方差而非平均值,續(xù) Scrap (kg)V e n d o rA B C D E F G4 . 55 . 56 . 57 . 5Between GroupsWithinGroups? 右圖有助于理解 7個小組的“組間” 和“組內(nèi)”方差 ( 認可每條線為居中的正態(tài)分布 ) ? 由圖可以看出,組內(nèi)變化小于組間變化,因此,試驗可能會體現(xiàn)至少有一組與其他組存在差異。 ?企業(yè)領(lǐng)導(dǎo)者需要決定是否值得冒險實施新方法。 假設(shè)試驗中的兩種誤差舉例 : SARS新藥假設(shè)試驗 55 重要差異與顯著差異 顯著但不重要的差異 有時,您檢測到一個統(tǒng)計上顯著的差異 —但它小到對您的企業(yè)沒有實際的重要性。當(dāng) A藥與 B藥治療結(jié)果出現(xiàn)差別時, 首先要確定這種差別是藥物因素造成的還是非藥物因素引起的 ,如 A優(yōu)于 B不是由藥物因素引起而是非藥物因素偶爾造成,稱為假陽性。 ? 將離散 X 當(dāng)作“分組”或 由 分層變量來看 X。 ? P .05 意味著組來自相同分布的概率小于 5%。除非過程符合標(biāo)準(zhǔn),否則此假設(shè)不容易滿足 48 P 值定義 ?假設(shè)試驗比較 觀測到的組之間的差異 。 ? 您可能需要轉(zhuǎn)換非正態(tài)數(shù)據(jù)(如周期)。 ? 如果答案為否,則差異沒有統(tǒng)計證據(jù)。 ?比較工具磨損模式以檢測這兩種材料中的其它差異。 a. 數(shù)據(jù)是否支持供應(yīng)商的聲稱? b. 您是否將購買該產(chǎn)品? c. 如何提高確定是否購買該產(chǎn)品的決定能力? d. 購買該產(chǎn)品衍生的問題是什么? 37 練習(xí) 2:答案 8000 9000 10000 11000 12023 13000 14000 15000P i e c e sD o t p l o t f o r P i e ce sM a t e r i a lN e wSt d8 / 1 8 / 2 8 / 3 8 / 4 8 / 5 9 / 1 9 / 2 9 / 3 9 / 4 9 / 580009000100001100012023130001400015000D a t e / T i m ePieces問題 1: Minitab 輸出 38 練習(xí) 2:答案(續(xù)) 描述性統(tǒng)計數(shù)字 變量 材料 N 平均值 中值 TrMean StDev Transact New 5 11591 10860 11591 2190 Std 5 10632 10050 10632 2229 變量 材料 SE 平均值 最小值 最大值 Q1 Q3 Transact New 979 9633 15087 9878 13669 Std 997 8189 13316 8608 12948 新方法平均值要高 959 件 兩種材料都有相當(dāng)大的標(biāo)準(zhǔn)偏差。 35 練習(xí) 2: 使用 Minitab 和 t 試驗 比較兩組 平均值 目的: 練習(xí)使用 Minitab 進行 t 試驗 以比較兩組平均值并得出結(jié)論。 ?快多少?我們有 95% 把握認為 新方法平均要比標(biāo)準(zhǔn)方法快大約 .35 小時到 小時。 (或者 這兩種方法的平均研究時間不同。 ? t 分布: ? 比 Z 分布有更大的變化(因此尾部有不同的面積,這表示不同的 P 值)。 Graph Probability Plot ?如果數(shù)據(jù)是正態(tài),那些點可連成一條直線。以前不受人關(guān)注的動物行為學(xué)( Ethology)隨著這 3名動物行動學(xué)家獲得了諾貝爾獎,取得了全球性進展。弗里奇( Karl von Frisch)( 18861982),通過孜孜不倦的實驗和觀察, 揭示 了蜜蜂是通過舞蹈的方式向同伴通報花和蜜源的地點。馮 羅倫茲( Konrad Lorenz)同時榮獲了諾貝爾醫(yī)學(xué)生理學(xué)獎。 13 受 非正態(tài)數(shù)據(jù)影響的方法 方法 非正態(tài)的結(jié)果 過程均方差計算 過程均方差值不正確 單值控制圖 錯誤地發(fā)現(xiàn)某些特殊原因,丟失其它信號 假設(shè)試驗 關(guān)于各組之間差別的錯誤結(jié)論 回歸 錯誤地識別重要因素;較差的預(yù)測能力 實驗設(shè)計 關(guān)于重要因素的錯誤結(jié)論 ; 較差的預(yù)測 能力 必須轉(zhuǎn)換非正態(tài)數(shù)據(jù) ( 在高級課程中講授) 14 使用正態(tài)概率圖檢查正態(tài) 以下是在 Minitab (n= 25) 中生成的樣本正態(tài)概率圖。 23 何時使用假設(shè)試驗 ? 當(dāng)您需要比較兩個組或更多組的以下因素時 ? 平均值 ? 可變性 ? 比例 ? 當(dāng)您無法確定是否存在真正的差別時 24 如何使用假設(shè)試驗 ? 確定適合于您的數(shù)據(jù)和問題的檢驗類型 ? 在 Minitab 中合適安排數(shù)據(jù) ? 從 Statistics 選項菜單選擇適當(dāng)?shù)臋z驗 ? 從 Minitab 輸出獲得 p 值;如果 p .05, 則宣稱統(tǒng)計上有重大的差異 比較兩組平均值: t 試驗 26 t 試驗 :比較兩組平均值的統(tǒng)計檢驗 使用稱為 t 試驗 (使用 Minitab) 的統(tǒng)計檢驗來判斷兩組平均值之間的差異。 使用 Minitab: 比較兩組的 t 試驗 (續(xù)) 29 使用 Minitab: 比較兩組的 t 試驗 (續(xù)) S t d N e w101520Bo x p l o t s o f St d a n d N e w( m e a n s a r e i n d i ca t e d b y s o l i d ci r cl e s )S t d N e w101520D o t p l o t s o f St d a n d N e w( m e a n s a r e i n d i ca t e d b y l i n e s )30 使用 Minitab: 比較兩組的 t 試驗 (續(xù)) 結(jié)論 因為 P 值很小 ( .05), 因此可得出結(jié)論:這兩種方法的平均研究時間有統(tǒng)計上重大的差異。 32 示例 ?哪一組較快?因為 (AveSTD – AveNEW) 是正數(shù),標(biāo)準(zhǔn)方法時間較長,而新方法時間較短(較快)。有下列可能的解釋: a. 這些組相同,或 b. 變化過大或樣本過小無法檢測到差異。準(zhǔn)備報告您的結(jié)論。 ?收集更多數(shù)據(jù)(增大樣品大小 n) 以進一步減少平均值的變化。 ? 它們檢驗在該情況下一個差異是否明顯要比預(yù)期的普通原因變化大。 7 . 5 8 . 5 9 . 5 1 0 . 5 1 1 . 5 1 2 . 5D o t p l o t f o r A CABC47 假設(shè)試驗的假設(shè) ?如果數(shù)據(jù)是連續(xù)的,我們假設(shè)基本分布是正態(tài)。 這就是假設(shè)試驗是一種高級工具的原因。 ? 如果 P .05, 則拒絕 H0 而決定使用 Ha。試驗 t 試驗 成對 t 試驗 ANOVA 邏輯回歸 回歸 不同數(shù)據(jù)類型的適當(dāng)分析方法 ? 當(dāng)輸入 (X) 變量是離散變量時,使用假設(shè)試驗。由于臨床治療中所獲得的療效可能由藥物引起,也可能由非藥物的因素如休息、疾病或癥狀自愈等引起。值可定為 0. 05, β值定為 0. 2,已能滿足統(tǒng)計學(xué)要求。 ? 觀測差異由于隨機變化而產(chǎn)生且不存在真正的差異,或者變化太大(或樣本大小太?。┎荒軝z測到差異。 否 , Y離散 比例 ) 是 是 60 討論 : 你如何比較 7組? 一個改進小組有興趣比較一下 7個不同的包裝材料供應(yīng)商,它們在不同材料上生產(chǎn)的平均廢品總量是否存在任何明顯差異 ? 你