【正文】
1他鄉(xiāng)生白發(fā),舊國見青山。 2023年 3月 29日星期三 10時(shí) 57分 48秒 10:57:4829 March 2023 1做前,能夠環(huán)視四周;做時(shí),你只能或者最好沿著以腳為起點(diǎn)的射線向前。 :57:4810:57Mar2329Mar23 1世間成事,不求其絕對(duì)圓滿,留一份不足,可得無限完美。 。 , March 29, 2023 閱讀一切好書如同和過去最杰出的人談話。勝人者有力,自勝者強(qiáng)。 2023年 3月 29日星期三 10時(shí) 57分 48秒 10:57:4829 March 2023 1一個(gè)人即使已登上頂峰,也仍要自強(qiáng)不息。 2023年 3月 29日星期三 上午 10時(shí) 57分 48秒 10:57: 1最具挑戰(zhàn)性的挑戰(zhàn)莫過于提升自我。 :57:4810:57Mar2329Mar23 1越是無能的人,越喜歡挑剔別人的錯(cuò)兒。 2023年 3月 29日星期三 10時(shí) 57分 48秒 10:57:4829 March 2023 1空山新雨后,天氣晚來秋。 :57:4810:57:48March 29, 2023 1意志堅(jiān)強(qiáng)的人能把世界放在手中像泥塊一樣任意揉捏。 , March 29, 2023 很多事情努力了未必有結(jié)果,但是不努力卻什么改變也沒有。 。 :57:4810:57Mar2329Mar23 1故人江海別,幾度隔山川。試驗(yàn) ? 根據(jù)收集的數(shù)據(jù)類型和 /或比較類型選擇適當(dāng)?shù)脑囼?yàn) ? 運(yùn)用 Minitab 進(jìn)行試驗(yàn) ? 根據(jù) P值判斷結(jié)果 。試驗(yàn) 比較兩組平均值 數(shù)據(jù)配對(duì)比較兩組平均值 比較兩組或多組平均值 比較兩組或多組比例 比較兩組或多組的方差 同類方差試驗(yàn) 102 針對(duì)數(shù)據(jù)類型的適當(dāng)分析方法 Y ( 輸出) X ( 輸入) 連續(xù) 離散 (比例) 離散 (“ 組”) 連續(xù) Χ178。試驗(yàn) 期望值置于觀測(cè)值之下 24以內(nèi) 超過 24 總計(jì) 1 1810 1230 3040 2 609 456 1065 3 176 143 319 Total 2595 1829 4424 ChiSq = + + + + + = DF = 2, PValue = 結(jié)果不明顯,這意味著就總體發(fā)貨而言貨車在 24小時(shí)左右沒有差異。 94 練習(xí) 5: 運(yùn)用 Minitab進(jìn)行 X178。試驗(yàn)的假設(shè) ?樣本代表母體或過程 ?我們假設(shè)用于 X178。 90 1. 確定哪個(gè)組比例不同 結(jié)論 北部地點(diǎn)的抱怨率明顯較高,中部地點(diǎn)抱怨率明顯較低。,將高值畫上圈 * X178。值和 P值。試驗(yàn) : Stat Tables ChiSquare Test 88 使用 Minitab : X178。試驗(yàn) ?虛假設(shè) H0: 各組比例相同 ?替代假設(shè) Ha: 至少有一組的比例與其他組不同 86 假設(shè) X178。 Minitab 菜單 : Stat Tables ChiSquare Test X178。全國共有 4個(gè)生產(chǎn)地點(diǎn),團(tuán)隊(duì)有興趣了解是否針對(duì)這 4個(gè)生產(chǎn)地點(diǎn)的抱怨明顯不同,以此來確定項(xiàng)目的今后步驟。 ? 將離散 X 當(dāng)作“分組”或 由 分層變量來看 X。 比較兩組或更多組的比例 : χ178。 ? 如果確實(shí)存在差異,那么要么是變差過大或樣本太小而不能被察覺。 比較兩組或更多組的平均值 59 我采用哪種分析方法? Xs是否離散 (組〕 只比較 2組? Y 1 ’ s是否 與 Y 2 與 Y2?s 相匹配? 否, Xs連續(xù) 回歸主題 ANOVA t 試驗(yàn) 否,比較多組 (平均值方差〕 ) 是 是 配對(duì) t 試驗(yàn) 否, 比較兩組 獨(dú)立組平均值 采用匹配數(shù)據(jù)比較兩組平均值 比較平均值? 等方差試驗(yàn) 否,比較方差 ) 是 Ys是否連續(xù) ? X178。 ? 但是如果新方法產(chǎn)生相同的結(jié)果,則只會(huì)徒勞無功。 ?新技術(shù)有更高的平均值,但在統(tǒng)計(jì)上卻不能宣稱有顯著的差異(因?yàn)? P ? .05)。 ? 要證明實(shí)施新方法的成本是適當(dāng)?shù)?,有必要減少 30 分鐘。通常臨床試驗(yàn)中。 臨床上把這種可能存在的假陽性誤差稱為 I類誤差,用 α值表示 ,當(dāng) α= 0. 05,說明 A優(yōu)于 B的結(jié)論是在 95%顯著性水平上排斥無效假設(shè)的,也就是說 A優(yōu)于 B由藥物因素引起的可能性為 95% (置信度 95%,仍有 5%假陽性的可能性;若 α= ,則 A優(yōu)于 B的假陽性只有 1%的可能性 . 臨床試驗(yàn)中 另一種誤差為假陰性誤差,用 β值表示 。 SARS新藥臨床試驗(yàn)必須設(shè)立對(duì)照組,因?yàn)閷?duì)照試驗(yàn)的目的為比較新藥與對(duì)照藥物二組治療結(jié)果的差別有無統(tǒng)計(jì)學(xué)顯著意義。 ? 如果 X 數(shù)據(jù)是連續(xù)的,則使用回歸分析判斷它們是否與輸出 (Y) 變量 相關(guān)。 51 Y ( 輸出) X ( 輸入) 連續(xù) 離散 (比例) 離散 (“ 組”) 連續(xù) Χ178。 ? 假設(shè)真實(shí)差異為 0, P 值等于獲得觀測(cè)差異的概率。您認(rèn)為下面哪些最容易理解? ? P 值用于判斷觀測(cè)到的組之間差異是否明顯大于普通原因(隨機(jī))變化(如果 P .05, 結(jié)論是肯定的)。 ?P 值范圍從 到 ( 0% 可能性到 100% 可能性)。 ? 樣本是過程的代表(沒有偏差)。 ? 通過 隨機(jī)抽樣 實(shí)現(xiàn)。 ? 假設(shè)試驗(yàn)比分層點(diǎn)圖提供更明確的結(jié)果(如果假設(shè)滿足的話)。 ?假設(shè)試驗(yàn)使用更大的樣本,因?yàn)槠骄档淖兓S著樣本大小的增大而減小。 ?為了確定這點(diǎn),不同的假設(shè)試驗(yàn)可提供不同方法來評(píng)估在不同情況下的普通原因變化。 ?如果對(duì)您的數(shù)據(jù)使用 t 試驗(yàn) ,推測(cè)作結(jié)論時(shí)您所做的假設(shè)。 41 問題 2c 2d: 改進(jìn)分析 要提高檢測(cè)真實(shí)差異的能力,您可: ?構(gòu)建一個(gè)加工變化前后(例如前 3 個(gè)月)生產(chǎn)的件數(shù)控制圖,以觀察這五個(gè)數(shù)據(jù)點(diǎn)是否適合季節(jié)或月周期。 39 練習(xí) 2:答案(續(xù)) 問題 1: Minitab 輸出 ( 續(xù)) 置信區(qū)間范圍從負(fù)數(shù)到正數(shù),并包含 0 P 值 ? .05 S t dN e w15000140001300012023110001000090008000Mate rialPiecesBo x p lo t s o f Pi e c e s b y M a t e ri a l( m e a n s a r e in d ica t e d b y so lid ci r cl e s)S t dN e w15000140001300012023110001000090008000Mate rialPiecesD o t p lo t s o f Pi e c e s b y M a t e ri a l( m e a n s a r e i n d i ca t e d b y l i n e s)兩個(gè)樣本 t 試驗(yàn)和置信區(qū)間 材料的兩種樣本 T 材料 N 平均值 標(biāo)準(zhǔn)偏差 SE 平均值 New 5 11591 2190 979 Std 5 10632 2229 997 mu (New ) mu (Std )的 95% 置信區(qū)間: ( 2348, 4265) t 試驗(yàn) mu (New ) = mu (Std ) (對(duì)比不等的情況 ): T = P = DF = 7 40 練習(xí) 2:答案(續(xù)) 問題 2a 2b: 數(shù)據(jù)不支持供應(yīng)商的聲稱。 2. 分小組 討論并回答下列問題 。它安排在該月的前五天(您的企業(yè)最忙的時(shí)間)進(jìn)行一次實(shí)驗(yàn),以演示該產(chǎn)品。 3. 如果 P 不是很小 (? .05), 則可得出結(jié)論:拒絕虛假設(shè)沒有足夠的證據(jù)。 ?假設(shè)兩組平均值相同。 ?如果組平均值之間 沒有顯著差異 , 置信區(qū)間將包含 0 ( 即范圍從負(fù)數(shù) [–] 到正數(shù) [+])。 兩個(gè)樣本 t 試驗(yàn)和置信區(qū)間 Std 與 New 的兩個(gè)樣本 T N 平均值 StDev SE 平均值 Std 100 New 50 mu Std mu New 的 95% CI( 置信區(qū)間): ( , ) t 試驗(yàn) mu Std = mu New (與不是 =): T = P = DF = 117 =?nt 值 觀察 P 值得出結(jié)論。 2. 按方法 繪制 研究時(shí)間的 分層點(diǎn)圖 : Graph Dotplot ( 選擇 ‘ Std’ 和 ‘ New’ 作為變量) ( 選擇 “ each column constitutes a group”) 28 3. 對(duì)這兩種方法的平均時(shí)間之差 做 t 試驗(yàn) : Stat Basic Statistics 2 Sample t… Graphs ( 選擇兩個(gè)圖) 不要選擇此框 如果所有數(shù)據(jù)在一列中,而組標(biāo)簽在另一列中,則使用此按鈕 (我們使用的數(shù)據(jù)沒有這樣設(shè) 置)。 – 我們不詳細(xì)解釋 df; 可把它看作是估計(jì)這兩組的平均值和標(biāo)準(zhǔn)偏差之后樣本中殘留的信息量。 數(shù)據(jù)類型 可以比較什么 示例 連續(xù) 比例 供應(yīng)商 A 的按時(shí)交貨比例 是否與供應(yīng)商 B 的相同? 離散 平均值 變化 形狀或分布 三個(gè)班次的平均產(chǎn)量是否相同? 采用新方法的小組的結(jié)果與采用舊方法的小組的結(jié)果相比變化較小嗎? 采用不同的方法周期的分布有何區(qū)別? 22 為什么使用假設(shè)試驗(yàn)? ? 發(fā)現(xiàn)對(duì)于經(jīng)營業(yè)務(wù)具有重要意義的差別。 ? 如果大約 95% 的數(shù)據(jù)點(diǎn)落在置信范圍內(nèi),可以說數(shù)據(jù)是正 態(tài)的 。 P 值是興趣值的概率 3 2 1 0 1 2 33 2 1 0 1 2 33 2 1 0 1 2 3興趣值 興趣值 興趣值 興趣值 P 值 = 面積 P 值 = 面積 A + B A B 拒絕域 拒絕域 拒絕域 拒絕域 接受域 接受域 接受域 11 0 1 2 3 Onhold time (min) 并非所有數(shù)據(jù)都呈正態(tài) 0 1 2 3 4 5 6 Defects on Invoice 5 15 25 35 45 Cycle Time (days) 僅在一個(gè)方向上有長尾巴的分布被稱為不對(duì)稱 12 示例:使用正態(tài)曲線計(jì)算過程 均方差 ?要確定過程均方差 , 找到超出規(guī)格界限外的缺陷面積 ?如果數(shù)據(jù)不是正態(tài), 使用方法 2(在測(cè)量階段已討論)估計(jì)的缺陷面積就不正確,且不能如實(shí)表示過程均方差 將正態(tài)方法用于非正態(tài)數(shù)據(jù)的后果 USL USL 平均值 陰影面積占多大百分比? 對(duì)于正態(tài)曲線,此百分比值是不同的。試驗(yàn) ? 復(fù)習(xí) 檢測(cè)正態(tài)分布 6 復(fù)習(xí):正態(tài)曲線 定義: ?正態(tài)曲線是一種概率分布,最經(jīng)常發(fā)生的值位于中間,其他概率向兩側(cè)對(duì)稱下降。丁伯根( Nikolaas Tinbergen)和康拉德 同時(shí),弗里奇還發(fā)現(xiàn),收獲舞有 “圓形舞 ”和 “擺尾舞 ”2種。 澳大利亞出生的動(dòng)物學(xué)家卡爾 特別是工蜂們的交流方式,人們幾乎一概不知。 在野外采集到蜜和花粉的蜜蜂返回蜂巢后,在蜂巢上起舞,因此被稱為 “收獲舞 ”。并且,在 1973年,與尼可拉斯 3 你在這里 IMPROVE INSTRUCTOR NOTES: Hypothesis testing was used for discrete Xs and continuous Ys. Regression is used for continuous Xs and Ys. 控制 定義 測(cè)量 改進(jìn) 分析 4 目錄 ? 檢測(cè)正態(tài)分布 ? 假設(shè)試驗(yàn)概述 ? 比較兩組平均值: t 試驗(yàn) ? 假設(shè)試驗(yàn)的解釋 ? 比較兩組或更多組的平均值 : ANOVA試驗(yàn) ? 比較兩組或更多組的比例 : χ178??赡軓钠渌植籍a(chǎn)