【正文】
rom first value 中輸入 1,在 To last value 中輸入 2 。 4. 既然有 10個(gè) 1和 10個(gè) 2, 在 List each value 中 , 輸入 10 , 然后點(diǎn)擊 OK 。新生成的數(shù)據(jù)如下: s 6 47 描述性統(tǒng)計(jì)計(jì)算 步驟四 、 描述性統(tǒng)計(jì)計(jì)算 Minitab提供了許多基本統(tǒng)計(jì)方法進(jìn)行數(shù)據(jù)分析 , 例如描述性統(tǒng)計(jì) 、 t檢驗(yàn) 、z檢驗(yàn)以及相關(guān)性 。 對(duì)于兩個(gè)不同地方的樹(shù),應(yīng)當(dāng)分別生成統(tǒng)計(jì)表對(duì)三個(gè)變量 Diameter、Height 和 Weight 進(jìn)行說(shuō)明。 Stat ? Basic Statistics ? Display Descriptive Statistics。 , 點(diǎn)擊 Diameter 然后拖曳鼠標(biāo)使 Diameter、Height、 Weight 高亮度顯示 , 然后點(diǎn)擊 Select 。 By variable, 輸入 Site。 通過(guò) Minitab 對(duì)不同地方的樹(shù)在直徑 、 高度 、 重量上分別生成統(tǒng)計(jì)結(jié)果 。 Graphs。 5. 選中 Boxplot of data, 然后點(diǎn)擊 OK兩次 。 s 6 48 描述性統(tǒng)計(jì)計(jì)算 Descriptive Statistics: Diameter, Height, Weight by site Variable site N Mean Median TrMean StDev Diameter 1 10 2 10 Height 1 10 2 10 Weight 1 10 2 10 Variable site SE Mean Minimum Maximum Q1 Q3 Diameter 1 2 Height 1 2 Weight 1 2 從盒式圖 (boxplot)可以判斷出 , 地方 2的樹(shù)比地方 1的樹(shù)大 。 會(huì)話窗口的文本輸出包含以下信息: 在地方 2三個(gè)變量都顯示出比較大的平均值和中央值 。 而且 , 變量 Weight相對(duì)其尺寸來(lái)說(shuō)有一個(gè)比較大的標(biāo)準(zhǔn)偏差 。 在地方 2, 最小重量只有 值是 , 這表明一部分白楊樹(shù)生長(zhǎng)得很好 , 可是其他的僅僅只是活著而已 。 2 1 5 4 3 2 1 site D i a m e t e r Boxplots of Diameter by site 2 1 site W e i g h t Boxplots of Weight by site 2 1 6 5 4 3 2 site H e i g h t Boxplots of Height by site s 6 49 算術(shù)運(yùn)算 步驟五 、 進(jìn)行算術(shù)運(yùn)算 現(xiàn)在的任務(wù)是估計(jì)樹(shù)的重量。根據(jù)以前的工作,研究人員發(fā)現(xiàn)樹(shù)的重量和直徑平方與高度之積有關(guān)。手頭有直徑和高度的數(shù)據(jù),利用計(jì)數(shù)器計(jì)算新的變量。計(jì)數(shù)器將輸入的方程式結(jié)果計(jì)算出來(lái)并保存于指定的變量。 1. 選擇 Calc ? Calculator。 2. 將新的變量命名為 D2H,表示直徑的平方與高之積。在 Store result in variable 中,輸入 D2H . 3. 在 Expression中,鍵入 C1**2*C2 ,點(diǎn)擊 OK 。 計(jì)算結(jié)果顯示如下: s 6 50 生成散點(diǎn)圖 步驟六、生成散點(diǎn)圖 研究人員得出在重量與 D2H之間存在一種關(guān)系。通過(guò)散點(diǎn)圖,可以驗(yàn)證這一點(diǎn)。 1. 選擇 Graph ? Plot。 2. 在 Y 中,輸入 Weight . 3. 在 X 中,輸入 D2H 然后點(diǎn)擊 OK 。 100 50 0 D2H W e i g h t 圖形窗口輸出結(jié)果: 由此可以看出, Weight和 D2H之間存在正的線性關(guān)系,也就是說(shuō), D2H增加的話, Weight也同樣增加。圖上出現(xiàn)了一個(gè)不正常點(diǎn):有一棵樹(shù)只有很小的重量,但 D2H值卻相當(dāng)高。現(xiàn)在將其忽略,但以后還得進(jìn)一步檢查。下一步是計(jì)算這二者的相關(guān)性并且將其量化。 不規(guī)則點(diǎn) s 6 51 計(jì)算相關(guān)系數(shù) 步驟七、計(jì)算相關(guān)系數(shù) 從散點(diǎn)圖知隨著 D2H增長(zhǎng), WEIGHT也同樣增長(zhǎng),現(xiàn)在通過(guò)計(jì)算相關(guān)系數(shù)找出這兩個(gè)變量的具體關(guān)聯(lián)性。 1. 選擇 Stat ? Basic Statistics ? Correlation. 2. 在 Variables 中,輸入 Weight 和 D2H,點(diǎn)擊 OK 。 會(huì)話窗口輸出 : Pearson correlation of Weight and D2H = PValue = 相關(guān)系數(shù)是兩個(gè)變量之間線性關(guān)系的度量 , 其值介于 1和 +1之間 , 此處 , 相關(guān)系數(shù)為正的 , 接近于 1, 從而把散點(diǎn)圖中所表示的關(guān)系量化了 。 說(shuō)明變量 WEIGHT和 D2H 之間存在很強(qiáng)的線性關(guān)系 。 s 6 52 第六章 做一個(gè)簡(jiǎn)單分析 s 6 53 背景 賓夕法尼亞州立大學(xué)的研究者們種植了成百上千的白楊樹(shù)并且在一系列受控條件下讓其生長(zhǎng) .三年后 ,抽取一批為樣本 , 以厘米為單位測(cè)量其直徑 、 以米為單位測(cè)量其高度 、 千克為單位稱(chēng)其干重 。 前面知道 , 在干重與 D2H之間存在相近的關(guān)系 。 但是到底是一種怎樣的關(guān)系呢 ? 這些快速生長(zhǎng) 、 質(zhì)地堅(jiān)硬的樹(shù) , 將來(lái)某一天也許會(huì)作為燃料或者化學(xué)物質(zhì)的一種選擇 。 作為數(shù)據(jù)分析員 , 知道了直徑和高度的測(cè)量值之后 , 能否可靠的預(yù)測(cè)出樹(shù)的產(chǎn)量 。 步驟一 . 打開(kāi)文件 。 步驟二 . 做一個(gè)簡(jiǎn)單的回歸分析 在上一個(gè)示例結(jié)尾 , 我們知道隨著 D2H增加 , Weight也增加 。 由 D2H的值預(yù)測(cè) Weight的一種方法是使用簡(jiǎn)單的回歸命令 。 Stat ? Regression ? Regression Response 中 , 輸入 Weight。 Predictors 中 , 輸入 D2H。 不妨還做一系列殘差分析圖 , 以便找出潛在的問(wèn)題 。 Graphs。 s 6 54 5. 在 Residuals for Plots下,點(diǎn)擊 Standardized。 6. 在 Residuals Plots ,點(diǎn)擊 Histogram of residuals 和 Normal plot of residuals。 7. 在 Residuals versus the variables下,輸入 D2H。 8. 點(diǎn)擊 OK 兩次。 Minitab便顯示會(huì)話窗口中的文本、三個(gè)圖形。 s 6 55 Regression Analysis The regression equation is Weight = + D2H Predictor Coef StDev T P Constant D2H S = RSq = % RSq(adj) = % Analysis of Variance Source DF SS MS F P Regression 1 Residual Error 18 Total 19 Unusual Observations Obs D2H Weight Fit StDev Fit Residual St Resid 12 126 X 15 74 R denotes an observation with a large standardized residual X denotes an observation whose X value gives it large influence. 4 3 2 1 0 1051015Standardized ResidualFrequencyHistogram of the Residuals(response is Weight)s 6 56 4 3 2 1 0 121012Normal ScoreStandardized ResidualNormal Probability Plot of the Residuals(response is Weight)0 50 100432101D2HStandardized ResidualResiduals Versus D2H(response is Weight) Minitab 顯示了兩個(gè)不規(guī)則的數(shù)據(jù)( 12行和 15行),進(jìn)一步分析之前,首先要檢查 12行和 15行是否包含了有效的數(shù)據(jù)。 不規(guī)則點(diǎn) s 6 57 步驟三 、編輯數(shù)據(jù) Ctrl+D 。 Editor? Go To。 Enter column number or name 中,輸入 WEIGHT Enter row number 中,輸入 12,點(diǎn)擊 OK。在數(shù)據(jù)窗口中,光標(biāo)置于 12行 weight 單元格。 可以看出, Weight 和 D2H看上去顯得相當(dāng)大,然后再檢查原始記錄,發(fā)現(xiàn)12號(hào)樹(shù)生長(zhǎng)很好,說(shuō)明此數(shù)據(jù)正確。按照同樣的方法,找到第 15行。檢查原始記錄,發(fā)現(xiàn)這個(gè)數(shù)據(jù)錯(cuò)誤,不是 ,而是 。 s 6 58 簡(jiǎn)單的重復(fù)一下前面的菜單選擇。 1. 首先關(guān)閉所有圖形窗口。 2. 選擇 Stat ? Regression ? Regression 。 Regression Analysis The regression equation is Weight = + D2H Predictor Coef StDev T P Constant D2H S = RSq = % RSq(adj) = % Analysis of Variance Source DF SS MS F P Regression 1 Residual Error 18 Total 19 Unusual Observations Obs D2H Weight Fit StDev Fit Residual St Resid 12 126 X 17 107 R denotes an observation with a large standardized residual X denotes an observation whose X value gives it large influence. 如果有一個(gè)比較好的模型并且對(duì)所有的統(tǒng)計(jì)假