【正文】
rom first value 中輸入 1,在 To last value 中輸入 2 。 4. 既然有 10個 1和 10個 2, 在 List each value 中 , 輸入 10 , 然后點擊 OK 。新生成的數據如下: s 6 47 描述性統計計算 步驟四 、 描述性統計計算 Minitab提供了許多基本統計方法進行數據分析 , 例如描述性統計 、 t檢驗 、z檢驗以及相關性 。 對于兩個不同地方的樹,應當分別生成統計表對三個變量 Diameter、Height 和 Weight 進行說明。 Stat ? Basic Statistics ? Display Descriptive Statistics。 , 點擊 Diameter 然后拖曳鼠標使 Diameter、Height、 Weight 高亮度顯示 , 然后點擊 Select 。 By variable, 輸入 Site。 通過 Minitab 對不同地方的樹在直徑 、 高度 、 重量上分別生成統計結果 。 Graphs。 5. 選中 Boxplot of data, 然后點擊 OK兩次 。 s 6 48 描述性統計計算 Descriptive Statistics: Diameter, Height, Weight by site Variable site N Mean Median TrMean StDev Diameter 1 10 2 10 Height 1 10 2 10 Weight 1 10 2 10 Variable site SE Mean Minimum Maximum Q1 Q3 Diameter 1 2 Height 1 2 Weight 1 2 從盒式圖 (boxplot)可以判斷出 , 地方 2的樹比地方 1的樹大 。 會話窗口的文本輸出包含以下信息: 在地方 2三個變量都顯示出比較大的平均值和中央值 。 而且 , 變量 Weight相對其尺寸來說有一個比較大的標準偏差 。 在地方 2, 最小重量只有 值是 , 這表明一部分白楊樹生長得很好 , 可是其他的僅僅只是活著而已 。 2 1 5 4 3 2 1 site D i a m e t e r Boxplots of Diameter by site 2 1 site W e i g h t Boxplots of Weight by site 2 1 6 5 4 3 2 site H e i g h t Boxplots of Height by site s 6 49 算術運算 步驟五 、 進行算術運算 現在的任務是估計樹的重量。根據以前的工作,研究人員發(fā)現樹的重量和直徑平方與高度之積有關。手頭有直徑和高度的數據,利用計數器計算新的變量。計數器將輸入的方程式結果計算出來并保存于指定的變量。 1. 選擇 Calc ? Calculator。 2. 將新的變量命名為 D2H,表示直徑的平方與高之積。在 Store result in variable 中,輸入 D2H . 3. 在 Expression中,鍵入 C1**2*C2 ,點擊 OK 。 計算結果顯示如下: s 6 50 生成散點圖 步驟六、生成散點圖 研究人員得出在重量與 D2H之間存在一種關系。通過散點圖,可以驗證這一點。 1. 選擇 Graph ? Plot。 2. 在 Y 中,輸入 Weight . 3. 在 X 中,輸入 D2H 然后點擊 OK 。 100 50 0 D2H W e i g h t 圖形窗口輸出結果: 由此可以看出, Weight和 D2H之間存在正的線性關系,也就是說, D2H增加的話, Weight也同樣增加。圖上出現了一個不正常點:有一棵樹只有很小的重量,但 D2H值卻相當高?,F在將其忽略,但以后還得進一步檢查。下一步是計算這二者的相關性并且將其量化。 不規(guī)則點 s 6 51 計算相關系數 步驟七、計算相關系數 從散點圖知隨著 D2H增長, WEIGHT也同樣增長,現在通過計算相關系數找出這兩個變量的具體關聯性。 1. 選擇 Stat ? Basic Statistics ? Correlation. 2. 在 Variables 中,輸入 Weight 和 D2H,點擊 OK 。 會話窗口輸出 : Pearson correlation of Weight and D2H = PValue = 相關系數是兩個變量之間線性關系的度量 , 其值介于 1和 +1之間 , 此處 , 相關系數為正的 , 接近于 1, 從而把散點圖中所表示的關系量化了 。 說明變量 WEIGHT和 D2H 之間存在很強的線性關系 。 s 6 52 第六章 做一個簡單分析 s 6 53 背景 賓夕法尼亞州立大學的研究者們種植了成百上千的白楊樹并且在一系列受控條件下讓其生長 .三年后 ,抽取一批為樣本 , 以厘米為單位測量其直徑 、 以米為單位測量其高度 、 千克為單位稱其干重 。 前面知道 , 在干重與 D2H之間存在相近的關系 。 但是到底是一種怎樣的關系呢 ? 這些快速生長 、 質地堅硬的樹 , 將來某一天也許會作為燃料或者化學物質的一種選擇 。 作為數據分析員 , 知道了直徑和高度的測量值之后 , 能否可靠的預測出樹的產量 。 步驟一 . 打開文件 。 步驟二 . 做一個簡單的回歸分析 在上一個示例結尾 , 我們知道隨著 D2H增加 , Weight也增加 。 由 D2H的值預測 Weight的一種方法是使用簡單的回歸命令 。 Stat ? Regression ? Regression Response 中 , 輸入 Weight。 Predictors 中 , 輸入 D2H。 不妨還做一系列殘差分析圖 , 以便找出潛在的問題 。 Graphs。 s 6 54 5. 在 Residuals for Plots下,點擊 Standardized。 6. 在 Residuals Plots ,點擊 Histogram of residuals 和 Normal plot of residuals。 7. 在 Residuals versus the variables下,輸入 D2H。 8. 點擊 OK 兩次。 Minitab便顯示會話窗口中的文本、三個圖形。 s 6 55 Regression Analysis The regression equation is Weight = + D2H Predictor Coef StDev T P Constant D2H S = RSq = % RSq(adj) = % Analysis of Variance Source DF SS MS F P Regression 1 Residual Error 18 Total 19 Unusual Observations Obs D2H Weight Fit StDev Fit Residual St Resid 12 126 X 15 74 R denotes an observation with a large standardized residual X denotes an observation whose X value gives it large influence. 4 3 2 1 0 1051015Standardized ResidualFrequencyHistogram of the Residuals(response is Weight)s 6 56 4 3 2 1 0 121012Normal ScoreStandardized ResidualNormal Probability Plot of the Residuals(response is Weight)0 50 100432101D2HStandardized ResidualResiduals Versus D2H(response is Weight) Minitab 顯示了兩個不規(guī)則的數據( 12行和 15行),進一步分析之前,首先要檢查 12行和 15行是否包含了有效的數據。 不規(guī)則點 s 6 57 步驟三 、編輯數據 Ctrl+D 。 Editor? Go To。 Enter column number or name 中,輸入 WEIGHT Enter row number 中,輸入 12,點擊 OK。在數據窗口中,光標置于 12行 weight 單元格。 可以看出, Weight 和 D2H看上去顯得相當大,然后再檢查原始記錄,發(fā)現12號樹生長很好,說明此數據正確。按照同樣的方法,找到第 15行。檢查原始記錄,發(fā)現這個數據錯誤,不是 ,而是 。 s 6 58 簡單的重復一下前面的菜單選擇。 1. 首先關閉所有圖形窗口。 2. 選擇 Stat ? Regression ? Regression 。 Regression Analysis The regression equation is Weight = + D2H Predictor Coef StDev T P Constant D2H S = RSq = % RSq(adj) = % Analysis of Variance Source DF SS MS F P Regression 1 Residual Error 18 Total 19 Unusual Observations Obs D2H Weight Fit StDev Fit Residual St Resid 12 126 X 17 107 R denotes an observation with a large standardized residual X denotes an observation whose X value gives it large influence. 如果有一個比較好的模型并且對所有的統計假