【正文】
endencyMean Median ModeMidrangeMidhingeMeasures of Variation 偏離程度的度量VariationVariance Standard Deviation Coefficient of VariationPopulationVarianceSample VariancePopulationStandardDeviationSample Standard DeviationRangeInterquartile RangeApplications of Mean and Variance平均數(shù)和方差的應用平均數(shù)平均數(shù) 是對中心位置的度量方法是對中心位置的度量方法方差方差 是對差異的度量方法是對差異的度量方法167。 z –Scores z 分數(shù)分數(shù)167。 Chebyshev’s Theorem契比雪夫定理契比雪夫定理167。 The Empirical Rule經(jīng)驗法則經(jīng)驗法則167。 Detecting Outliers異常值的檢驗異常值的檢驗z –Scoresz分數(shù)167。 z分數(shù)通常稱為標準化數(shù)值分數(shù)通常稱為標準化數(shù)值 167。 被解釋為數(shù)據(jù)值被解釋為數(shù)據(jù)值 xi 偏離平均數(shù)標準差的個數(shù)偏離平均數(shù)標準差的個數(shù)167。 z 分數(shù)大于分數(shù)大于 0的數(shù)據(jù)是那些比平均數(shù)大的數(shù)據(jù)值的數(shù)據(jù)是那些比平均數(shù)大的數(shù)據(jù)值167。 z分數(shù)小于分數(shù)小于 0的數(shù)據(jù)是那些比平均數(shù)小的數(shù)據(jù)值的數(shù)據(jù)是那些比平均數(shù)小的數(shù)據(jù)值167。 z分數(shù)等于分數(shù)等于 0的數(shù)據(jù)是那些與平均數(shù)相等的數(shù)據(jù)值的數(shù)據(jù)是那些與平均數(shù)相等的數(shù)據(jù)值z Score of Smallest Value (425)Example: Apartment Rents房屋租金例實際舉例Chebyshev’S Theorem契比雪夫定理167。 至少至少 (1 1/k 2) 個數(shù)據(jù)落在平均數(shù)個數(shù)據(jù)落在平均數(shù) k 倍標準差倍標準差范圍內(nèi),其中:范圍內(nèi),其中: k 是大于是大于 1的任何數(shù)值的任何數(shù)值167。 至少至少 75%的數(shù)據(jù)落在平均數(shù)的的數(shù)據(jù)落在平均數(shù)的 k = 2 的標準差范的標準差范圍內(nèi)圍內(nèi)167。 至少至少 89%的數(shù)據(jù)落在平均數(shù)的的數(shù)據(jù)落在平均數(shù)的 k = 3 的標準差范的標準差范圍內(nèi)圍內(nèi)167。 至少至少 98%的數(shù)據(jù)落在平均數(shù)的的數(shù)據(jù)落在平均數(shù)的 k = 4的標準差范的標準差范圍內(nèi)圍內(nèi)契比雪夫定理契比雪夫定理 Let k = with = and s = At least (1 1/()2) = 1 = or 56% of the rent values must be between k(s) = () = 409and + k(s) = + () = 573Example: Apartment Rents房屋租金例實際舉例契比雪夫定理(契比雪夫定理( 56%)) 實際上實際上 , 86%的租金值在的租金值在 409和和 573之間之間Example: Apartment Rents房屋租金例實際舉例Empirical Rule經(jīng)驗法則具有鐘形分布的數(shù)據(jù):具有鐘形分布的數(shù)據(jù):167。 大約大約 68%的數(shù)據(jù)落在平均數(shù)的的數(shù)據(jù)落在平均數(shù)的 1倍標準差范圍內(nèi)倍標準差范圍內(nèi)167。 大約大約 95%的數(shù)據(jù)落在平均數(shù)的的數(shù)據(jù)落在平均數(shù)的 2倍標準差范圍內(nèi)倍標準差范圍內(nèi) 167。 幾乎所有的數(shù)據(jù)落在平均數(shù)的幾乎所有的數(shù)據(jù)落在平均數(shù)的 3倍標準差范圍內(nèi)倍標準差范圍內(nèi)Empirical Rule Interval % in IntervalWithin +/ 1 s to 48/70 = 69%Within +/ 2 s to 68/70 = 97%Within +/ 3 s to 70/70 = 100%Example: Apartment Rents房屋租金例實際舉例Detecting Outliers異常值的檢驗167。 一個數(shù)據(jù)集中有一個或更多個非正常大或非正常一個數(shù)據(jù)集中有一個或更多個非正常大或非正常小的數(shù)據(jù)值小的數(shù)據(jù)值167。 z 分數(shù)低于分數(shù)低于 3 或高于或高于 +3的數(shù)據(jù)值可能是異常值的數(shù)據(jù)值可能是異常值 167。 異常值的出現(xiàn)可能是由于記錄的錯誤異常值的出現(xiàn)可能是由于記錄的錯誤167。 異常值的出現(xiàn)可能是由于該數(shù)據(jù)不屬于這個數(shù)據(jù)異常值的出現(xiàn)可能是由于該數(shù)據(jù)不屬于這個數(shù)據(jù)集集167。 異常值的出現(xiàn)也可能是記錄正確的非正常數(shù)據(jù)值異常值的出現(xiàn)也可能是記錄正確的非正常數(shù)據(jù)值Detecting Outliers z 分數(shù)低于分數(shù)低于 3 o或高于或高于 +3的數(shù)據(jù)值可能是異常值的數(shù)據(jù)值可能是異常值 Example: Apartment Rents房屋租金例實際舉例Exploratory Data Analysis探索性數(shù)據(jù)分析167。 FiveNumber Summary 五數(shù)概括五數(shù)概括167。 Box Plot箱圖箱圖FiveNumber Summary五數(shù)概括167。 Smallest Value 最小數(shù)據(jù)值最小數(shù)據(jù)值167。 First Quartile 第一個四分位數(shù)第一個四分位數(shù)167。 Median 中位數(shù)中位數(shù)167。 Third Quartile 第三個四分位數(shù)第三個四分位數(shù)167。 Largest Value 最大值最大值FiveNumber SummaryLowest Value = 425 First Quartile = 450Median = 475Third Quartile = 525 Largest Value = 615Example: Apartment Rents房屋租金例實際舉例 Inner Fences: Q1 (IQR) = 450 (75) = Q3 + (IQR) = 525 + (75) = Outer Fences: Q1 3(IQR) = 450 3(75) = 225 Q3 + 3(IQR) = 525 + 3(75) = 750There are no mild or extreme outliers.375400425450475500525550 575 600 625Box Plot 箱圖實際舉例Measures of Association Between Two Variables雙變量相關關系度量167。 Covariance協(xié)方差協(xié)方差167。 Correlation Coefficient相關系數(shù)相關系數(shù)Covariance協(xié)方差167。 正值表示正相關正值表示正相關167。 負值表示負相關負值表示負相關167。 如果數(shù)據(jù)集是樣本,協(xié)方差記為如果數(shù)據(jù)集是樣本,協(xié)方差記為 sxy.167。 如果數(shù)據(jù)集是總體,協(xié)方差記為如果數(shù)據(jù)集是總體,協(xié)方差記為Correlation Coefficient 相關系數(shù)167。 相關系數(shù)在相關系數(shù)在 1 and +1.167。 值接近值接近 1 表示強烈地負線性相關表示強烈地負線性相關167。 值接近值接近 +1 表示強烈地正線性相關表示強烈地正線性相關 .167。 如果數(shù)據(jù)集是樣本如果數(shù)據(jù)集是樣本 , 相關系數(shù)記為相關系數(shù)記為 rxy.167。 如果數(shù)據(jù)集為總體,相關系數(shù)記為如果數(shù)據(jù)集為總體,相關系數(shù)記為The Weighted Meanand Working with Grouped Data加權平均數(shù)和分組數(shù)據(jù)的加權平均數(shù)167。 The Weighted Mean 加權平均數(shù)加權平均數(shù)167。 Grouped Data 分組數(shù)據(jù)分組數(shù)據(jù)The Weighted Mean加權平均數(shù)167。 加權樣本平均數(shù)加權樣本平均數(shù)167。 加權總體平均數(shù)加權總體平均數(shù)Mean for Grouped Data分組數(shù)據(jù)平均數(shù)167。 Sample Data167。 Population DataVariance for Grouped Data分組數(shù)據(jù)方差167。 Sample Data167。 Population DataShape 形狀描述數(shù)據(jù)是如何分布的167。 形狀的度量 : 對稱性( Symmetric) 或歪曲性 ( skewed)RightSkewedLeftSkewed SymmetricMean = Median = ModeMean Median Mode Median MeanModeSession Summary本講小結 小結167。各種表格方法是對統(tǒng)計數(shù)據(jù)進行初步描述的清晰 易懂的方法167。各種圖形方法可為決策者理清數(shù)據(jù)的一些規(guī)律, 以便于決策制定167。數(shù)值方法是對數(shù)據(jù)進行統(tǒng)計描述的最可靠方法, 可對數(shù)據(jù)的集中程度、分散程度和對稱程度進行 分析The End of Session 2演講完畢,謝謝觀看!