【正文】
意:該統(tǒng)計表的表格形式與前面統(tǒng)計表有何不同?是否合理? 年齡(歲) 人數(shù)(個) 25 35 30 統(tǒng)計數(shù)據(jù)類型的拓展 統(tǒng)計數(shù)據(jù)僅僅局限于“數(shù)字”嗎? 統(tǒng)計數(shù)據(jù)可以是定比變量(數(shù)字比率),可以是定距變量(數(shù)字距離),可以是定序變量(文字次序),可以是定類變量(文字名稱),那么,進一步思考:統(tǒng)計數(shù)據(jù)還可以是什么?或者說,統(tǒng)計是從定類變量開始的嗎? 康德曾說:“吾人之一切知識皆起于經(jīng)驗,此不容置疑者也”( 《純粹理性批判 》 ,藍公武譯),人類的認識總是從感性認識上升到理性認識,據(jù)此,則經(jīng)驗形態(tài)的感覺是否要加以考慮呢?也就是說,人類對事物的感覺認識是否可以拓展為統(tǒng)計數(shù)據(jù)呢?“普遍感覺”, 第三章 單變量統(tǒng)計描述 三、統(tǒng)計圖 統(tǒng)計圖一般借助 Excel實現(xiàn)。圓瓣圖多用于定類變量。長條一般為等寬,其寬度沒有意義;長條之間通常留有空隙間隔。 老中青人數(shù)分布圖0510152025老年 中年 青年年齡類別人數(shù)(個)系列1第三章 單變量統(tǒng)計描述 (三)直方圖( Histograms) 直方圖由連續(xù)無空隙間隔的長條組成,若長條寬度相等,則僅由其高度表示變量值出現(xiàn)次數(shù)或頻率的多少;若長條寬度不等,則由其面積大小表示變量值出現(xiàn)次數(shù)或頻率的多少。 直方圖示例見下頁( Excel無法制作直方圖, 明晰實用的制作直方圖功能)。 105202510051015202530系列1系列1 10 5 20 25 1012 23 34 45 56第三章 單變量統(tǒng)計描述 四、累計頻數(shù)分布 ,然后由標志值低的組向標志值高的組依次累計頻數(shù)。 累計頻數(shù)分布例題 洛倫茲曲線( Lorenz curve) 通過絡倫茲曲線,可以直觀地看到一個國家收入分配平等或不平等的狀況。在矩形的長上,將 100的家庭從最貧者到最富者自左向右排列,也分為 5等分,第一個等份代表收入最低的 20的家庭。整個的洛倫茲曲線是一個正方形,正方形的底邊即橫軸代表收入獲得者在總人口中的百分比,正方形的左邊即縱軸顯示的是各個百分比人口所獲得的收入的百分比。實際收入分配曲線即洛倫茲曲線都在均等線的右下方。 To draw conclusions from data you pare summary values, a measure of average and a measure of spread. An average indicates the typical value of a set of data. Mean, median and mode are all types of average. Range is a measure of spread. 第三章 單變量統(tǒng)計描述 集中趨勢:概括與典型的數(shù)據(jù)信息(數(shù)據(jù)的主要特征) 損失信息:具體與瑣碎的數(shù)據(jù)信息(數(shù)據(jù)的次要特征) 提煉數(shù)據(jù)的集中趨勢,概括數(shù)據(jù)的主要特征,可以變量值的頻數(shù)多 少為依據(jù)(頻數(shù)多者為典型變量值),也可以變量值的位置前后為依據(jù)(位置居中者為典型變量值),更可以變量值自身大小為依據(jù)(由抽象、概括而得的平均變量值為典型變量值)。 ,則變量值的代表性愈高。 、序、距、比四個層次的變量。 眾數(shù) (眾數(shù)的不唯一性) 定類變量的眾數(shù) 定序變量的眾數(shù) 數(shù)值變量的眾數(shù) 數(shù)值變量的眾數(shù) 中位數(shù) ( Median) 中位數(shù) ( Median) My family was in a middle position, neither very poor nor very rich. My father thought this was the best kind of family to belong to. __Robinson Crusoe Outliers(極端值) Watch for particularly low or particularly high scores when calculating a mean. Certainly watch for outliers. Very low or very high scores may produce a mean that is not very typical of most scores, especially when the number of cases is small. 4, 8, 10, 11, 9, 600: the mean would be 107, which is not typical or representative of what the six scores “really” are. The better as an average. Social Statistics, William Fox 第三章 單變量統(tǒng)計描述 二、中位值( median) Me 中位值是數(shù)據(jù)序列之中央位置之變量值。中位 值適用于序、距、比三個層次的變量。 ( 2)觀測總數(shù) N為偶數(shù)( Even)時: 中位值位于 的地方(中位值為相鄰數(shù)值的平均值)。 平均值適用于定距以上變量。頻次對平均值具有權衡輕重的作用,因此稱為權數(shù)。 ??????????iiikkknxnnnnxnxnxnx.. ... .212211均值 (計算公式) 簡單均值 (算例) 加權均值 (算例) 加權均值 (權數(shù)對均值的影響) 均值 (數(shù)學性質) 眾數(shù)、中位數(shù)和均值的關系 (橫軸:變量值;縱軸:頻次)中位數(shù)始終居中,眾數(shù)始終最高,均值有大