【正文】
基本統(tǒng)計(jì)分析 返回 167。 1 頻數(shù)分布分析 返回 ?定義:頻數(shù)就是一個(gè)變量在各個(gè)變量值上取值的個(gè)案數(shù)。 ?如要了解學(xué)生某次考試的成績(jī)情況,需要計(jì)算出學(xué)生所有分?jǐn)?shù)取值,以及每個(gè)分?jǐn)?shù)取值有多少個(gè)人,這就需要用到頻數(shù)分析。 ?變量的頻數(shù)分析正是實(shí)現(xiàn)上述分析的最好手段,它可以使人們非常清楚地了解變量取值的分布情況。 ?利用一維頻數(shù)分布表可以對(duì)數(shù)據(jù)按組進(jìn)行歸類整理,形成各變量的不同水平的頻數(shù)分布表和圖形,以便對(duì)各變量的數(shù)據(jù)特征好觀測(cè)量分布狀況有一個(gè)概括的認(rèn)識(shí)。 ?交叉表分析過程可以生成二維或多維頻數(shù)表,還可以進(jìn)行分類變量之間的獨(dú)立性檢驗(yàn)。 返回 一、 一維頻數(shù)分布分析過程 (data0501) Analyze? descriptive statistics ?frequencies 選擇 statistics(輸出統(tǒng)計(jì)量 )對(duì)話框 返回 如果中位數(shù)與眾數(shù)相差很大,說明觀測(cè)量中存在異常值 Charts(圖形 )參數(shù)選擇對(duì)話框 返回 頻數(shù)分布表 format(格式 )對(duì)話框 返回 S t a t i s t i c s1 5 1 4 1 5 1 03 7. 5 2 4 . 1 6 8. 0 6 3 . 0 6 3 . 7 8 6 . 7 1 0. 1 2 6 . 1 2 63 2 . 0 0 1 2 . 0 04 1 . 0 0 1 2 . 0 06 0 . 0 0 1 5 . 0 0( 4 ) V a l i d( 5 ) M i s s i n g( 3 ) N( 6 ) S k e w n e s s( 7 ) S t d . E r r o r o f S k e w n e s s( 8 ) K u r t o s i s( 9 ) S t d . E r r o r o f K u r t o s i s255075( 1 0 ) P e r c e n t i l e s( 1 ) A g e o fR e s p o n d e n t( 2 ) H i g h e s t Y e a ro f S c h o o lC o m p l e t e dData0501 age eudc 不同年齡人員與其受教育年限的統(tǒng)計(jì)表 返回 H i g h e s t Y e a r o f S c h o o l C o m p l e t e d2 .1 .1 .15 .3 .3 .55 .3 .3 .86 .4 .4 1 . 212 .8 .8 2 . 025 1 . 6 1 . 7 3 . 668 4 . 5 4 . 5 8 . 156 3 . 7 3 . 7 1 1 . 973 4 . 8 4 . 8 1 6 . 785 5 . 6 5 . 6 2 2 . 34 6 1 3 0 . 4 3 0 . 5 5 2 . 81 3 0 8 . 6 8 . 6 6 1 . 51 7 5 1 1 . 5 1 1 . 6 7 3 . 073 4 . 8 4 . 8 7 7 . 91 9 4 1 2 . 8 1 2 . 8 9 0 . 743 2 . 8 2 . 8 9 3 . 645 3 . 0 3 . 0 9 6 . 622 1 . 5 1 . 5 9 8 . 030 2 . 0 2 . 0 1 0 0 . 01 5 1 0 9 9 . 5 1 0 0 . 07 .51 5 1 7 1 0 0 . 0034567891011121314151617181920T o t a l( 5 ) V a l i dNA( 6 ) M i s s i n g( 7 ) T o t a l( 1 ) F r e q u e n c y ( 2 ) P e r c e n t( 3 ) V a l i dP e r c e n t( 4 ) C u m u l a t i v eP e r c e n t受教育年限的頻數(shù)分布表 返回 age變量的直方圖 返回 educ變量直方圖 返回 二、 交叉表分析 analyze ?descriptive statistics ? crosstabs (data0501) 返回 ?前面的分析都是對(duì)單個(gè)變量的數(shù)據(jù)分布情況進(jìn)行分析。但在實(shí)際分析中,還需要掌握多個(gè)變量在不同取值情況下的數(shù)據(jù)分布情況,從而進(jìn)一步深入分析變量之間的相互影響和關(guān)系,這種分析就稱為 交叉列聯(lián)表分析。 ?交叉列聯(lián)表分析除了列出交叉分組下的頻數(shù)分布外,還需要分析兩個(gè)變量之間是否具有獨(dú)立性或一定的相關(guān)性。要獲得變量之間的相關(guān)性,僅僅靠頻數(shù)分布的數(shù)據(jù)是不夠的,還需要借助一些變量間相關(guān)程度的統(tǒng)計(jì)量和一些非參數(shù)檢驗(yàn)的方法。 ?常用的衡量變量間相關(guān)程度的統(tǒng)計(jì)量是簡(jiǎn)單相關(guān)系數(shù)(參見本書有關(guān)章節(jié)),但在交叉列聯(lián)表分析中,由于行列變量往往不是連續(xù)變量,不符合計(jì)算簡(jiǎn)單相關(guān)系數(shù)的前提條件。因此需要根據(jù)變量的性質(zhì),選擇其他的相關(guān)系數(shù),如 Kendall等級(jí)相關(guān)系數(shù)、Eta值等。 ?SPSS提供了多種適用于不同相關(guān)系數(shù)的相關(guān)關(guān)系,這些檢驗(yàn)的 零假設(shè) 是:行和列變量之間 彼此獨(dú)立 ,不存在顯著的相關(guān)關(guān)系。 ?SPSS將自動(dòng)給出檢驗(yàn)的 P值,如果 P值 小于 顯著性水平 ,那么應(yīng)拒絕零假設(shè),認(rèn)為行列變量之間彼此相關(guān)。 計(jì)算公式如下。 ( 1)卡方統(tǒng)計(jì)量檢驗(yàn)是常用的檢驗(yàn)行列變量之間是否相關(guān)的方法。交叉列聯(lián)表的卡方檢驗(yàn)零假設(shè)是:行列變量之間獨(dú)立,計(jì)算公式為 卡方統(tǒng)計(jì)量服從(行數(shù) ?1) (列數(shù) ?1)個(gè)自由度的卡方統(tǒng)計(jì), SPSS在自動(dòng)計(jì)算卡方統(tǒng)計(jì)量后,還會(huì)給出相應(yīng)的 P值。 注意: 使