【正文】
N 4 五年級 Mean N 7 六年級 Mean N 4 Mean Minimum Maximum N 15 女 四年級 Mean N 4 五年級 Mean N 7 六年級 Mean N 4 Mean Minimum Maximum N 15 Grand Total Kurtosis Skewness 表分為 3部分: :各年級的均值和個數(shù),全體男生的均值、個數(shù)、最大值和最小值; :各年級的均值和個數(shù),全體女生的均值、個數(shù)、最大值和最小值; :標(biāo)準(zhǔn)差、偏度和峰度。單擊“ OK”完成, 輸出結(jié)果見表 4- 8。 2020/9/16 43 選擇一個或多個變量右移入Variable(s)框。默認(rèn)為 10 多變量框中可設(shè)定多變量表格輸出的格式 設(shè)置頻數(shù)表輸出的格式 選擇頻數(shù)表中排列順序 按變量升序排列,此為默認(rèn) 按變量降序排列 按變量各種取值發(fā)生的頻數(shù)的升序排列 按變量各種取值發(fā)生的頻數(shù)的降序排列 2020/9/16 47 表 4— 9 100名大學(xué)生血清蛋白含量( %) Ⅲ 、例題分析 042對某高校 100名大學(xué)生血清蛋白含量( g%)做頻數(shù)分析,數(shù)據(jù)如表 4— 9 2020/9/16 48 ( 1)具體步驟 打開數(shù)據(jù)文件“ 大學(xué)生血清 .sav”,按 Analyze—Descriptive Statistic— Frequencies 順序,打開Frequencies對話框。 單擊 Format 按鈕,選 Ascending項(xiàng)。如圖 在左邊框中選一個或多個變量移入 如選中此框,將對Variables框中選擇的變量進(jìn)行標(biāo)準(zhǔn)化 , 產(chǎn)生相應(yīng)的 Z分?jǐn)?shù),并作為新變量保存到數(shù)據(jù)窗口,其變量名在原變量名前加 z。 選中 Save standardized values as variables 復(fù)選框,要求計(jì)算變量的 z值,并保存結(jié)果到當(dāng)前數(shù)據(jù)集中。探索分析過程將提供在分組和不分組的情況下常用的統(tǒng)計(jì)量與圖形。 該框中的變量作為標(biāo)識符 , 在輸出諸如異常值時 ,用該變量進(jìn)行標(biāo)識,只允許有一個標(biāo)識符。 輸出 5%、 10%、 25%、 50%、75%、 90%和 95%的百分位數(shù)。 Boxplots欄只有在主對話框中指定了一個以上變量時,才有效。 ?分組變量的缺失值被單獨(dú)分為一組,輸出頻數(shù)時將標(biāo)出缺失組。 sM E s t i m a t o raT u k e y 39。 Leaf 12 . 1 12 . 8999 13 . 122 13 . 55567 14 . 00 Stem width: Each leaf: 1 case(s) 少兒身高的莖葉圖 少兒身高的箱線圖 2020/9/16 65 結(jié)果分析 表 413摘要性地說明了數(shù)據(jù)的基本情況,包括總數(shù)、有效值數(shù)目和缺失值數(shù)。 表 417是方差的一致性檢驗(yàn),零假設(shè)是分組后的方差為相等的。每行的莖和葉組成的數(shù)字再乘以莖寬,即得到實(shí)際數(shù)據(jù)的近似值,實(shí)際數(shù)據(jù)中與該近似值靠近的值的個數(shù)即為頻數(shù)表示的個數(shù)。 奇異值用“ o”表出,本例中無奇異值。此外,還可計(jì)算四格表確切概率( Fisher’s Exact Test),且有單雙側(cè)( OneTail、 TwoTail)、對數(shù)似然比檢驗(yàn)( Likelihood Ratio)以及線性關(guān)系的 MantelHaenszel χ2檢驗(yàn)。 只輸出統(tǒng)計(jì)量 ,不輸出多維列聯(lián)表。 是 Gamma檢驗(yàn)的非對稱推廣。 Crosstabs的 Statistics 對話框 2020/9/16 71 Crosstabs的 Cell Display 對話框 選擇在列聯(lián)表中輸出的統(tǒng)計(jì)量,包括觀測量數(shù)、百分比、殘差 輸出觀測量的實(shí)際數(shù)量 如果行和列變量在統(tǒng)計(jì)上是獨(dú)立的或不相關(guān)的,那么會在單元格中輸出期望的觀測值的數(shù)量。 Weight Cases by,再將變量 n選入 Frequence Variable 框,單擊 OK完成加權(quán)。 單擊 Cell按鈕,打開 Cell display對話框,選中 observed和 Expected 復(fù)選框,單擊 Continue返回;單擊 OK。 s E x a c t T e s tL i n e a r b y L i n e a rA s s o c i a t i o nN o f V a l i d C a s e sV a l u e dfA s y m p . S i g .( 2 s i d e d )E x a c t S i g .( 2 s i d e d )E x a c t S i g .( 1 s i d e d )C o m p u t e d o n l y f o r a 2 x 2 t a b l ea . 0 c e l l s ( . 0 % ) h a v e e x p e c t e d c o u n t l e s s t h a n 5 . T h e m i n i m u m e x p e c t e d c o u n t i s2 2 . 1 4 .b . 吸煙與患病列聯(lián)表 卡方檢驗(yàn) 2020/9/16 76 S y m m e t r i c M e a s u r e s. 1 4 8 . 0 0 6. 1 4 8 . 0 0 6. 1 4 7 . 0 0 63 3 9P h iC r a m e r 39。 對稱性檢驗(yàn)表 77 2020/9/16 第三節(jié) 比率分析 ?1. 比率分析的目的和主要指標(biāo) 比率分析用于對兩變量間變量值比率變化的描述分析,適用于 數(shù)值型變量 。 ( 2) AAD( Average Absolute Deviation)平均絕對離差 :是對比率變量離散程度的描述,計(jì)算公式為: 其中, 是比率數(shù), M是比率變量的中位數(shù),N為樣本數(shù) iRMAADN?? ?iR80 2020/9/16 ( 3) COD( Coefficient of Dispersion)離散系數(shù) :也是對比率變量離散程度的描述,計(jì)算公式為: ( 4) PRD( Pricerelated Differential)相關(guān)價格微分 :是比率均值與加權(quán)比率均值的比,也是比率變量離散程度的描述。 ( 4)單擊 Statistics按鈕指定輸出哪些關(guān)于比率的描述統(tǒng)計(jì)量,出現(xiàn)如下窗口: 至此, SPSS將自動計(jì)算比率變量,并將相關(guān)指標(biāo)輸出到輸出窗口中。 該框的變量為自變量,必須至少有一個變量 單擊此按鈕,進(jìn)入下一層,返回則按Previous按鈕。 2020/9/16 87 三、 [047]例題分析 某醫(yī)生測得如下血紅蛋白值 (g%),用Means過程對其做基本的描述性統(tǒng)計(jì)分析。 Test for linearity:產(chǎn)生因變量與第一層自變量的 R和 R2。 二、完全窗口分析 按 Analyze— Compare Means—Means順序,打開 Means主對話框(如圖 41)。前者是通常意義下的變異系數(shù),是標(biāo)準(zhǔn)差除以均值;后者定義為: 2()()iRMNC O VM???82 2020/9/16 ?2. 比率分析的基本步驟 ( 1)選擇菜單 Analyze- Descriptive Statistics-Radio,出現(xiàn)窗口 83 2020/9/16 ( 2)將比率變量的分子選擇到 Numerator框中,將比率變量的分母選到 Denominator框中。 78 2020/9/16 通常的分析可以生成各個地區(qū)財產(chǎn)保險業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比率變量,然后對該比率變量計(jì)算基本描述統(tǒng)計(jì)量(如均值、中位數(shù)、標(biāo)準(zhǔn)差、全距等),進(jìn)而刻畫比率變量的集中趨勢和離散程度。由于使用卡方檢驗(yàn)要求每個單元格頻數(shù)不少于 5,當(dāng)條件不滿足時,還可用 Fisher精確檢驗(yàn),其雙側(cè)檢驗(yàn) P值為。 從列聯(lián)表中可看出,吸煙人中患病者有 43人,比期望值 ,不吸煙人中患病者只有13人,比期望值 。將 x 變量選入 Row框作為行變量,將 h變量選入 Column 框作為列變量。數(shù)據(jù)文件名為“ ”。 與 Kendall’s tauc相似 適用于定序變量: 用于檢驗(yàn)相關(guān)性 用于檢驗(yàn)兩個評估人對同一對象的評估是否具有一致系。 進(jìn)行相關(guān)系數(shù)的檢驗(yàn),有兩項(xiàng)結(jié)果顯示: Pearson相關(guān)系數(shù)和 Spearman相關(guān)系數(shù) 適用于定類變量的統(tǒng)計(jì)量: 基于卡方檢驗(yàn)基礎(chǔ)上對相關(guān)性的檢驗(yàn) 用來描述相關(guān)性 當(dāng)用自變量預(yù)測因變量時,此系數(shù)反映這種預(yù)測降低錯誤的比率。如圖 2020/9/16 69 該框中的變量作為分布表中的行 (列 )變量,必須是數(shù)值型或字符型分類變量。而多個行、列、控制變量就可組成一個復(fù)雜的多維列聯(lián)表。 方箱上下兩條縱向直線是觸須線,觸須線外的兩端線為本體的最大值和最小值。由于其 P值均大于 ,不能否定零假設(shè),即可以認(rèn)為男生和女生的身高的方差是無差異的。 表 415下面的 a、 b、 c、 d分別表示四種加權(quán)常數(shù),此表的結(jié)果是使用四種不同的方法計(jì)算出的 M估計(jì)量的結(jié)果。 sM E s t i m a t o r