【文章內(nèi)容簡(jiǎn)介】
jk k k kk k k???? ?? 211()rcijijkz??? ?? ( 8 . 15 ) 其中. . . .( / ) /ij ij i j i jz k k k k k k??,當(dāng)假設(shè)0H:因素 A 和因素 B 是獨(dú)立成立時(shí),在n足夠大的條件下,2?服從自由度為( 1 ) ( 1 )rc??的2?分布。拒絕區(qū)域?yàn)?: 221 [ ( 1 ) ( 1 ) ]rc??? ?? ? ? ? 通過上面的分析,我們應(yīng)該注意幾個(gè)問題。 第一,這里的ijz是原始列聯(lián)資料() i j r ck ??K通過相應(yīng)變換以后得到的資料陣() i j r cz ??Z的元素。說明ijz與2?統(tǒng)計(jì)量有著內(nèi)在的聯(lián)系。 第二,關(guān)于因素 B 和因素 A 各水平構(gòu)成的協(xié)差陣cΣ和rΣ,由( 8. 15 )式知,2( ) ( ) /crtr tr k???Σ Σ,這里( . )tr表示矩陣的跡。 第三,獨(dú)立性檢驗(yàn)只能判斷因素 A 和因素 B 是否獨(dú)立。如果因素 A 和因素 B 獨(dú)立,則沒有必要進(jìn)行相應(yīng)分析;如果因素 A 和因素 B 不獨(dú)立,可以進(jìn)一步通過相應(yīng)分析考察兩因素各個(gè)水平之間的相關(guān)關(guān)系。 第五節(jié) 實(shí)例分析與計(jì)算機(jī)實(shí)現(xiàn) 一 利用 SPSS進(jìn)行相應(yīng)分析 —— 實(shí)例 1 二 利用 SPSS進(jìn)行相應(yīng)分析 —— 實(shí)例 2 一、利用 SPSS進(jìn)行相應(yīng)分析 —— 實(shí)例 1 ? 數(shù)據(jù)來自 SPSS軟件自帶數(shù)據(jù)集 ,為 1992年美國大選的部分?jǐn)?shù)據(jù)。要求對(duì)選民的最高學(xué)歷水平( degree)和所支持的總統(tǒng)候選人( pres92)進(jìn)行相應(yīng)分析。 (一)操作步驟 1. 正確打開數(shù)據(jù)集 ,由 Analyze→Data Reduction→Correspondence Analysis 可進(jìn)入相應(yīng)分析的主對(duì)話框(圖 )。 圖 相應(yīng)分析主界面 2. 從左側(cè)變量列表中選擇兩個(gè)變量作為相應(yīng)分析的兩個(gè)維度。這里我們選擇 pres92作為行維度,點(diǎn)擊 Row左側(cè)的三角箭頭就可以看到在 Row項(xiàng)下出現(xiàn)了 pres92(? ?),這時(shí)用鼠標(biāo)選中該變量,其下方的 Define Range子對(duì)話框激活,點(diǎn)擊后出現(xiàn)變量水平設(shè)置窗口(圖 )。分為上下兩個(gè)部分:Category range for row variable: pres92和 Category Constraints。 ? 這里要分析所有的三位總統(tǒng)候選人和選民的學(xué)歷水平的關(guān)系,所以在 Minimum value中填入 1,在 Maximum value中填入 3,之后點(diǎn)擊 Update按鈕。就可以在下方的 Category Constraints欄中看到,后續(xù)分析中的行變量?jī)H包含 3個(gè)類目,分別是 2和 3。 圖 Define Row Range子對(duì)話框 ? 在右側(cè)還有三個(gè)單選項(xiàng): None表示沒有任何約束; Categories must be equal可用于指定某些類目的得分必須相同,最多可以設(shè)置有效類目的個(gè)數(shù)減 1個(gè)得分相等的類目,如本例中最多可以設(shè)置 2個(gè)類目得分相等; Category is supplemental表示某些類目不參加相應(yīng)分析但是會(huì)在圖形中標(biāo)示。這里我們不對(duì)分類進(jìn)行任何約束,點(diǎn)擊 Continue按鈕后回到主對(duì)話框。 ? 類似的可以指定 degree的有效類目最小值為 0,最大值為 4。 Model按鈕,指定相應(yīng)分析結(jié)果的維數(shù)。(圖 ) ( 1) Dimensions in solution。默認(rèn)為 2,最大可以設(shè)置為各變量 中的最少類目數(shù)減 1。 ( 2)選擇距離測(cè)度的方式 Distance Measure。有 Chi square 和 Euclidean兩種,定性變量應(yīng)該用 Chi square。 ( 3)標(biāo)準(zhǔn)化方法 Standardization Method。 圖 Model子對(duì)話框 ( 4)正態(tài)化方法 Normalization Method。需要比較行列變量的類 目差異時(shí)選擇 Symmetrical,需要比較行列變量中任意兩個(gè)類目的 差異時(shí)選擇 Principal,比較行變量的類目差異時(shí)選擇 Row principal,而比較列變量的類目差異時(shí)選擇 Column principal,也 可以在 Customize中指定 [1,1]之間的任意實(shí)數(shù),特別的,如果輸入 1則為 Column principal,輸入 1為 Row principal,輸入 0為 Symmetrical。而一般該對(duì)話框中的選項(xiàng)無需改動(dòng)。 Statistics按鈕,設(shè)定輸出的相應(yīng)分析統(tǒng)計(jì)量,如圖 ??梢灾付ㄝ敵鱿鄳?yīng)分析表 Correspondence table,行點(diǎn)總覽表 Overview of row points,列點(diǎn)總覽表 Overview of column points,行輪廓 Row profiles,列輪廓 Column profiles。默認(rèn)只輸出前三項(xiàng)。而 Permutations of the correspondence table是用于指定前 n個(gè)維度的行列得分表。如果該項(xiàng)選中,下方的 Maximum dimension for permutations被激活,用于指定維度 n。此外,還可以在 Confidence Statistics for復(fù)選項(xiàng)中選擇計(jì)算行點(diǎn)和列點(diǎn)的標(biāo)準(zhǔn)差以及相關(guān)系數(shù)。 圖 Statistics子對(duì)話框 Plots按鈕,設(shè)定輸出的統(tǒng)計(jì)圖,如圖 。可以指定輸出相應(yīng)分析的散點(diǎn)圖 Scatterplots,默認(rèn)只輸出包含行列變量的雙變量散點(diǎn)圖 Biplot。也可指定輸出行點(diǎn)圖 Row points和列點(diǎn)圖 Column points。而 ID label width for Scatterplots是指定散點(diǎn)標(biāo)簽的長(zhǎng)度,默認(rèn) 20。下方的 Line plots項(xiàng)中,可以輸出行 /列點(diǎn)對(duì)應(yīng)于行 /列得分的線圖,和散點(diǎn)圖類似。 6. 我們?cè)?Model, Statistics, Plots三個(gè)子對(duì)話框中都使用默認(rèn)設(shè)定,點(diǎn)擊主對(duì)話框的 OK按鈕,即得到相應(yīng)分析的結(jié)果。 圖 Plots子對(duì)話框 (二)結(jié)果分析: SPSS運(yùn)行相應(yīng)分析后會(huì)產(chǎn)生以下四張表(表 )。 1. Correspondence Table(相應(yīng)分析表),如表 ,即列聯(lián)表。 ? Active Margin為邊際頻數(shù)。大致可以看出 Clinton在各個(gè)學(xué)歷層次都有最高的票數(shù)。 C o r r e s p o n d e n c e T a b l e R S H I G H E S T D E G R E E V O T E F O R C L I N T O N , B U S H , P E R O T l t h i g h s c h o o l h i g h s c h o o l ju n i o r c o l l e g e b a c h e l o r g r a d u a te d e g r e e A c ti v e M a r g i n B u s h 55 349 48 146 63 661 P e r o t 12 159 26 62 19 278 C l i n to n 122 436 58 178 111 905 A c ti v e M a r g i n 189 944 132 386 193 1844 表 列聯(lián)表 2. Summary(總覽表),如表 。 ? 表中從左到右依次是維度編號(hào)、奇異值、慣量、卡方統(tǒng)計(jì)量、顯著性、慣量所占總慣量比例、每個(gè)維度的奇異值的標(biāo)準(zhǔn)差和相關(guān)系數(shù)。 Singular Value為特征值的平方根,根據(jù)總慣量和特征值求和相等,有 +=+=。第一個(gè)維度慣量 ,占總慣量的 %,第二個(gè)維度慣量接近 0,僅占總慣量 %。因此可以認(rèn)為只要用一個(gè)維度就可以解釋行列變量之間所有的關(guān)系,但為了說明分析過程,仍然保留兩個(gè)維度??倯T量 247。 1844=,滿足總慣量和卡方統(tǒng)計(jì)量的關(guān)系式。同時(shí)卡方統(tǒng)計(jì)量的自由度 8=(31) (51),數(shù)值為,說明行列變量之間存在顯著的相關(guān)性,相應(yīng)分析是有意義的。 S u m m ar y P r op or ti on of I n e r ti a C on fi d e n c e S i n g u l ar V al u e