【正文】
Overview Row Points與 Overview Column Points(行 /列點總覽表),如表 ,表 。 1844=,滿足總慣量和卡方統(tǒng)計量的關系式。因此可以認為只要用一個維度就可以解釋行列變量之間所有的關系,但為了說明分析過程,仍然保留兩個維度。 Singular Value為特征值的平方根,根據總慣量和特征值求和相等,有 +=+=。 C o r r e s p o n d e n c e T a b l e R S H I G H E S T D E G R E E V O T E F O R C L I N T O N , B U S H , P E R O T l t h i g h s c h o o l h i g h s c h o o l ju n i o r c o l l e g e b a c h e l o r g r a d u a te d e g r e e A c ti v e M a r g i n B u s h 55 349 48 146 63 661 P e r o t 12 159 26 62 19 278 C l i n to n 122 436 58 178 111 905 A c ti v e M a r g i n 189 944 132 386 193 1844 表 列聯(lián)表 2. Summary(總覽表),如表 。 ? Active Margin為邊際頻數(shù)。 圖 Plots子對話框 (二)結果分析: SPSS運行相應分析后會產生以下四張表(表 )。下方的 Line plots項中,可以輸出行 /列點對應于行 /列得分的線圖,和散點圖類似。也可指定輸出行點圖 Row points和列點圖 Column points。 圖 Statistics子對話框 Plots按鈕,設定輸出的統(tǒng)計圖,如圖 。如果該項選中,下方的 Maximum dimension for permutations被激活,用于指定維度 n。默認只輸出前三項。 Statistics按鈕,設定輸出的相應分析統(tǒng)計量,如圖 。需要比較行列變量的類 目差異時選擇 Symmetrical,需要比較行列變量中任意兩個類目的 差異時選擇 Principal,比較行變量的類目差異時選擇 Row principal,而比較列變量的類目差異時選擇 Column principal,也 可以在 Customize中指定 [1,1]之間的任意實數(shù),特別的,如果輸入 1則為 Column principal,輸入 1為 Row principal,輸入 0為 Symmetrical。 ( 3)標準化方法 Standardization Method。 ( 2)選擇距離測度的方式 Distance Measure。(圖 ) ( 1) Dimensions in solution。 ? 類似的可以指定 degree的有效類目最小值為 0,最大值為 4。 圖 Define Row Range子對話框 ? 在右側還有三個單選項: None表示沒有任何約束; Categories must be equal可用于指定某些類目的得分必須相同,最多可以設置有效類目的個數(shù)減 1個得分相等的類目,如本例中最多可以設置 2個類目得分相等; Category is supplemental表示某些類目不參加相應分析但是會在圖形中標示。 ? 這里要分析所有的三位總統(tǒng)候選人和選民的學歷水平的關系,所以在 Minimum value中填入 1,在 Maximum value中填入 3,之后點擊 Update按鈕。這里我們選擇 pres92作為行維度,點擊 Row左側的三角箭頭就可以看到在 Row項下出現(xiàn)了 pres92(? ?),這時用鼠標選中該變量,其下方的 Define Range子對話框激活,點擊后出現(xiàn)變量水平設置窗口(圖 )。 (一)操作步驟 1. 正確打開數(shù)據集 ,由 Analyze→Data Reduction→Correspondence Analysis 可進入相應分析的主對話框(圖 )。 第五節(jié) 實例分析與計算機實現(xiàn) 一 利用 SPSS進行相應分析 —— 實例 1 二 利用 SPSS進行相應分析 —— 實例 2 一、利用 SPSS進行相應分析 —— 實例 1 ? 數(shù)據來自 SPSS軟件自帶數(shù)據集 ,為 1992年美國大選的部分數(shù)據。 第三,獨立性檢驗只能判斷因素 A 和因素 B 是否獨立。說明ijz與2?統(tǒng)計量有著內在的聯(lián)系。拒絕區(qū)域為 : 221 [ ( 1 ) ( 1 ) ]rc??? ?? ? ? ? 通過上面的分析,我們應該注意幾個問題。 ? 設二維列聯(lián)資料為() i j r ck ??K(見表 8. 2 ),其頻率陣為() i j r cf ??F(見表 8. 3 )。在此我們要問,這種分析是否有意義,或者說對于所給的數(shù)據是否值得做這種相應分析。一般情形,我們取兩個公共因子,這樣就可以在一張二維平面圖上繪出兩個因素各個水平的情況,即可以直觀地描述兩個因素 A和因素 B以及各個水平之間的相關關系。那么,在因素 B的 c維空間 Rc中的第一公共因子,第二公共因子直到第 m個公共因子與因素 A的 r維空間 Rr中相對于的各個主因子在總方差中所占的百分比就完全相同。也就是說,我們可以從R型因子分析出發(fā)而直接得到 Q型因子分析的結果。 二、基于矩陣的分析過程 ? 由矩陣的知識我們知道,r ??Σ ZZ和c ??Σ ZZ有完全相同的非零特征根,記為12 m? ? ?? ? ?,0 m i n { , }m r c??,設12, , , mu u u為相對于特征根12, , , m? ? ?的關于因素B各水平構成的協(xié)差陣cΣ的特征向量,則有 c j j j j????Σ u Z Zu u ( 8 . 13 ) 用矩陣 Z 左乘( 8. 13 )式兩端得 ( ) ( )j j j?? ?ZZ Zu Zu 即有 ( ) ( )r j j j??Σ Zu Zu ( 8 . 14 ) ( )式表明 Zuj為相對于特征值 λ j的關于因素 A各水平構 成的協(xié)差陣 ∑r的特征向量。那么,我們從加權的角度考察這 r 個點的平均水平,其第j個分量的平均水平為 ..11. . .1rriji ij jiii j jff f ff f f??? ? ???, , 2 , ,jc? ( 8 . 9 ) 從而,計算出關于因素 B 各水平構成的協(xié)差陣為 ()c i j c ca ??Σ ( 8 . 10 ) 其中, . . .1. . . .rjii j i jijffa f f ff f f f?????????????? ? ? ??????? ??? ....1. . . .rjjiiijf f ff f ff f f f???????????? ????? ???? ???? ??? 1rijzz??? ???? 這里 . . . . . . . . . .. . . . . . . ./ ( / ) ( / )( / ) ( / )i i i iiiif f f k x k x k xzf f k x k x? ? ? ???????? . . ....( / )iiik k k kkk????? 1 , 2 , , 1 , 2 , ,r i c? ?? 令() i j r cz ??Z,則( 8. 10 )式可表示為 c ??Σ ZZ ( 8. 1 1 ) 類似地,由( 8. 4 )式知,針對因素B的第j個水平的分布輪廓jrfr? R , 它 是 超 平 面12 1cy y y? ? ?的 一 點 集 ,1 , 2 , ,jc?。如果我考慮因素 A 中