【正文】
,jc?是超平面12 1cy y y? ? ?的一點(diǎn)集。 因素 B 1B 2B cB 1A 11f 12f 1 cf 2A 21f 22f 2 cf 因 素 A rA 1rf 2rf rcf .rf .1f .2f .cf ..1 ijff?? ? 表 一般的二維頻率表 ? 表 8 . 3 中/i j i jf k k?是樣本中屬于因素A的第i個(gè)水平和因素B的第j個(gè)水平的百分比;.1ci ijjff?? ?,.1rj i jiff?? ?,1 , 2 , ,ir?,1 , 2 , ,jc?。這樣,我們就得到一個(gè)兩因素,即吸煙與是否得肺癌的 2 ?2列聯(lián)表。 第二節(jié) 列聯(lián)表 一 列聯(lián)表的概念 二 有關(guān)記號(hào) 一、列聯(lián)表的概念 ? 在實(shí)際中經(jīng)常要了解兩組或多組因素 (或變量 )之間的關(guān)系。第八章 相應(yīng)分析 第一節(jié) 引 言 第二節(jié) 列聯(lián)表 第三節(jié) 相應(yīng)分析的基本理論 第四節(jié) 相應(yīng)分析中應(yīng)注意的問題 第五節(jié) 實(shí)例分析與計(jì)算機(jī)實(shí)現(xiàn) 第一節(jié) 引 言 ? 相應(yīng)分析 (correspondence analysis)也叫對(duì)應(yīng)分析,其特點(diǎn)是它所研究的變量可以是定性的。為了把握相應(yīng)分析方法的實(shí)質(zhì),本章將從列聯(lián)資料入手,介紹一些基本概念和相應(yīng)分析的基本理論,并讓讀者理解相應(yīng)分析與獨(dú)立性檢驗(yàn)的關(guān)系,進(jìn)一步明確對(duì)實(shí)際問題進(jìn)行相應(yīng)分析研究的必要性所在。 ? 其中, kij為調(diào)查的 k人中出現(xiàn)因素 A的第 i個(gè)水平和因素 B的第j個(gè)水平的人數(shù)。將列聯(lián)表 K轉(zhuǎn)化為頻率矩陣,記為 F=(fij) r ?c ,見表 。 這 里 應(yīng) 該 注 意 到 ,icf,1 , 2 , ,ir?是 超 平 面12 1rx x x? ? ?的一點(diǎn)集。 ? 這里應(yīng)該注意到,( 8. 8 )式所定義的距離2 ( , )wD i i ?,也可以看作是點(diǎn)集12. .1 . .2 . ., , ,i i ici i i cf f ff f f f f f???????中兩點(diǎn)i和i?之間的歐氏距離(1 , 2 , ,ir?)。這樣就可以用相同的因子軸同時(shí)描述兩個(gè)因素各個(gè)水平的情況,把兩個(gè)因素的各個(gè)水平的狀況同時(shí)反映到具有相同坐標(biāo)軸的因子平面上。 第一,這里的ijz是原始列聯(lián)資料() i j r ck ??K通過相應(yīng)變換以后得到的資料陣() i j r cz ??Z的元素。 圖 相應(yīng)分析主界面 2. 從左側(cè)變量列表中選擇兩個(gè)變量作為相應(yīng)分析的兩個(gè)維度。 Model按鈕,指定相應(yīng)分析結(jié)果的維數(shù)。而一般該對(duì)話框中的選項(xiàng)無需改動(dòng)??梢灾付ㄝ敵鱿鄳?yīng)分析的散點(diǎn)圖 Scatterplots,默認(rèn)只輸出包含行列變量的雙變量散點(diǎn)圖 Biplot。大致可以看出 Clinton在各個(gè)學(xué)歷層次都有最高的票數(shù)。同時(shí)卡方統(tǒng)計(jì)量的自由度 8=(31) (51),數(shù)值為,說明行列變量之間存在顯著的相關(guān)性,相應(yīng)分析是有意義的。 O ve r vi e w R ow P oi n t s ( a) C on tr i b u ti o n S c or e i n D i m e n s i on O f P oi n t to I n e r ti a o f D i m e n s i on O f D i me n s i on to I n e r ti a o f P oi n t V O TE F O R C L I N TO N , BU S H , P ER O T M as s 1 2 I n e r ti a 1 2 1 2 T ota l Bu s h .358 .194 .156 .002 .098 .544 .931 .069 P e r ot .151 .663 .198 .009 .479 .370 .990 .010 C l i n ton .491 .346 .053 .008 .423 .086 .997 .003 A c ti v e T ota l .019 * S ym m e tr i c a l n or ma l i z at i on 表 行點(diǎn)總覽表 O ve r vi e w C ol u m n P oi n t s ( a ) C on tr i b u ti o n S c or e i n D i m e n s i on O f P oi n t to I n e r ti a o f D i m e n s i on O f D i me n s i on to I n e r ti a o f P oi n t R S H I G H E S T D E G R EE M as s 1 2 I n e r ti a 1 2 1 2 T ota l l t h i gh s c h oo l .102 .899 .087 .01 1 .597 .048 .999 .001 h i gh s c h oo l .512 .173 .014 .002 .1 10 .006 .999 .001 ju n i or c o l l e g e .072 .357 .352 .001 .066 .554 .899 .101 b ac h e l or .209 .149 .168 .001 .034 .370 .871 .129 gr ad u ate d e gr e e .105 .506 .057 .004 .193 .022 .999 .001 A c ti v e T ota l .019 * S ym m e tr i c a l n or ma l i z at i on 表 列點(diǎn)總覽表 4. 相應(yīng)分析圖,如圖 。下面列舉了 4 只股票的數(shù)據(jù)。 C or r e s p on d e n c e T ab l e 個(gè)股價(jià)值因子 股票規(guī)模因子 1 2 3 4 5 A c ti v e M ar gi n 1 55 23 31 17 27 153 2 98 83 53 24 26 284 3 16 14 24 11 16 81 4 10 6 9 7 10 42 5 15 8 7 3 11 44 A c ti v e M ar gi n 194 134 124 62 90 604 表 列聯(lián)表 S u m m ar y P r op or ti on of I n e r ti a C on fi d e n c e S i n g u l ar V al u e C or r e l at i on D i m e n s i on S i n g u lar V al u e I n e r tia C h i S q u are S i g. A c c ou n te d for C u mu l ati v e S tan d ar d D e v i ati o n 2 1 .221 .049 .734 .734 .039 .018 2 .1 13 .013 .193 .927 .040 3 .058 .00 3 .051 .978 4 .038 .001 .022 T ota l .066 .001( a) * 16 d e gr e e s of fr e e d om 表 總覽表 ? 從表 ,卡方檢驗(yàn)是顯著相關(guān)的,因此相應(yīng)分析是有意義的,而且只需要兩個(gè)公共因子就可以解釋 %的總