【正文】
o r r e l a t i o n C o e f f i c i e n tS i g . ( 2 t a i l e d )NC o r r e l a t i o n C o e f f i c i e n tS i g . ( 2 t a i l e d )NC o r r e l a t i o n C o e f f i c i e n tS i g . ( 2 t a i l e d )NV A R 0 0 0 0 2V A R 0 0 0 0 3V A R 0 0 0 0 2V A R 0 0 0 0 3K e n d a l l 39。 ?但怎樣才能確定兩個變量有沒有關(guān)系呢 ? ?最簡單的辦法就是畫出它們的散點圖。 而列聯(lián)表的有關(guān)檢驗也和 c2檢驗聯(lián)系起來了 。 這個檢驗稱為 Fisher精確檢驗 ;它不是 c2分布 , 而是 超幾何分布 。包括 Pearson c2統(tǒng)計量和 似然比 ( likelihood ratio) c2統(tǒng)計量 ;它們都有漸近的 c2分布。H1:這兩個變量相關(guān)。 14 二維列聯(lián)表的檢驗 ?研究列聯(lián)表的一個主要目的是看這些變量是否相關(guān)。 ? 列聯(lián)表可以有很多維。這些取值也稱為 水平 ;比如收入有三個水平,觀點有兩個水平,性別有兩個水平等。 ? 這個關(guān)系是不是因果關(guān)系? 在本問題中,看來 似乎 有因果關(guān)系。具體細節(jié)需要進一步的分析 8 這是什么關(guān)系? ? 這個關(guān)系是否帶有普遍性? 也就是說,僅僅這一個樣本有這樣的關(guān)系,還是對于其他企業(yè)也有類似的規(guī)律。 ? 如果有關(guān)系,它們的關(guān)系 是否顯著? 這也可以從散點圖得到。 ? 這些都是 二元 的關(guān)系。但是現(xiàn)實世界的問題都是相互聯(lián)系的。 c2檢驗 ) ? 定量變量的相關(guān) (Pearson相關(guān)系數(shù) (r),Kendall’s t、 Spearman’ r) 基本統(tǒng)計書中的估計和假設(shè)檢驗所涉及的僅僅是對一些互相沒有關(guān)系的變量的描述。 ? 比如, 職業(yè)種類和收入之間的關(guān)系、政府投入和經(jīng)濟增長之間的關(guān)系、廣告投入和經(jīng)濟效益之間的關(guān)系、治療手段和治愈率之間的關(guān)系等等。 基本上銷售額是隨著廣告投入的遞增而遞增。 ? 這些關(guān)系是什么關(guān)系, 是否可以用數(shù)學模型來描述? 本例看上去是可以擬合一個回歸模型(后面會介紹),但絕不是線性的(用一條直線可以描述的)。一般來說,人們希望能夠從一些特殊的樣本,得到普遍的結(jié)論,以利于預測。 這里充滿了危險和未知! ? 9 定性變量間的關(guān)系 (關(guān)于某項政策調(diào)查所得結(jié)果 :) 觀點:贊成 觀點:不贊成 低收入 中等收入 高收入 低收入 中等收入 高收入 男 20 10 5 5 8 10 女 25 15 7 2 7 9 大致可以看出女性贊成的多,低收入贊成的多(還有嗎?) 10 op i ni o n * i nc o m e C r os s t a b ul a t i onC o u n t7 15 19 4145 25 12 8252 40 31 1 2 301o p i n i o nT o t a l1 2 3i n c o m eT o t a l 觀點:贊成 (1) 觀點 :不贊成 (0) 低收入 (1) 中等收入 (2) 高收入 (3) 低收入 (1) 中等收入 (2) 高收入 (3) 男1 20 10 5 5 8 10 女0 25 15 7 2