【正文】
如何選擇數(shù)據(jù)分析方法 ? 吳喜之 2 數(shù)據(jù)和目的相結(jié)合的出發(fā)點 ? 1. 相關(guān)分析及回歸類模型 ( 相關(guān) 、 簡單的回歸、Logistic回歸、對數(shù)線性模型 、 方差分析和一般線性模型 ) ? 2. 經(jīng)典多元分析內(nèi)容 ( 主成分分析、因子分析 、聚類分析 、 判別分析 、 對應(yīng)分析 ) 3 主要涉及的相關(guān)問題 ? 什么是相關(guān)? ? 列聯(lián)表中定性變量的相關(guān) (Fisher amp。 c2檢驗 ) ? 定量變量的相關(guān) (Pearson相關(guān)系數(shù) (r),Kendall’s t、 Spearman’ r) 基本統(tǒng)計書中的估計和假設(shè)檢驗所涉及的僅僅是對一些互相沒有關(guān)系的變量的描述。但是現(xiàn)實世界的問題都是相互聯(lián)系的。不討論變量之間的關(guān)系,就無從談起任何有深度的應(yīng)用;而沒有應(yīng)用,前面講過的那些基本概念就僅僅是擺設(shè)而已。 5 變量間的關(guān)系 ? 人們每時每刻都在關(guān)心事物之間的關(guān)系。 ? 比如, 職業(yè)種類和收入之間的關(guān)系、政府投入和經(jīng)濟增長之間的關(guān)系、廣告投入和經(jīng)濟效益之間的關(guān)系、治療手段和治愈率之間的關(guān)系等等。 ? 這些都是 二元 的關(guān)系。 ? 還有更復(fù)雜的 諸多變量之間的相互關(guān)系 , ? 比如 企業(yè)的固定資產(chǎn)、流動資產(chǎn)、預(yù)算分配、管理模式、生產(chǎn)率、債務(wù)和利潤等諸因素的關(guān)系是不能用簡單的一些二元關(guān)系所描述的。 6 例 1廣告投入和銷售之間的關(guān)系 (數(shù)據(jù) ) AD14121086420SALE7060504030201007 這是什么關(guān)系? ? 這兩個變量是否有關(guān)系?顯然,它們有關(guān)系;這從散點圖就很容易看出。 基本上銷售額是隨著廣告投入的遞增而遞增。 ? 如果有關(guān)系,它們的關(guān)系 是否顯著? 這也可以從散點圖得到。當廣告投入在 6萬元以下,銷售額增長很快;但大于這個投入時,銷售額增長就不明顯了。因此, 這兩個變量的關(guān)系是由強變?nèi)酢? ? 這些關(guān)系是什么關(guān)系, 是否可以用數(shù)學模型來描述? 本例看上去是可以擬合一個回歸模型(后面會介紹),但絕不是線性的(用一條直線可以描述的)。具體細節(jié)需要進一步的分析 8 這是什么關(guān)系? ? 這個關(guān)系是否帶有普遍性? 也就是說,僅僅這一個樣本有這樣的關(guān)系,還是對于其他企業(yè)也有類似的規(guī)律。這里的數(shù)據(jù)還不足以回答這個問題??赡苄枰紤]更多的變量和收集更多的數(shù)據(jù)。一般來說,人們希望能夠從一些特殊的樣本,得到普遍的結(jié)論,以利于預(yù)測。 ? 這個關(guān)系是不是因果關(guān)系? 在本問題中,看來 似乎 有因果關(guān)系。這類似于一種試驗;而試驗時是容易找到因果關(guān)系的。但是,一般來說,變量之間有關(guān)系但絕不意味著存在因果關(guān)系。 這里充滿了危險和未知! ? 9 定性變量間的關(guān)系 (關(guān)于某項政策調(diào)查所得結(jié)果 :) 觀點:贊成 觀點:不贊成 低收入 中等收入 高收入 低收入 中等收入 高收入 男 20 10 5 5 8 10 女 25 15 7 2 7 9 大致可以看出女性贊成的多,低收入贊成的多(還有嗎?) 10 op i ni o n * i nc o m e C r os s t a b ul a t i onC o u n t7 15 19 4145 25 12 8252 40 31 1 2 301o p i n i o nT o t a l1 2 3i n c o m eT o t a l 觀點:贊成 (1) 觀點 :不贊成 (0) 低收入 (1) 中等收入 (2) 高收入 (3) 低收入 (1) 中等收入 (2)