【正文】
2 . 0 3 1 . 0 7 5 . 7 8 2 . 4 4 4(C o n s t a n t )稅收GNP其它收入從業(yè)人數(shù)進(jìn)出口額M o d e l1B S t d . E r r o rU n s t a n d a r d iz e dC o e f f ici e n t sB e t aS t a n d a r d iz e dC o e f f ici e ntst S ig .D e p e n d e n t V a r ia b le : 財(cái)政收入a . 移除 GNP后,剩余的自變量采用 ENTER法 M od e l S u m m a r y. 9 9 9a. 9 9 9 . 9 9 8 1 8 1 . 2 9 1 9Mo d e l1R R S q u a r eA d j u s t e dR S q u a r eS t d . E r r o r o ft h e E s t im a t eP r e d ic t or s : (C on s t a n t ), 進(jìn)出口額 , 從業(yè)人數(shù) , 其它收入 , 稅收a . A NOV Ab4 . 3 E + 0 8 4 1 0 6 5 3 9 3 0 6 3 2 4 1 . 5 5 1 . 0 0 0a6 2 4 4 6 8 . 6 19 3 2 8 6 6 . 7 7 04 . 3 E + 0 8 23R e g r e s s ionR e s id u a lT ot a lMo d e l1S u m ofS q u a r e s df Me a n S q u a r e F S ig .P r e d ic t or s : (C on s t a n t ), 進(jìn)出口額 , 從業(yè)人數(shù) , 其它收入 , 稅收a . D e p e n d e n t V a r ia b le : 財(cái)政收入b . C oe ff i c i e n t sa2 3 1 1 . 5 9 8 4 3 9 . 5 2 4 5 . 2 5 9 . 0 0 0. 9 0 0 . 0 6 3 . 8 7 0 1 4 . 3 8 6 . 0 0 01 . 8 1 9 . 4 1 0 . 1 3 4 4 . 4 3 6 . 0 0 0 4 . 5 8 E 0 2 . 0 0 9 . 1 1 4 5 . 0 0 7 . 0 0 03 . 3 6 8 E 0 2 . 0 1 5 . 1 0 5 2 . 1 9 9 . 0 4 0(C o n s t a n t )稅收其它收入從業(yè)人數(shù)進(jìn)出口額Mo d e l1B S t d . E r r o rU n s t a n d a r d iz e dC o e f f ic ie n t sB e t aS t a n d a r d iz e dC o e f f ic ie ntst S ig .D e p e n d e n t V a r ia b le : 財(cái)政收入a . Y=+++ 其中: x1—稅收; x2—其它收入; X3—從業(yè)人數(shù); X4—進(jìn)出口額 為什么從業(yè)人數(shù)的系數(shù)為負(fù)? 注意: 本題變量的引入 ——剔除可采用 Stepwise(逐步)法由計(jì)算機(jī)自動(dòng)完成。 () x: y: .687 .398 .200 .121 .090 .050 .020 .010 1 、作散點(diǎn)圖 “ graphslegacy Dialogs “scatter/Dot”( “Simple” 曲線估計(jì) Analyze―Regression‖―Curve Estimation‖ ( l) Dependent( s):因變量欄。 ( 3) Case Labels:數(shù)據(jù)標(biāo)簽欄,把左側(cè)源變量欄的某變量放入該欄,該欄的變量值作為結(jié)果散點(diǎn)圖中的點(diǎn)標(biāo)記。 ( 7) Plot models:繪制曲線擬合圖,系統(tǒng)默認(rèn)值。 點(diǎn)擊一個(gè)或全部選項(xiàng),可將相應(yīng)的數(shù)值以新變量形式儲(chǔ)存到數(shù)據(jù)庫中,這些變量的定義將在結(jié)果中顯示。 Confidence interval:可信區(qū)間選項(xiàng)。 Predict through:可計(jì)算樣本中和樣本之后的預(yù)測值僅用于時(shí)間序列的數(shù)據(jù)。但指數(shù)擬合比線性擬合更為顯著。 指數(shù)擬合: t=, P=。 說明: 首先,判斷模型的方差分析結(jié)果,如果模型沒有統(tǒng)計(jì)意義,那么即使它有最好的 R2值,與其它呈顯著意義的模型進(jìn)行比較是沒有意義的。所謂 Logistic回歸,是指因變量為二級(jí)計(jì)分或二類評(píng)定的回歸分析,這在經(jīng)濟(jì)學(xué)研究中經(jīng)常遇到,如:如人的素質(zhì)的高低跟人的受教育年數(shù)等因素有關(guān)。 SPSS 以上版本增加了可以處理多項(xiàng)邏輯分析的功能。本節(jié)將只討論 Binary Logistic回歸,并簡稱 Logistic回歸(與曲線估計(jì)中介紹的 Logistic曲線模型相區(qū)別)。一個(gè)單位所引起的比率該自變量變化他變量不變的情況下,回歸系數(shù)的含義為在其)b(E X Pie)0()1()0()1(ln)1(1)1(ln)1(1)1(ln)]1([l o gi2211022110 kkXXXkkYPYPYPYPYPYPXXXYPYPYPi s t i c?????????????????????????????????參數(shù)估計(jì)方法: 最大似然估計(jì)法 1. 2對(duì)數(shù)似然值( 2 log likelihood, 2LL) 模型檢驗(yàn) - 2 log likelihood(2LL)是檢驗(yàn)?zāi)P蛿M合度的一個(gè)統(tǒng)計(jì)量,當(dāng)- 2LL= 0時(shí)模型非常完美地?cái)M合數(shù)據(jù)。 如果該 p值小于給定的顯著性水平 α (如α =),則拒絕 因變量的觀測值與模型預(yù)測值不存在差異的零假設(shè) ,表明模型的預(yù)測值與觀測值存在顯著差異。 零假設(shè):變量的系數(shù)等于 0 ( 2)構(gòu)造 Wald統(tǒng)計(jì)量。用于放入因變量,因變量可以是數(shù)值型或短字符型的二分變量。 ( 4) Method:協(xié)變量篩選方法選項(xiàng)。 Forward: LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇自變量。 Backward: Wald:作 Wald概率統(tǒng)計(jì)法,向后逐步選擇自變量。設(shè)定規(guī)則:選擇變量等于,不等于,小于,小于或等于,大于,大于或等于某值。激活儲(chǔ)存新變量對(duì)話框。 (1)Covariates:協(xié)變量欄,列出源協(xié)變量。 Indicator:比較顯示是否具有同類效應(yīng),為系統(tǒng)默認(rèn)值。 Helmert:除最后分類外,各分類與以后平均分類效應(yīng)比較。 Last:最后的分類為參照分類,系統(tǒng)默認(rèn)值。 ( 2) Residuals:殘差選項(xiàng)。使用 Logit單位的預(yù)測模型殘差。非標(biāo)準(zhǔn)化殘差除以其標(biāo)準(zhǔn)差。 . Cook’: Cook’上影響統(tǒng)計(jì)量。 . Dfbeta(s): Beta的差值。 . Classification plots:顯示有關(guān)因變量觀察值與預(yù)測值的分類圖。 . Casewise listing of residuals:顯示非標(biāo)準(zhǔn)化殘差、預(yù)測概率、觀察和預(yù)測組關(guān)系。 CI for exp(B):計(jì)算參數(shù)值 95%的置信區(qū)間。 At last step:顯示綜合中間過程和最后結(jié)果。 Maximum Iterations:設(shè)定最大迭代次數(shù),系統(tǒng)默認(rèn)值為 20次。 ( 2)第二部分( Block 0)輸出結(jié)果有 4個(gè)表格。 結(jié)論: 因變量的觀測值與模型預(yù)測值不存在顯著性差異。 ( 8) Correlation Matrix表格列出了常數(shù) Constant、系數(shù)之間的相關(guān)矩陣。橫坐標(biāo)是個(gè)案屬于 1的錄屬度,這里稱為預(yù)測概率( Predicted Probability)。 ?此次調(diào)查按照經(jīng)濟(jì)發(fā)展水平在浙江、江蘇、廣東、福建、湖北、廣西、河北、河南、四川、陜西、安徽 11個(gè)省抽取 38個(gè)行政村,每村抽取 30戶左右的居民進(jìn)行入戶問卷調(diào)查,共發(fā)放問卷 1112份,收回有效問卷 1106份,有效回收率 %。進(jìn)入 Nonlinear Regression對(duì)話框。 單擊 “ Continue” 按鈕,返回 Nonlinear Regression對(duì)話框中。 ( 1) Sum of squared residuals:離均差平方和選項(xiàng)。 2. Parameter Constraints:參數(shù)限制對(duì)話框。 3. Save New Var: 變量存儲(chǔ)對(duì)話框。 ( 2) Define parameter constraint:參數(shù)限制選項(xiàng)。 ( 2) User- defined loss function:用戶自定義 1oss函數(shù)項(xiàng)。 結(jié)論: 判定系數(shù) R2為 。進(jìn)入?yún)?shù)錄入對(duì)話框。 X 300 400 500 600 700 760 Y 214 . 5 87 . 5 92 . 5 136 . 6 180 . 2 212 . 0 散點(diǎn)圖顯示 : 兩變量呈拋物線關(guān)系。 ( 10)邏輯回歸的最后一個(gè)輸出表格是Casewise List,列出了殘差大于 2個(gè)標(biāo)準(zhǔn)差的個(gè)案。 ( 9)圖 726所示是觀測值和預(yù)測概率分布圖。 ( 7) Variables in the Equation表格列出了 Step 1中各個(gè)變量對(duì)應(yīng)的系數(shù),以及該變量對(duì)應(yīng)的 Wald 統(tǒng)計(jì)量值和它對(duì)應(yīng)的相伴概率。 ( 4) Model Summary表給出了 2 對(duì)數(shù)似然值、 Cox和 Snell的 R2以及 Nagelkerke的 R2檢驗(yàn)統(tǒng)計(jì)結(jié)果。 試建立 y與自變量間的 Logistic回歸 . 三、應(yīng)用舉例 使用交通工具上下班情況 序號(hào) x1(年齡) x2(月收入:元) x3(性別) y 1 18 850 0 0 2 21 1200 0 0 3 23 850 0 1 4 23 950 0 1 5 28 1200 0 1 6 31 850 0 0 7 36 1500 0 1 8 42 1000 0 1 9 46 950 0 1 10 48 1200 0 0 11 55 1800 0 1 12 56 2100 0 1 13 58 1800 0 1 14 18 850 1 0 15 20 1000 1 0 16 25 1200 1 0 17 27 1300 1 0 18 28 1500 1 0 19 30 950 1 1 20 32 1000 1 0 21 33 1800 1 0 22 33 1000 1 0 23 38 1200 1 0 24 41 1500 1 0 25 45 1800 1 1 26 48 1000 1 0 27 52 1500 1 1 28 56 1800 1 1 ? 實(shí)現(xiàn)步驟 “Logistic Regression”對(duì)話框 “Logistic Regression: Options”對(duì)話框 ( 1)第一部分輸出結(jié)果有兩個(gè)表格,第一個(gè)表格說明所有個(gè)案( 28個(gè))都被選入作為回歸分析的個(gè)案。 Removal欄,刪除協(xié)變量標(biāo)準(zhǔn),系統(tǒng)默認(rèn)值為 。 At each step:顯示每一步的結(jié)果。默認(rèn)值是 2個(gè)標(biāo)準(zhǔn)差。 . Hosmer- Lemeshow goodness- offit:估計(jì)模型擬合優(yōu)度,特別是在較多協(xié)變量或協(xié)變量是連續(xù)變量時(shí)。 4. Options選擇項(xiàng)對(duì)話框。 . Leverage values: Leverage值。基于模型偏差的殘差。某觀察值刪除時(shí) ,模型偏差的改變量。觀察值與預(yù)測值之差。 . Probabilities:每個(gè)變量的事件發(fā)生的預(yù)測概率。 Polynomial:假定分類等距,該分類僅用于數(shù)值型變量。 Simple:除參照分類外,各分類與參照分類比較。 ( 3) Change:改變對(duì)照方法選項(xiàng)。激活選擇對(duì)話框。激活定義分類協(xié)變量對(duì)話框,可定義一個(gè)或多個(gè)字符型和數(shù)值型分類變量。 “ Rule‖:規(guī)則按鈕。 Backward: Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選擇自變量。 Enter:所有自變量強(qiáng)制進(jìn)入回歸方程。 ( 3) Cov