【正文】
3. Save New Var: 變量存儲對話框。 ( 2) Define parameter constraint:參數(shù)限制選項。 2. Parameter Constraints:參數(shù)限制對話框。 ( 2) User- defined loss function:用戶自定義 1oss函數(shù)項。 ( 1) Sum of squared residuals:離均差平方和選項。 結論: 判定系數(shù) R2為 。 單擊 “ Continue” 按鈕,返回 Nonlinear Regression對話框中。進入?yún)?shù)錄入對話框。進入 Nonlinear Regression對話框。 X 300 400 500 600 700 760 Y 214 . 5 87 . 5 92 . 5 136 . 6 180 . 2 212 . 0 散點圖顯示 : 兩變量呈拋物線關系。 ?此次調(diào)查按照經(jīng)濟發(fā)展水平在浙江、江蘇、廣東、福建、湖北、廣西、河北、河南、四川、陜西、安徽 11個省抽取 38個行政村,每村抽取 30戶左右的居民進行入戶問卷調(diào)查,共發(fā)放問卷 1112份,收回有效問卷 1106份,有效回收率 %。 ( 10)邏輯回歸的最后一個輸出表格是Casewise List,列出了殘差大于 2個標準差的個案。橫坐標是個案屬于 1的錄屬度,這里稱為預測概率( Predicted Probability)。 ( 9)圖 726所示是觀測值和預測概率分布圖。 ( 8) Correlation Matrix表格列出了常數(shù) Constant、系數(shù)之間的相關矩陣。 ( 7) Variables in the Equation表格列出了 Step 1中各個變量對應的系數(shù),以及該變量對應的 Wald 統(tǒng)計量值和它對應的相伴概率。 結論: 因變量的觀測值與模型預測值不存在顯著性差異。 ( 4) Model Summary表給出了 2 對數(shù)似然值、 Cox和 Snell的 R2以及 Nagelkerke的 R2檢驗統(tǒng)計結果。 ( 2)第二部分( Block 0)輸出結果有 4個表格。 試建立 y與自變量間的 Logistic回歸 . 三、應用舉例 使用交通工具上下班情況 序號 x1(年齡) x2(月收入:元) x3(性別) y 1 18 850 0 0 2 21 1200 0 0 3 23 850 0 1 4 23 950 0 1 5 28 1200 0 1 6 31 850 0 0 7 36 1500 0 1 8 42 1000 0 1 9 46 950 0 1 10 48 1200 0 0 11 55 1800 0 1 12 56 2100 0 1 13 58 1800 0 1 14 18 850 1 0 15 20 1000 1 0 16 25 1200 1 0 17 27 1300 1 0 18 28 1500 1 0 19 30 950 1 1 20 32 1000 1 0 21 33 1800 1 0 22 33 1000 1 0 23 38 1200 1 0 24 41 1500 1 0 25 45 1800 1 1 26 48 1000 1 0 27 52 1500 1 1 28 56 1800 1 1 ? 實現(xiàn)步驟 “Logistic Regression”對話框 “Logistic Regression: Options”對話框 ( 1)第一部分輸出結果有兩個表格,第一個表格說明所有個案( 28個)都被選入作為回歸分析的個案。 Maximum Iterations:設定最大迭代次數(shù),系統(tǒng)默認值為 20次。 Removal欄,刪除協(xié)變量標準,系統(tǒng)默認值為 。 At last step:顯示綜合中間過程和最后結果。 At each step:顯示每一步的結果。 CI for exp(B):計算參數(shù)值 95%的置信區(qū)間。默認值是 2個標準差。 . Casewise listing of residuals:顯示非標準化殘差、預測概率、觀察和預測組關系。 . Hosmer- Lemeshow goodness- offit:估計模型擬合優(yōu)度,特別是在較多協(xié)變量或協(xié)變量是連續(xù)變量時。 . Classification plots:顯示有關因變量觀察值與預測值的分類圖。 4. Options選擇項對話框。 . Dfbeta(s): Beta的差值。 . Leverage values: Leverage值。 . Cook’: Cook’上影響統(tǒng)計量?;谀P推畹臍埐睢7菢藴驶瘹埐畛云錁藴什?。某觀察值刪除時 ,模型偏差的改變量。使用 Logit單位的預測模型殘差。觀察值與預測值之差。 ( 2) Residuals:殘差選項。 . Probabilities:每個變量的事件發(fā)生的預測概率。 Last:最后的分類為參照分類,系統(tǒng)默認值。 Polynomial:假定分類等距,該分類僅用于數(shù)值型變量。 Helmert:除最后分類外,各分類與以后平均分類效應比較。 Simple:除參照分類外,各分類與參照分類比較。 Indicator:比較顯示是否具有同類效應,為系統(tǒng)默認值。 ( 3) Change:改變對照方法選項。 (1)Covariates:協(xié)變量欄,列出源協(xié)變量。激活選擇對話框。激活儲存新變量對話框。激活定義分類協(xié)變量對話框,可定義一個或多個字符型和數(shù)值型分類變量。設定規(guī)則:選擇變量等于,不等于,小于,小于或等于,大于,大于或等于某值。 “ Rule‖:規(guī)則按鈕。 Backward: Wald:作 Wald概率統(tǒng)計法,向后逐步選擇自變量。 Backward: Conditional:以假定參數(shù)為基礎作似然比概率檢驗,向后逐步選擇自變量。 Forward: LR:以最大局部似然為基礎作似然比概率檢驗,向前逐步選擇自變量。 Enter:所有自變量強制進入回歸方程。 ( 4) Method:協(xié)變量篩選方法選項。 ( 3) Covariates:協(xié)變量欄。用于放入因變量,因變量可以是數(shù)值型或短字符型的二分變量。 二、操作步驟: AnalyzeRegressionBinary Logistic 1. Logistic回歸過程對話框。 零假設:變量的系數(shù)等于 0 ( 2)構造 Wald統(tǒng)計量。 6. Wald統(tǒng)計量 Wald統(tǒng)計量用于判斷一個變量是否應該包含在模型中,其檢驗步驟如下。 如果該 p值小于給定的顯著性水平 α (如α =),則拒絕 因變量的觀測值與模型預測值不存在差異的零假設 ,表明模型的預測值與觀測值存在顯著差異。 2.擬合優(yōu)度( Goodness of Fit)統(tǒng)計量 Predicted(預測值) 0 1 Percent Correct (正確分類比例) Observed (觀測值) 0 n00 n01 f0 1 n10 n11 f1 Overall(總計) ff Classification Table for Y 3. Cox和 Snell的 R 2( Coxamp。一個單位所引起的比率該自變量變化他變量不變的情況下,回歸系數(shù)的含義為在其)b(E X Pie)0()1()0()1(ln)1(1)1(ln)1(1)1(ln)]1([l o gi2211022110 kkXXXkkYPYPYPYPYPYPXXXYPYPYPi s t i c?????????????????????????????????參數(shù)估計方法: 最大似然估計法 1. 2對數(shù)似然值( 2 log likelihood, 2LL) 模型檢驗 - 2 log likelihood(2LL)是檢驗模型擬合度的一個統(tǒng)計量,當- 2LL= 0時模型非常完美地擬合數(shù)據(jù)。 Y=1的概率為 P(Y=1),則 k個自變量分別為X1,X1,X3,...Xk所對應的 Logistic回歸模型為: kxkbxbxbbkkeeYPxbxbxbb???????????. . . . . .22110221101)1(......或者寫為: 。本節(jié)將只討論 Binary Logistic回歸,并簡稱 Logistic回歸(與曲線估計中介紹的 Logistic曲線模型相區(qū)別)。 無論是處理二項分類變量還是處理多項分類變量邏輯分析統(tǒng)稱為邏輯分析 。 SPSS 以上版本增加了可以處理多項邏輯分析的功能。如果因變量是二項分類變量,顯然不滿足正態(tài)分布的條件,這時可用 Logistic 回歸分析。所謂 Logistic回歸,是指因變量為二級計分或二類評定的回歸分析,這在經(jīng)濟學研究中經(jīng)常遇到,如:如人的素質的高低跟人的受教育年數(shù)等因素有關。 在例 573中,對 y進行按時間序列做曲線估計。 說明: 首先,判斷模型的方差分析結果,如果模型沒有統(tǒng)計意義,那么即使它有最好的 R2值,與其它呈顯著意義的模型進行比較是沒有意義的。 兩種方法的自變量系數(shù)都通過 t檢驗。 指數(shù)擬合: t=, P=。 指數(shù)擬合: R2=。但指數(shù)擬合比線性擬合更為顯著。 線性模型 指數(shù)模型 結果分析如下: ( 1)方差分析表: 線性擬合: F=, Signif F( P值) =。 Predict through:可計算樣本中和樣本之后的預測值僅用于時間序列的數(shù)據(jù)。 Predict Case:預測觀測量欄,僅在以時間序列作為自變量時有效。 Confidence interval:可信區(qū)間選項。 Residuals:殘差(觀察值與預測值之差)選項( err_1 ) 。 點擊一個或全部選項,可將相應的數(shù)值以新變量形式儲存到數(shù)據(jù)庫中,這些變量的定義將在結果中顯示。 ( 7) Plot models:繪制曲線擬合圖,系統(tǒng)默認值。 ( 5) Display ANOVA Table:結果中顯示方差分析表。 ( 3) Case Labels:數(shù)據(jù)標簽欄,把左側源變量欄的某變量放入該欄,該欄的變量值作為結果散點圖中的點標記。 Variable:把左側源變量欄的某變量放入該欄作為自變量,系統(tǒng)默認值。 () x: y: .687 .398 .200 .121 .090 .050 .020 .010 1 、作散點圖 “ graphslegacy Dialogs “scatter/Dot”( “Simple” 曲線估計 Analyze―Regression‖―Curve Estimation‖ ( l) Dependent( s):因變量欄。如果不能馬上根據(jù)觀測數(shù)據(jù)確定一種最佳模型,可利用曲線估計在眾多的回歸模型中建立一個簡單而又比較適合的模型。 多元線性回歸: 因變量、自變量的確定 變量引入、剔除方法的選擇 常用選擇項 檢驗 ( 1)模型擬合檢驗:調(diào)整 R2 M od e l S u m m a r yc. 9 2 3a. 8 5 2 . 8 4 7 7 3 . 8 3. 9 4 0b. 8 8 4 . 8 7 6 6 6 . 4 7Mo d e l12R R S q u a r eA d j u s t e dR S q u a r eS t d . E r r o r o ft h e E s t im a t eP r e d ic t o r s : (C o n s t a n t ), I N C O M Ea . P r e d ic t o r s : (C o n s t a n t ), I N C O M E , P R I C Eb . D e p e n d e n t V a r ia b le : F O O D E