【正文】
e r U p p e r9 5 . 0 % C . I . f o r E X P ( B )V a r ia b le ( s ) e n t e r e d o n s t e p 1 : 性別 , 年齡 , 學歷 , 體 重指 數(shù) , 家 族史 , 吸煙 , 血壓 , 總 膽固 醇 , 甘 油三 脂 , h d l , l d l .a . 例 2 ? 為了不手術而又能弄清前列腺癌患者淋巴結的轉移情況,在手術前檢查了 53例前列腺癌患者,分別記錄了年齡( age)、酸性磷酸酶( Acid)兩個連續(xù)型的變量, X射線( XRay)、術前探針活檢病理分級( Grade)、直腸指檢腫瘤的大小與位置( Stage)三個分類變量。 ? 當 bi0時,對應的優(yōu)勢比 (odds ratio,記為 ORi) :ORi=exp(bi)1,說明該因素是 危險因素 ;當 bi0時,對應的優(yōu)勢比 ORi=exp(bi)1,說明該因素是 保護因素 。 26 解 釋 ? 設第 i個因素的回歸系數(shù)為 bi,表示當有多個自變量存在時,其它自變量 固定不變 的情況下,自變量 Xi每增加一個 單位時,所得到的優(yōu)勢比的自然對數(shù)。 ? 與多元線性回歸類似,標準化偏回歸系數(shù)可以比較各因素作用 的相對重要性。通常研究者根據專業(yè)知識和研究的問題,首先確定要研究的反應變量和自變量 ? 單因素分析 (變量的粗略選擇 ) – 用單因素分析對自變量進行篩選:卡方檢驗、t檢驗或單因素的 logistic回歸 25 變量篩選 ? L ogi s t i c 逐步回歸變量篩選的過程與線性逐步回歸變量篩選 的過程極為相似,但其中所用的檢驗統(tǒng)計量不再是 F 統(tǒng)計量, 而是似然比統(tǒng)計量、W a l d統(tǒng)計量等。 1、似然比檢驗 檢驗統(tǒng)計量為 )ln( l n2 01 LLG ??G服從 ?2分布 , 自由度為增加變量的個數(shù)。 22 ? 以上三種方法中,在多數(shù)情況下,似然比檢驗是最有效的檢驗, score檢驗一般與它相一致。 2. 21 ? 3 score 檢驗 以未包含某個或幾個變量的模型計算保留模型中參數(shù)的估計值,并假設新增參數(shù)為零,計算似然函數(shù)的一價偏導數(shù)及信息距陣,兩者相乘便得比分檢驗的統(tǒng)計量 S 。 通常用最大似然估計法求解模型中參數(shù)的估計 值 似然函數(shù) ?????niYiYiii PPL11)1( ? ( 1)回歸方程的假設檢驗 ? H0:所有 H1: 某個 ? 計算統(tǒng)計量為: G=2lnL,服從自由度等于 np的 分布 ? ( 2)回歸系數(shù)的假設檢驗 ? H0: H1: pii ,2,1,0,0 ?????? 0?i?2?0?i? 0?i?計算統(tǒng)計量為: Wald 2? ,自由度等于 1。?影響越大。 ? 如果要比較不同因素對 Y作用大小,需要消除變量量綱的影響,為此計算標準化回歸系數(shù) ibi?的標準差。 12 Logistic回歸模型 ? 令 : y=1 發(fā)病 ( 陽性 、 死亡 、 治愈等 ) ? y=0 未發(fā)病 ( 陰性 、 生存 、 未治愈等 ) ? 將發(fā)病的概率記為 P,它與自變量 x1, x2,… ,xp之間的 Logistic回歸模型為: ?可知 , 不發(fā)病的概率為: ? )e x p (1)e x p (110