【正文】
ib后, 可以方便的 估計(jì)出該因素在不同水平下的OR值或近似 RR值,非常適合于 流行病學(xué)研究。 在流行病學(xué)危險(xiǎn)因素研究中,為了排除混雜因 素的影響, 可以通過(guò)擬合包含多變量的 l ogi st i c 回歸模型,得到 調(diào)整 后的優(yōu)勢(shì)比。 66 2 . 臨床試驗(yàn)數(shù)據(jù)分析 臨床試驗(yàn)的目的是為了評(píng)價(jià)某種藥物或 治療方法的效果,如果影響試驗(yàn)效果的非處理因素在試驗(yàn)組和 對(duì)照組間分布不均衡,就有可能夸大或掩蓋實(shí)驗(yàn)組的治療效果。 盡管在分組時(shí)要求按隨機(jī)化原則分配,但由于樣本含量有限, 非處理因素在試驗(yàn)組和對(duì)照組間的分布仍可能不均衡,需要在 分析階段對(duì)構(gòu)成混雜的因素進(jìn)行調(diào)整,當(dāng)評(píng)價(jià)指標(biāo)為兩分類(lèi)變 量時(shí),可以利用 l ogi st i c 回歸分析得到調(diào)整后的藥物評(píng)價(jià)結(jié)果。 對(duì)于按分層設(shè)計(jì)的臨床試驗(yàn),可以使用相同的方法對(duì)分層因素 進(jìn)行調(diào)整和分析。 67 3 . 分析藥物或毒物的劑量反應(yīng) 在一些藥物或毒物的劑量 反應(yīng)實(shí) 驗(yàn)研究中,同種類(lèi)的每一只動(dòng)物的藥物耐受量可能有很大不同, 不同劑量使動(dòng)物發(fā)生“陽(yáng)性”反應(yīng)的概率分布常呈正偏態(tài),將劑 量取對(duì)數(shù)后則概率分布接近正態(tài)分布。如果用 P 表示在劑量為 X 時(shí)的陽(yáng)性率,則 l ogi st i c 模型為:011 e x p [ ( l n ) ]PX???? ? ? ; 用這一模型可以求出任一劑量反應(yīng)的陽(yáng)性率。 如對(duì)于半數(shù)效應(yīng)量0X(恰好有一半動(dòng)物起 “陽(yáng)性反應(yīng)” 的劑量) )]ln(e x p [1 00 Xbb ???? 1)]ln(e x p [00 ??? Xbb bbeX 050 ?? 如果藥物或毒物不止一種,也可以用 logistic模型分析其聯(lián)合作用。 68 4.預(yù)測(cè)與判別 logistic回歸模型是一個(gè)概率型模型,對(duì)非條件 Logistic回歸,在給定的條件下可通過(guò) logistic回歸模型計(jì)算某事件發(fā)生的概率。因此可以利用它預(yù)測(cè)某事件發(fā)生的概率。在臨床上也可以根據(jù)疾病與臨床檢查指標(biāo)資料,建立 logistic回歸模型,對(duì)新的對(duì)象可根據(jù)其臨床檢查指標(biāo),計(jì)算其患某種疾病的概率的大小,進(jìn)行判別分析。 69 實(shí)際應(yīng)用中還應(yīng)注意以下幾點(diǎn): 1 、流行病學(xué)研究中, l ogi st i c 回歸既可用于的病理 對(duì)照 研究也可用于隊(duì)列研究,但病例 對(duì)照研究資料的不出 真正的發(fā)病概率,只能獲得 OR 值,在發(fā)病率較小的 情況下與相對(duì)危險(xiǎn)度 RR 值近似相等。 2 、 l ogi st i c 模型中的自變量與反應(yīng)概率之間呈對(duì)稱 S 形曲 線關(guān)系,在概率 P 變動(dòng)范圍較小的情況下,如流行病 學(xué)研究中 ,條件容 易滿足;但在某些實(shí)驗(yàn)研究中,如 毒物劑量和動(dòng)物死亡 率的劑量反應(yīng)研究中, P 的變化 范圍很大,兩者的關(guān)系 雖然呈 S 形但并不對(duì)稱,此 時(shí) 可 考慮進(jìn)行變量變換,如 對(duì)數(shù)變換。 3 、非條件 l o gi st i c 回歸模型也可用于判別分析,在自變量 為分組情況下,其判別效果優(yōu)于線形判別。 70 ( 2 )數(shù)值變量資料的賦值 若自變量是數(shù)值變量,最好將其按變量值的大 小分成幾組,按順序賦值為 1 , 2 , , k ,否則參數(shù) 的實(shí)際意義可能不明確。例如,對(duì)于年齡變量, 如果利用實(shí)際數(shù)值,則求出的OR值表示年齡 每增加一歲時(shí)的優(yōu)勢(shì)比,實(shí)際意義不大。此時(shí), 如果將年齡分成幾個(gè)不同的水平(年齡段), 就比較容易解釋,處理上也比較靈活,分析時(shí)既 可以按得分處理,也可以將其化作1k ?個(gè)啞 變量, 并在分析中對(duì)差別不大的水平做必要的合并。 71 表 15 1 0 將年齡化為啞變量的兩種方法 方法一 方法二 年齡(歲)x 水平 1d 2d 3d 1d 2d 3d 4 0 1 0 0 0 1 0 0 40~ 2 1 0 0 0 1 0 50~ 3 0 1 0 0 0 1 60~ 4 0 0 1 1 1 1 兩種賦值方法在使用上側(cè)重點(diǎn)不同。方法一強(qiáng)調(diào)參數(shù)解釋, 其他各水平的e x p jb恰為相對(duì)水平 1 的優(yōu)勢(shì)比;任意兩水平 的優(yōu)勢(shì)比可以由相應(yīng)的回歸系數(shù)之差得到。方法二更注重假 設(shè)檢驗(yàn),便于分析交互作用。 但 如果模型中啞變量 過(guò)多 , 則 一些 變量水平組合 的 例數(shù) 過(guò)少 , 可能會(huì)產(chǎn)生 計(jì)算上的困難 , 反而 得不出 正確結(jié)果 , 實(shí)際 應(yīng)用時(shí) 應(yīng)盡量 控制 分組變量的水 平數(shù) 。 72 ( 3 )因變量賦值 與分類(lèi)變量賦值方法相同,但需注意 “ 陽(yáng)性反應(yīng) ” 的 賦值,如果因變量 Y 賦值的順序相反,回歸系數(shù)絕 對(duì)值不變,但符號(hào)相反。在 sa s 軟件的 l o gi st i c 過(guò)程 步中可加選項(xiàng) “d es ” 或 “ des c endi ng” 實(shí)現(xiàn)。 “ pr oc l ogi st i c des 。 ” 2. 樣本含量 l ogi st i c 回歸統(tǒng)計(jì)推斷是建立在大樣本基礎(chǔ)上的, 要求有足夠的樣本含量。經(jīng)驗(yàn)上病例和對(duì)照的人 數(shù)應(yīng)至少各有 3 0~ 5 0 例,模型中變量個(gè)數(shù)越多, 需要的樣本含量越大。對(duì)于配對(duì)資料,樣本的對(duì) 子數(shù)應(yīng)為納入模型中自變量個(gè)數(shù)的 20 倍以上。 73 3. 模型的評(píng)價(jià) 模型評(píng)價(jià)包括兩部分內(nèi)容:一是 對(duì)模型中的每個(gè)自 變量進(jìn)行檢驗(yàn) ,二是對(duì)所建立的回歸方程進(jìn)行 擬合 優(yōu)度檢驗(yàn) 。關(guān)于自變量檢驗(yàn)前面已作了介紹,但應(yīng) 注意變量 是否顯著及作用的大小 是 相對(duì) 的,因此通 常分 探索性研究 和 驗(yàn)證性研究 兩種情況加以說(shuō)明。 對(duì)前者主要選擇一個(gè)最佳的自變量組合,對(duì)后者則 主要分析某一個(gè)自變量是否有統(tǒng)計(jì)學(xué)意義,為此需 要對(duì)混雜因素進(jìn)行調(diào)整。 74 擬合優(yōu)度檢驗(yàn)的目的是檢驗(yàn)?zāi)P团c實(shí)際數(shù)據(jù)的符合 情況 。常用的檢驗(yàn)統(tǒng)計(jì)量有兩個(gè): ( 1 )剩余差:剩余差( d e v i ance )記為 D : ? ?*2 l n l nD L L?? 12 [ l n ( ) ( ) l n ( ) ]kg g gg g ggg g g g gr n rr n rn P n n P??? ? ? ?? ( 2 ) Pear son2?: 221()( 1 )kg g ggggr n Pn P P?????? 式中, *L 表示 擬合全部解釋變量模型的似然值, L 為待檢驗(yàn)?zāi)P偷淖畲笏迫恢怠n,gr,ggnr ?分別 為各層的觀察例數(shù)、陽(yáng)性數(shù)和陰性數(shù);k為層數(shù)。gP 表示現(xiàn)有樣本內(nèi)各層概率的估計(jì)值。 75 對(duì)于大樣本資料,上述兩個(gè)統(tǒng)計(jì)量均近似服從自由度 為1km? ? ? ?(k為層數(shù),m為自變量個(gè)數(shù))的2? 分布。對(duì)于給定檢驗(yàn)水準(zhǔn)?,如果22,D ??????,可 認(rèn)為數(shù)據(jù)與模型擬合的不好。 需要注意的是,如果分層過(guò)多,會(huì)使一些層內(nèi)觀察例 數(shù)過(guò)少,此時(shí)計(jì)算出的統(tǒng)計(jì)量可能會(huì)偏離2?分布,下 結(jié)論時(shí)要慎重。通常的做法是將剩余標(biāo)準(zhǔn)差與自由度 作比較,如果D ??,則提示擬合不夠理想。 76 4. 關(guān)于模型的常數(shù)項(xiàng) 在大多數(shù)情況下, l ogi st i c 回歸模型常數(shù)項(xiàng)沒(méi)有太大意 義,所以不需要對(duì)常數(shù)項(xiàng)做解釋和假設(shè)檢驗(yàn)。只有在 大規(guī)模的隊(duì)列研究、臨床診斷試驗(yàn)和療效評(píng)價(jià)試驗(yàn)中, 不同暴露層或處理組的陽(yáng)性率與研究總體人群的分布 一致時(shí),常數(shù)項(xiàng)才有意義。 條件 l ogi st i c 回歸中,常數(shù)項(xiàng)在建立條件似然函數(shù)時(shí) 被約掉而得不到估計(jì),所以條件 l ogi st i c 回歸模型不 能用于預(yù)測(cè)。 77 5 . 多分類(lèi) log ist ic 回歸 當(dāng)因變量 Y 是一個(gè)多分類(lèi)指標(biāo),特別是有序 多 分類(lèi) 指標(biāo)時(shí),如流行病學(xué)中 某 些慢性病的危險(xiǎn)因素研 究, 觀察結(jié)果為 “ 無(wú)、輕、中、重 ” 等不同等級(jí)資料, 可以采用 多分類(lèi) l ogi s t i c 回歸 或有序多分類(lèi) l ogi s t i c 進(jìn)行分析。