【正文】
藥物或毒物不止一種,也可以用 logistic模型分析其聯(lián)合作用。 例子 63 64 由結(jié)果可看出: 肥胖、口服避孕藥激素與子宮內(nèi)膜癌的關(guān)系有統(tǒng)計(jì)學(xué)意義,肥胖 者患子宮內(nèi)膜癌的危險(xiǎn)性約為非肥胖者的 6 倍( ? 6 . 1 9 6OR ? ); 口服避孕藥激素患子宮內(nèi)膜癌的危險(xiǎn)性約為不口服避孕藥激素者 的 5 倍( ? 4 . 0 9 2OR ? )。 59 用12( , , , )it it it it mX X X X?表示第i層內(nèi)第t個(gè)觀(guān)察對(duì)象危險(xiǎn) 因素的觀(guān)察值,考慮第i匹配組中的1iM ?個(gè)觀(guān)察對(duì)象有 1 名 病例的條件下,恰好第一個(gè)觀(guān)察對(duì)象屬于病例組的條件概率為: ? ? ? ?? ? ? ?010 1 ,10[ 1 0 ]Mi itti MMit itt t t tP X Y P X YLP X Y P X Y????? ? ?? ? ??? ? ? ? 等于觀(guān)察到的第一個(gè)危險(xiǎn)因素屬于病例而其他危險(xiǎn)因素 屬于對(duì) 照的概率與各種可能組合情況下的概率和的比值。 56 條件 logistic回歸 一、條件 l og i s t i c 回歸的基本原理 在流行病學(xué)病例 對(duì)照研究中,為正確分析危險(xiǎn)因素與疾 病間的 關(guān)系,需要在設(shè)計(jì)階段對(duì)可能構(gòu)成混雜的因素進(jìn) 行控制,形成多 個(gè)匹配組(每一匹配組可視為一個(gè)層)。 與多元線(xiàn)性回歸類(lèi)似,標(biāo)準(zhǔn)化 偏 回歸系數(shù)可以 比較各因素作用的相對(duì)重要性 。 1. 似然比檢驗(yàn) 基本思想是比較 2 種不同假設(shè)條件下的對(duì)數(shù)似然函 數(shù)值差別的大小。陽(yáng)性結(jié)果 時(shí),1iY ?;陰性結(jié) 果時(shí),0iY ?。 它與比數(shù)比(優(yōu)勢(shì)比) OR ( o d d s r a t i o )有對(duì)應(yīng)關(guān)系。 病例對(duì)照研究的三中類(lèi)型 35 l og i s t i c 回歸模型 : 設(shè)因變量 Y 是一個(gè)二分類(lèi)變量,其取值為 Y =1 和 Y =0 。 33 病例對(duì)照研究的三中類(lèi)型 (二)病例與對(duì)照匹配 條件 logistic回歸 匹配或稱(chēng)配比( matching),即要求對(duì)照在某些因素或特征上與病例保持一致,目的是對(duì)兩組比較時(shí)排除混雜因素的干擾。 隊(duì)列研究 (cohort study) 28 ? 一種由果及因的回顧性研究,先按疾病狀態(tài)確定調(diào)查對(duì)象,分為病例 (case)和對(duì)照 (control)兩組,然后利用已有的記錄、或采用詢(xún)問(wèn)、填寫(xiě)調(diào)查表等方式,了解其發(fā)病前的暴露情況,并進(jìn)行比較,推測(cè)疾病與暴露間的關(guān)系。 ? 是一種由因及果的研究,在研究開(kāi)始時(shí),根據(jù)以往有無(wú)暴露經(jīng)歷,將研究人群分為暴露人群和非暴露人群,在一定時(shí)期內(nèi),隨訪(fǎng)觀(guān)察和比較兩組人群的發(fā)病率或死亡率。 ? logistic回歸 :本講解從病因?qū)W位例子開(kāi)始,不僅適用于病因?qū)W分析,也可用于其他方面的研究,研究 某個(gè)二分類(lèi)(或無(wú)序及有序多分類(lèi))目標(biāo)變量與有關(guān)因素的關(guān)系 ? 在流行病學(xué)研究中,常需要分析疾病與各種危險(xiǎn)因素間的定量關(guān)系,同時(shí)為了能真實(shí)反映暴露因素與觀(guān)察結(jié)果間的關(guān)系,需要控制混雜因素的影響。對(duì)式兩邊取對(duì)數(shù),得 uLKAy ???? lnlnlnln ?? 令 39。 第二類(lèi):間接代換型 這類(lèi)非線(xiàn)性回歸模型經(jīng)常通過(guò)對(duì)數(shù)變形代換間接地化為線(xiàn)性回歸模型,如:式( 5)、式( 6)。 消去法 ( Remove) : 根據(jù)設(shè)定的條件剔除部分自變量 。 顯著性檢查 (注意 H0), (注意需要的條件) 一元非線(xiàn)性 y=a+blnx,如何判斷那個(gè)好? 帶虛擬變量 多元線(xiàn)性 多元非線(xiàn)性和逐步回歸 Logistic回歸 iiii Dxy ???? ???? 32213 逐步回歸分析 多元線(xiàn)性回歸建立的回歸方程包含了所有的自變量,但在實(shí)際問(wèn)題中,可能有這樣的情況:參加回歸方程的 P個(gè)自變量中,有些自變量單獨(dú)看對(duì)因變量 Y有作用(相關(guān)程度密切),但 P個(gè)自變量又可能是相互影響的,在作回歸時(shí),它們對(duì)因變量所起的作用有可能被其他自變量代替,而使得這些自變量在回歸方程中變得無(wú)足輕重。 8 逐步引入 — 剔除法( Stepwise) : 向前引入法與向后剔除法的結(jié)合。因此不能通過(guò)直接換元化為線(xiàn)性模型。ln LLKKaAyy ???? ,式已化為線(xiàn)性回歸模型 uLKay ???? 39。 ( 2)線(xiàn)性回歸分析: 由于因變量是分類(lèi)變量,不能滿(mǎn)足其正態(tài)性要求;有些自變量對(duì)因變量的影響并非線(xiàn)性。 研究人群 + + + 調(diào)查方向:追蹤收集資料 比較 疾病 人數(shù) 暴露 a b c d a/(a+b) c/(c+d) 隊(duì)列研究原理示意圖 隊(duì)列研究 (cohort study) 27 病例 非病例 合計(jì) 發(fā)病率 暴露組 a b n 1 =a +b a/ n 1 非暴露組 c d n 0 =c +d c/ n 0 相對(duì)危險(xiǎn)度( r el at i v e r i s k , R R )也稱(chēng)危險(xiǎn)比( r i s k r at i o ) 或率比( r at e r at i o ) 。 病例組暴露的比值)/()/(babbaa??、對(duì)照組暴露的比值 )/()/(dcddcc?? 該暴露因素的優(yōu)勢(shì)比:OR=/ ( ) / ( )/ ( ) / ( )a a b c c db a b d c d????adbc? 病例對(duì)照研究( 不考 ) 31 相對(duì)危險(xiǎn)度 RR的本質(zhì)是暴露組與非暴露組發(fā)病率之比或發(fā)病概率之比。如病例組中男女各半, 65歲以上者占 1/3,則對(duì)照組也是如此。 logistic回歸 36 設(shè)mm XXXZ ???? ????? ?22110,則Z與P之間關(guān)系的 l og i s t i c 曲線(xiàn)如下圖所 示。 由于jOR值與模型中的常數(shù)項(xiàng)0?無(wú)關(guān),因此0?在危 險(xiǎn)因素分析中常常被視為無(wú)效參數(shù)。對(duì) 于參數(shù)j?(1 , 2 , ,jm?),令 ln L 的一階導(dǎo)數(shù)為 0 , 即ln0jL????,用 N e w t on R a ph s o n 迭代方法解方程組, 得出參數(shù)j?的估計(jì)值jb和jb的漸進(jìn)標(biāo)準(zhǔn)誤jbS。 2. W a l d 檢驗(yàn) 用 u 檢驗(yàn)或2?檢驗(yàn)來(lái)檢驗(yàn)各參數(shù)j?是否為 0 。 表 15 4 與腎細(xì)胞癌轉(zhuǎn)移有關(guān)的因素及說(shuō)明 符號(hào) 說(shuō)明 1X 確診時(shí)患者年齡 ( 歲 ) 2X 腎細(xì)胞癌血管內(nèi)皮生長(zhǎng)因子 ( V E G F ) ,陽(yáng)性表述由低到高共 3 級(jí) 3X 腎細(xì)胞癌組織內(nèi)微血管數(shù) ( MVC ) 4X 腎癌細(xì)胞核組織學(xué)分級(jí), 由低到高共 4 級(jí) 5X 腎細(xì)胞癌分期,由低到 高共 4 期 Y 腎細(xì)胞癌轉(zhuǎn)移情況 ( 有轉(zhuǎn)移 Y =1。 條件 l og i s t i c 回歸用條件似然函數(shù)替代一般似 然函數(shù)。 61 條件 logi st ic 回歸分析一般借助統(tǒng)計(jì)軟件實(shí)現(xiàn)。 66 2 . 臨床試驗(yàn)數(shù)據(jù)分析 臨床試驗(yàn)的目的是為了評(píng)價(jià)某種藥物或 治療方法的效果,如果影響試驗(yàn)效果的非處理因素在試驗(yàn)組和 對(duì)照組間分布不均衡,就有可能夸大或掩蓋實(shí)驗(yàn)組的治療效果。在臨床上也可以根據(jù)疾病與臨床檢查指標(biāo)資料,建立 logistic回歸模型,對(duì)新的對(duì)象可根據(jù)其臨床檢查指標(biāo),計(jì)算其患某種疾病的概率的大小,進(jìn)行判別分析。方法一強(qiáng)調(diào)參數(shù)解釋?zhuān)? 其他各水平的e x p jb恰為相對(duì)水平 1 的優(yōu)勢(shì)比;任意兩水平 的優(yōu)勢(shì)比可以由相應(yīng)的回歸系數(shù)之差得到。對(duì)于配對(duì)資料,樣本的對(duì) 子數(shù)應(yīng)為納入模型中自變量個(gè)數(shù)的 20 倍以上。 75 對(duì)于大樣本資料,上述兩個(gè)統(tǒng)計(jì)量均近似服從自由度 為1km? ? ? ?(k為層數(shù),m為自變量個(gè)數(shù))的2? 分布。