freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

姜啟源之統(tǒng)計回歸模型-資料下載頁

2025-04-29 05:35本頁面
  

【正文】 年齡的關系 ,并進行統(tǒng)計預測 . 序號 年齡 冠心病 序號 年齡 冠心病 序號 年齡 冠心病 序號 年齡 冠心病 1 20 0 26 35 0 51 44 1 76 55 1 … … … … … … … … … … … … 25 34 0 50 44 0 75 55 1 100 69 1 分析與假設 被觀察者獨立選取 x~被觀察者 年齡 , Y~患病情況 (Y=1~患病 , Y=0~不患病 ) 20 25 30 35 40 45 50 55 60 65 7000 . 10 . 20 . 30 . 40 . 50 . 60 . 70 . 80 . 91A g eCHD20 25 30 35 40 45 50 55 60 650 . 10 . 20 . 30 . 40 . 50 . 60 . 70 . 8A g eProportion of CHD年齡段 段中點 人數(shù) 患病人數(shù) 患病比例 2029 10 1 3034 32 15 2 … … … … … 6069 10 8 合計 100 43 按年齡段 分組 統(tǒng)計患病人數(shù)及 比例 患病比例隨年齡增大而遞增 ,是介于 0與 1之間的 S型曲線 . 無法建立前面那樣的回歸模型 ,需要對數(shù)據(jù)進行預處理 . 患病比例 y是 年齡段中點 x時 Y的平均值 分析與假設 Y取值 0, 1 。 y 取值 [0, 1] ????? ????? 332210 xxxy用普通方法建立回歸方程 20 25 30 35 40 45 50 55 60 65 7000 . 10 . 20 . 30 . 40 . 50 . 60 . 70 . 80 . 91A g eProportion of CHD? y取值不一定在 [0,1]中 . ? 誤差項 ε只能取值 0,1, 不具有正態(tài)性 , 且具有異方差性 . 違反普通回歸分析的前提條件 ! 當因變量 Y為一個 二分類 (或多分類 )變量時,需要用到 新的回歸模型 . )|( xYEy ?Y的 條件期望 Logit 模型 )|1()( xYPx ???)|( xYEy ?Y的 (條件 )期望 π(x)~年齡 x的患病概率 (患病比例 y) ))(1)(()|( xxxYD ?? ??方差 π(x) ~ S型曲線 , 取值 [0,1] xxeex10101)( ????? ???? xxx10))(1)(ln ( ???? ???Logit模型 (Logistic回歸模型 ) ))(1 )(ln ())(( xxxL o g i t ??? ??π(x)的變換 ),( ????取值 連接函數(shù), Logistic模型 反函數(shù) Logit 模型 數(shù)據(jù)預處理 : 將年齡分成 k(=8)組 . xi~第 i組年齡 , ni~被觀察人數(shù) , mi~患病人數(shù) , i=1,…, k iii nm /??患病概率 β0,β1~回歸系數(shù) ),( iinB ?設 mi服從二項分布 回歸系數(shù)可用極大似然法估計得到 . iiii xL og i t 10)1l n ()( ????? ????Logit 模型 模型求解 Logit模型可用 MATLAB命令 glmfit求解 b = glmfit(x, y, ’distr’, ’link’) [b,dev,stats] = glmfit(x, y, ’distr’, ’link’) x~自變量數(shù)據(jù)矩陣 (第 1列自動添加列向量 1). y~因變量數(shù)據(jù)向量 (對 distr =binomial, y可取矩陣 : 第 1列為 “成功”次數(shù) , 第 2列為觀察次數(shù) ). ’distr’ ~估計系數(shù)所用分布 (’binomial’,’poisson’ 等 ),缺省時為 ’ normal’ . ’link’ ~’logit’,’probit’ 等 (缺省時為’ logit’). b~回歸系數(shù)的估計值 , dev~擬合偏差 , stats~統(tǒng)計指標 模型求解 參數(shù) 估計值 標準差 β0 β1 [yhat, dylo, dyhi] = glmval(b, x, 39。logit39。) 年齡段 年齡 x 患病比例 ( 實際值 ) 患病比例 (預測值 y) 置信區(qū)間 2029 [, ] … … … … … 6069 [, ] 編程計算 20 25 30 35 40 45 50 55 60 6500 . 10 . 20 . 30 . 40 . 50 . 60 . 70 . 80 . 9A g eProportion of CHD回歸曲線 自變量為 x時 y的預測值 yhat及置信度為 95%的置信區(qū)間 擬合偏差 模型評價與結果分析 xxxxL o g i t 10))(1 )(l n ())(( ????? ????2210 xx ??? ??? Logit模型是否需要引入 x2項? 用似然比統(tǒng)計量計算: pval = 1 chi2cdf(devdev2,1) = ? 選用 Probit模型 (另一種廣義線性模型 )結果如何? )()( 10 xx ??? ??? xxxo b i t 101 ))(())((Pr ???? ???? ? Ф是正態(tài)概率分布函數(shù) (S型曲線 ) 模型中 引入 x2項不能顯著提高擬合程度 . glmfit中需將 logit改為 probit 20 25 30 35 40 45 50 55 60 6500 . 10 . 20 . 30 . 40 . 50 . 60 . 70 . 80 . 9A g eProportion of CHD D a t aL o g i t m o d e lP r o b i t m o d e l年齡段 年齡 x 患病比例( 實際值 ) 預測值 1( Logit) 預測值 2( Probit) 2029 … … … … … 6069 兩個模型的擬合程度不相上下 . 模型評價與結果分析 Probit模型 求解 參數(shù) 估計值 標準差 β0 β1 擬合偏差 xxxxxL o g i t 1 0 5 3 8 ))(?1 )(?l n ())(?( 10 ??????? ?????β1的直觀解釋 Odds~事件發(fā)生 (患病 )概率與不發(fā)生 (不患病 )概率之比 . 模型評價與結果分析 )( 10)(1)()( xexxxO d d s ???? ????年齡 x的人患與不患病概率之比 年齡增加 1歲的 Odds比 (發(fā)生比率 ) 11010 )1()()1( ?????eeexO d d sxO d d s xx??? ???年齡增加 1歲 Odds比的對數(shù) ))( )1(ln (1 xO d d sxO d d s ???年齡增加 k歲后的 Odds )()( 1 xO d d sekxO d d s k ???模型評價與結果分析 0 5 0 )20(? ??xxxxxL o g i t 1 0 5 3 8 ))(?1 )(?l n ())(?( 10 ??????? ?????20歲 的青年人患冠心病的概率 發(fā)生比 (患與不患冠心病的概率之比) 0 5 9 )20( ?O d d s10年后 30歲 人的發(fā)生比 1 6 9 5 9 )30( 110 ??? ? ?eO d d s60歲 時 )60( ?O d d s)(? * ?x? 48* ?x48歲時患冠心病的概率會大于不患冠心病的概率 . 年齡增加 1歲患病概率的變化很小 . Logit回歸模型 ?)( ??? xx?是 20歲的 倍 140 ?? ?e? 因變量是定性變量的回歸分析作為一種有效的數(shù)據(jù)處理方法已被廣泛應用,尤其在醫(yī)學、社會調(diào)查、生物信息處理等領域 . ??????miii xxxxL og i t10))(1)(l n ())(( ?????mxx ,1 ?自變量 可以是定量變量或定性變量 ? 可以用 逐步回歸 方法建立多元 Logit模型和 Probit模型 , 逐個地加入自變量 (包括某個自變量的高次項及某些自變量的交叉變量 ), 并且實時地進行模型比較檢驗 , 選擇與數(shù)據(jù)擬合較好的模型 . 模型評述 多元 Logit模型
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1