freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

回歸分析一ppt課件-資料下載頁

2025-01-19 21:07本頁面
  

【正文】 就有可能是異常點 , 或稱為野點 ? 如果異常值是一個錯誤的數(shù)據(jù) , 比如記錄錯誤造成的 , 應(yīng)該修正該數(shù)據(jù) , 以便改善回歸的效果 ? 如果是由于模型的假定不合理 , 使得標(biāo)準(zhǔn)化殘差偏大 , 應(yīng)該考慮采用其他形式的模型 , 比如非線性模型 , 或可以考慮增加樣本量 ? 如果完全是由于隨機因素而造成的異常值 , 則應(yīng)該保留該數(shù)據(jù) 2. 在處理異常值時 , 若一個異常值是一個有效的觀測值 , 不應(yīng)輕易地將其從數(shù)據(jù)集中予以剔出 異常值 (識別 ) 1. 異常值也可以通過標(biāo)準(zhǔn)化殘差或?qū)W生化殘差來識別 2. 如果某一個觀測值所對應(yīng)的標(biāo)準(zhǔn)化殘差較大 , 就可以識別為異常值 3. 一般情況下 , 當(dāng)一個觀測值所對應(yīng)的標(biāo)準(zhǔn)化殘差小于 2或大于 +2時 , 就可以將其視為異常值 有影響的觀測值 1. 如果某一個或某一些觀測值對回歸的結(jié)果有強烈的影響 , 那么該觀測值或這些觀測值就是有影響的觀測值 2. 一個有影響的觀測值可能是 ? 一個異常值 , 即有一個的值遠(yuǎn)遠(yuǎn)偏離了散點圖中的趨勢線 ? 對應(yīng)一個遠(yuǎn)離自變量平均值的觀測值 ? 或者是這二者組合而形成的觀測值 , 有影響的觀測值 (圖示 ) 存在一個有影響觀測值的散點圖0246810120 10 20 30 40xy不存在影響值的趨勢 不存在影響值的趨勢 存在影響值的趨勢 杠桿率點 (leverage point) 1. 如果自變量存在一個極端值 , 該觀測值則稱為高杠桿率點 (high leverage point) 2. 在一 元回歸中 , 第 i個觀測值的杠桿率用 hi表示 , 其計算公式為 3. 如果一個觀測值的杠桿率 就可以將該觀測值識別為有高杠桿率的點 4. 一個有高杠桿率的觀測值未必是一個有影響的觀測值 , 它可能對回歸直線的斜率沒有什么影響 5. SPSS可計算中心化杠桿值 , 為高杠桿值 減去 ? ??+?22)()(1xxxxnh iii3 ( + 1 ) , ( )ih p n p? 為變量數(shù)1n高杠桿率點 (圖示 ) 存在高杠桿率觀測值的散點圖05101520250 20 40 60xy高杠桿率點 [Plots子對話框 ] ?用于選擇需要繪制的回歸分析診斷或預(yù)測圖 ?左側(cè)給出繪圖時可用的中間變量列表。 ?繪制標(biāo)準(zhǔn)化殘差圖,可供選擇的有直方圖和正態(tài) PP圖 ?對每個自變量繪出它與因變量殘差的散布圖 ,主要用于回歸診斷 . ?回歸模型對因變量的原始預(yù)測值 . ?進行標(biāo)準(zhǔn)化后回歸模型的預(yù)測值,此時均數(shù)為 0,標(biāo)準(zhǔn)差為 1。 ?去掉當(dāng)前記錄時 ,當(dāng)前模型對該記錄的因變量的預(yù)測值。 ?回歸預(yù)測值的標(biāo)準(zhǔn)差。 ?模型預(yù)測值對因變量觀測值的原始?xì)埐睢? ?進行標(biāo)準(zhǔn)化后的殘差,此時均數(shù)為 0,標(biāo)準(zhǔn)差為 1。 ?標(biāo)準(zhǔn)化法采用的是 U變換,如果采用 t變換,則產(chǎn)生的就是此處的學(xué)生化殘差,亦稱史氏化殘差。 ?去掉當(dāng)前記錄時,當(dāng)前模型對該記錄因變量的預(yù)測值對因變量觀測值的原始?xì)埐睿?通過觀察它可以發(fā)現(xiàn)可疑的 強影響點 。 ?上一個預(yù)測值進行 t變換后的結(jié)果。 [Save子對話框]用來存儲中間結(jié)果(1/3) [Save子對話框 ] 用來存儲中間結(jié)果 (2/3) ?馬哈拉諾夫距離,表示記錄值離樣本平均值的距離 ?若某條記錄多個自變量出現(xiàn)大的 ” 馬氏 ” 距離,則該記錄可能為離群值。 ?表示如果將該記錄去除,模型殘差會發(fā)生多大的變化 ?一般而言, Cook39。s距離大于 1,則該記錄可能為離群值或強影響點。 ?杠桿值,用于測量該數(shù)據(jù)點的影響強度 ?若該數(shù)值大于 2*P/N(P為變量數(shù), N為樣本量 ),則該記錄可能為強影響點。 ?一些專門用于判斷強影響點的統(tǒng)計量。 ?即 Difference in Beta的縮寫,表示去除某觀察值后其回歸系數(shù)的變化值。 ?標(biāo)準(zhǔn)化的 DfBeta值,當(dāng)它大于 2/Sqrt(N)時 (Sqrt()為平方根函數(shù) ),該點可能為強影響點。 ?即 Difference in fit value的縮寫,表示去除某觀察值后 ,其預(yù)測值的變化值。 ?標(biāo)準(zhǔn)化的 DfFit值,當(dāng)它大于 2/ Sqrt (P/N)時,該點可能為強影響點。 ?去除某觀察值之后協(xié)方差陣與含全部觀察值的協(xié)方差陣的比率 ?其絕對值大于 3*P/N時,該觀察值可能為強影響點。 ?一系列用于測量數(shù)據(jù)點與擬合模型距離的指標(biāo)。 ?要求給出均數(shù)的可信區(qū)間或個體參考值范圍的上下界,默認(rèn)為95%區(qū)間 ?可以自己設(shè)定概率值。 ?將模型信息存入 XML文件以便進一步分析 . ?以上選擇默認(rèn)會在當(dāng)前數(shù)據(jù)集中建立新變量 。 ?Save to new file組則可以讓用戶將這些新變量存儲到一個新的SPSS數(shù)據(jù)文件中。 [Save子對話框]用來存儲中間結(jié)果(3/3) 用 SPSS進行殘差分析 一元回歸分析的練習(xí) ? 家庭人均支出的分析 ? 雇員數(shù)據(jù)的分析 結(jié) 束
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1