freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析一元線性回歸分析(編輯修改稿)

2024-09-26 20:43 本頁面
 

【文章內(nèi)容簡介】 機變量,且均值為零和方差相等為 2? 。如果模型適合于觀察到的數(shù)據(jù),那么殘差 te 作為誤差 t?的無偏估計 t?? ,應基本反映誤差 t? 的假設習性。即殘差圖應該在零點附近對稱地密布,越遠離零點的地方就疏散,則在形象上似有正態(tài)趨勢,常認為模型與數(shù)據(jù)擬合得很好。 如 圖 所示,是殘差的各種可能出現(xiàn)情況。 若殘差圖呈現(xiàn)如圖 ( a)所示的形式,殘差是隨機的且不表示出一定的趨勢與形式,我們認為建立的回歸模型 應 診斷為無甚大問題。更進一步的診斷應該采用學生化殘差鑒別是否正態(tài)性。一個簡單的思想就是,如果模型假設正確的話 ,殘差就應該是誤差的良好估計,那么殘差全體構(gòu)成的直方圖應當與正態(tài)曲線很相似。我們可以求出估計殘差的方差 )?( tVar? , 圖 殘差的主要幾種類型 d42029e444b4fd2a2e5519415cc2aed7 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 13 of 44 且符合正態(tài)分布 : )2)1(,0(~? ?? NE SShN tt? () 那么學生化殘差 : )1,0(~)2/()1( ?)?(? NNE SSh yyV arttttt ?? ???? () 則遵循標準正態(tài)分布。在實 際 中 , 學生化殘差常與 ty? 配合作圖,會有更好的直觀判斷效果。 若殘差圖呈現(xiàn)如圖 ( b)所示的形式,有一個對既定模型偏離很大的 觀察數(shù)據(jù)點,稱為異常點。如果懷疑異常點是由于記錄數(shù)據(jù)中發(fā)生的錯誤或者在測量過程中采用了拙劣的技巧,我們理應從數(shù)據(jù)集中刪除,重新回歸模型。但對異常點的處理須持謹慎態(tài)度,因為異常點的出現(xiàn)可能代表了相當重要的某些數(shù)據(jù),它恰好成為我們探究某些事先不清楚或許是更為重要的因素的線索。在 SAS 系統(tǒng)的 reg 回歸過程中用來度量異常點影響大小的統(tǒng)計量是COOKD 統(tǒng)計量,計算方法請參閱 SAS/STAT 軟件使用手冊。 若殘差圖呈現(xiàn)如圖 ( c)所示的形式,殘差隨 x 的增大而增大。 如圖 ( d)所示的形式,殘差隨 x 的增大而先增后減,則蘊含著殘差乃至誤差對于不同的觀察值具有不同的方差變化,稱為異方差。在這種場合應該考慮在回歸之前對數(shù)據(jù) y 或 x 進行變換,實現(xiàn)方差穩(wěn)定后再擬合回歸模型。原則上,當誤差方差變化不太快時取變換 y ,當誤差方差變化較快時取變換 ylog 或 yln ,當誤差方差變化很快時取變換 y/1 。當然 , 還存在著不少其他變換,如著名的 BoxCox冪變換 ?? 1?y 。 若殘差圖呈現(xiàn)如圖 ( e)所示的形式,顯示了模型本 身具有非線性趨勢,或者提示人們在模型中是否忽略了若干重要的變量。 如圖 ( f)所示的形式,顯示了模型本身具有線性趨勢。同樣表示了模型的錯誤選定。 2. 共線性 回歸研究中很容易發(fā)生模型中兩個或兩個以上的自變量高度相關(guān),從而引起最小二乘估計可能很不精確。高度 相關(guān)的自變量以及由它們所引起的估計問題合在一起稱之為共線性( collinearity)問題。 為什么共線性會引起參數(shù)估計可能很不精確呢?主要原因是最小二乘法所利用的數(shù)據(jù)信息,如果存在共線性,就可能已經(jīng)被其他的自變量說明了大部分,因此用剩余的少量數(shù)據(jù)估計參數(shù),將產(chǎn)生估計參數(shù)的方差很大,置信區(qū)間也會很大,假設檢驗也使人缺乏信任感。在實際中 , 最常見的問題是一些重要的自變量很可能由于在假設檢驗中 t 值不顯著而被不恰當?shù)靥蕹?。共線性診斷問題就是要找出哪些變量間存在共線性關(guān)系。 SAS 系統(tǒng)的 reg 過程中提供了特征值法、條 件指數(shù) collin 和方差膨脹因子 vif,請參閱 SAS/STAT 軟件使用手冊。 3. 誤差的獨立性 在回歸診斷中,有一個非常重要的回歸模型假設需要診斷和檢驗,那就是回歸模型中的d42029e444b4fd2a2e5519415cc2aed7 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 14 of 44 誤差項的 獨 立性。如果誤差項不 獨立,那么我們對回歸模型的許多處理,包括誤差項估計、假設檢驗等 都將沒有推導依據(jù)。由于殘差是誤差的合理估計,因此檢驗統(tǒng)計量通常是建立在殘差的基礎上。檢驗誤差獨立性的最常用方法,是對殘差的一階自相關(guān)性進行 DurbinWatson檢驗。原假設 :0H 誤差項是相互獨立的,備選假設 :1H 誤差項是相關(guān)的。檢驗統(tǒng)計量為: E SSeeDW Nt tt /)(2 21?? ??? () 我們可以通過簡單不等式證明 : E SSeeeee Nt tNt tNt tNt tt 44)(2)(0 1 22 2 12 22 21 ?????? ???? ?? ??? ? 因此 , DW統(tǒng)計量應滿足 : 40 ??DW () 如果 DW接近于 0,表示殘差中存在正自相關(guān);如果 DW接近于 4,表示殘差中存在負自相關(guān);如果 DW接近于 2,表示殘差獨立性。在給定顯著水平 ? 下,我們可以查 DurbinWatson表得到不能拒絕獨立性原假設的區(qū)間 UL DWDWDW ?? 。 六、 PROC REG 過程 它的一般格式為: PROC REG 輸入數(shù)據(jù)集名 選項列表 。 MODEL dependents=independents / 選項列表 。 其它選擇語句 。 RUN。 1. PROC REG 語句中的 選項列表 ? OUTEST=SAS 數(shù)據(jù)集 —— 將有關(guān)模型的參數(shù)輸出到指定的 SAS 數(shù)據(jù)集中 ? OUTSSCP=SAS 數(shù)據(jù)集 —— 將相關(guān)矩陣輸出到指定的 SAS數(shù)據(jù)集中 ? ALL—— 屏幕輸出所有內(nèi)容 ? NOPRINT—— 不在屏幕輸出任何內(nèi)容 2. MODEL 語句中的選項 該語句定義建模用的因變量、自變量、模型的選擇及結(jié)果輸出的選擇。 與模型有關(guān)的選項有 : ( 1) SELECTION—— 選擇合適的建立模型方法 ? SELECTION=FORWARD SLENTRY=顯著性水平 前進法( FORWARD):對每一個尚不在方程內(nèi)的自變量按一定的顯著性水平,根據(jù)其一d42029e444b4fd2a2e5519415cc2aed7 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 15 of 44 旦進入模型后對模型的貢獻大小逐步引入方程,直至再沒有對模型有顯著貢獻的自變量。 缺省 SLENTRY= ? SELECTION=BACKWARD SLSTAY=顯著性水平 后退法( BACKWARD):先建立包含全部變量的模型,然后按一定的顯著性水平從模型中逐步剔除變量。 缺省 SLSTAY = ? SELECTION=STEPWISE SLENTRY =入選水平 SLSTAY=剔除水平 逐步法( STEPWISE):按前進法進入變量,再對模型內(nèi)所有變量檢驗,看是否有 新 因變量引入而對模型的貢獻變得不顯著的變量,若有就剔除,若無則保留,直至方程內(nèi)所有的變量均顯著,顯然逐步法有兩個水平,即選入水平和剔除水平,而且剔除水平應低于選入水平。 缺省 SLENTRY = SLSTAY = 在上述三種方法的使用中,若要求打印出每一次選入或剔除變量進行模型擬合時的所有統(tǒng)計量,可以加選 DETAILS。 ( 2) NOINT—— 表示擬合無常數(shù)項(截距)的回歸模型 與屏幕輸出有關(guān)的選項有: ? CORRB—— 輸出參數(shù)估計的相關(guān)陣 ? STB—— 輸出標準化偏回歸系數(shù)矩陣 ? P—— 輸出個體觀測值、預測值及殘差。若已選了 CLI、 CLM、 R,則無需該選項 ? R—— 輸出每個個體觀測值、殘差及標準誤差 ? CLM—— 輸出每個觀測值因變量期望值的 95%的上、下限 ? CLI—— 輸出每個個體觀測值的 95%的上、下限 與殘差分析有關(guān)的選項有: ? VIF—— 輸出變量間相關(guān)性的方差膨脹系數(shù)( Variance Inflation Factor) ,VIF越大,說明由于共線性存在,使方差變大。 ? COLLIN—— 輸出條件數(shù)( Condition index) ,它表示最大的本征性與每個自變量本征值之比的平方根。一般情況下,條件數(shù)越大越可能存在共線性。 ? TOL—— 表示共線性水平的容許值, TOL( Tolerance Value)越小說明其可用別的自變量解釋的部分多,自然可能與別的自變量存在共線性關(guān)系。 ? DW—— 輸出 DurbinWatson統(tǒng)計量 3. 其他選擇語句 注意,這部分的語句可以在 REG 過程被被激活后,以交互式方式運行。 ? OUTPUT語句 —— 建立 SAS 的輸出結(jié)果數(shù)據(jù)集 語句格式為: OUTPUT OUT=SAS 數(shù)據(jù)集名 關(guān)鍵字名 =輸出數(shù)據(jù)集中的變量名 其中關(guān)鍵字名為需要的統(tǒng)計量名,它們有 P(預測值)、 R(殘差)、 L95M(期望值的 95%的下限)、 U95M(期望值的 95%的上限)、 L95(個體預測值的 95%的下限)、 U95(個體預測值的 95%的上限)、 STDP(期望值的標準誤差)、 STDR(殘差的標準誤差)、 STDI(預測值的標 準誤差)、 STUDENT(學生化殘差)、 COOKD( COOK 氏 D 值) ? PLOT語句 —— 繪制兩變量的散點圖 語句格式為: PLOT X*Y / 選項 d42029e444b4fd2a2e5519415cc2aed7 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 16 of 44 ? ADD 變量名列表 —— 向模型中增加變量 ? DELETE 變量名列表 —— 刪除原擬合模型中的有關(guān)變量 ? REFIT—— 重新擬合模型 ? PRINT—— 輸出有關(guān)模型的相關(guān)信息 七、 應用舉例 例 廣告花費 X 與銷售額 Y 的回歸模型。大多數(shù)公司最終會詢問關(guān)于花費在廣告上的費用對公司產(chǎn)品銷售額的影響程度。由于廣告需要一定的時間才能達到它的效應,同時它的效應也不是永久持續(xù)的, 它的影響也許僅僅延續(xù)開頭的一段時期。假設公司相信銷售額與當月以及前兩個月內(nèi)所花的廣告費有較密切的關(guān)系,即意味著: Yt與 Xt, Xt1, Xt2有密切的關(guān)系。假設它們之間存在線性關(guān)系,建立模型為: Yt=β 0+β 1Xt+β 2 Xt1+β 3 Xt2+ε t 我們現(xiàn)在有某公司 15 個 月內(nèi)有關(guān)廣告花費 X 與銷售額 Y 的數(shù)據(jù), 如 表 所示 。 表 廣告額與銷售額 月 t 月銷售額 Yt 月廣告花費 Xt 1 2945 280 2 4295 400 3 5645 450 4 6995 590 5 8345 650 6 9695 750 7 11045 890 8 12395 1000 9 13745 1050 10 15095 1200 11 16445 1250 12 17795 1350 13 19145 1460 14 20495 1500 15 21845 1650 程序如下: LIBNAME STUDY D:\SASDATA\MYDIR。 DATA 。 INPUT SALES ADV @@。 ADVLAG1=LAG1(ADV)。 ADVLAG2=LAG2(ADV)。 OUTPUT 。 CARDS。 2945 280 4295 400 5645 450 6995 590 8345 650 9695 750 11045 890 12395 1000 13745 1050 15095 1200 d42029e444b4fd2a2e5519415cc2aed7 商務數(shù)據(jù)分析 電子商務系列 上海財經(jīng)大學經(jīng)濟信息管理系 IS/SHUFE Page 17 of 44 16445 1250 17795 1350 19145 1460 20495 1500 21845 1650 。 PROC REG DATA= OUTEST=。 MODEL SALES=ADV ADVLAG1 ADVLAG2。 RUN。 輸出的結(jié)果見表 。 表 回歸分析的第一次結(jié)果 運行后,得到的最小二乘回歸形式為: Yt=+++ 進一步統(tǒng)計分析,按
點擊復制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1