freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas的相關(guān)與回歸多元回歸正式-wenkub

2022-08-30 17:33:47 本頁(yè)面
 

【正文】 相關(guān), r呈正值, r=1時(shí)為完全正相關(guān);如兩者呈負(fù)相關(guān)則r呈負(fù)值,而 r=1時(shí)為完全負(fù)相關(guān)。 ? 在某一現(xiàn)象與多種現(xiàn)象相關(guān)的場(chǎng)合,當(dāng)假定其他變量不變時(shí),其中兩個(gè)變量之間的相關(guān)關(guān)系稱為偏相關(guān)。在兩個(gè)相關(guān)現(xiàn)象中,自變量 x值發(fā)生變動(dòng),因變量 y也隨之發(fā)生變動(dòng),這種變動(dòng)不是均等的,在圖像上的分布是各種不同的曲線形式,這種相關(guān)關(guān)系稱為曲線(或非線性)相關(guān)。即自變量 x的值增加(或減少),因變量 y的值也相應(yīng)地增加(或減少),這樣的關(guān)系就是正相關(guān)。所以,函數(shù)關(guān)系是相關(guān)關(guān)系的一種特殊情況。 ? 按相關(guān)程度劃分可分為完全相關(guān)、不完全相關(guān)、和不相關(guān): 不相關(guān) ? 如果變量間彼此的數(shù)量變化互相獨(dú)立,則其關(guān)系為不相關(guān),即沒(méi)有任何相關(guān)關(guān)系。各觀測(cè)點(diǎn)落在一條線上。以橫軸代表自變量 X,縱軸代表依變量 Y,可以將一群觀察事物的兩種關(guān)系在坐標(biāo)圖上以 P( X, Y)的方法定位,作出一群散點(diǎn)圖,便可在圖上看出兩者的關(guān)系。例如父母的兄弟,兄高,弟也可能高,但不能說(shuō)兄是因、弟是果,這里不是因果關(guān)系,而可能與社會(huì)條件、家庭經(jīng)濟(jì)、營(yíng)養(yǎng)、遺傳等因素有關(guān)。華中科技大學(xué)公衛(wèi)學(xué)院 流行病與衛(wèi)生統(tǒng)計(jì)系 相關(guān)、回歸與多元回歸 SAS應(yīng)用 學(xué)習(xí)目標(biāo) ? 掌握直線相關(guān)的定義,熟悉簡(jiǎn)單相關(guān)系數(shù)的計(jì)算; ? 掌握直線相關(guān)分析的 SAS程序( CORR過(guò)程以及選項(xiàng)); ? 掌握直線回歸的模型假設(shè)以及計(jì)算方法; ? 了解直線回歸應(yīng)用的注意事項(xiàng); ? 掌握直線回歸分析的 SAS程序( REG過(guò)程以及選項(xiàng))。 概述 ? 相關(guān)是解決客觀事物或現(xiàn)象相互關(guān)系密切程度的問(wèn)題,而回歸則是用函數(shù)的形式表示出因果關(guān)系。 ? 相關(guān)分析和回歸分析是研究現(xiàn)象之間相關(guān)關(guān)系的兩種基本方法。 ? 自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系。自變量 x變動(dòng)時(shí),因變量 y的數(shù)值不隨之相應(yīng)變動(dòng)。 不完全相關(guān) ? 如果變量間的關(guān)系介于不相關(guān)和完全相關(guān)之間,則稱為不完全相關(guān)。 ? 負(fù)相關(guān):兩個(gè)變量之間變化方向相反,即自變量的數(shù)值增大(或減?。?,因變量隨之減?。ɑ蛟龃螅?。曲線相關(guān)在相關(guān)圖上的分布,表現(xiàn)為拋物線、雙曲線、指數(shù)曲線等非直線形式。 相關(guān)系數(shù) ? 所謂相關(guān)分析,就是分析測(cè)定變量間相互依存關(guān)系的密切程度的統(tǒng)計(jì)方法。完全正相關(guān)或負(fù)相關(guān)時(shí),所有圖點(diǎn)都在直線回歸線上;點(diǎn)子的分布在直線回歸線上下越離散, r的絕對(duì)值越小。簡(jiǎn)單相關(guān)系數(shù)的計(jì)算公式為: ? ????????22 )()())((yyxxyyxxr直線相關(guān)分析的 SAS程序 ? SAS系統(tǒng)中進(jìn)行直線相關(guān)分析的過(guò)程步是 CORR過(guò)程。 BY DESCENDING 變量名 1...DESCENDING 變量名 n NOTSORTED。 WEIGHT 變量名 。 ? PARTIAL語(yǔ)句 :用以對(duì)所指定的變量計(jì)算偏相關(guān)系數(shù)或類似的偏統(tǒng)計(jì)量,可計(jì)算的偏統(tǒng)計(jì)量與PROC CORR語(yǔ)句中指定的選項(xiàng)有關(guān)。當(dāng)有 WITH語(yǔ)句存在時(shí), VAR語(yǔ)句中指定的變量之間不再進(jìn)行相關(guān)性分析,而其中的每個(gè)變量都和 WITH語(yǔ)句指定的所有變量進(jìn)行相關(guān)性分析,相關(guān)分析也不會(huì)發(fā)生在 WITH語(yǔ)句所指定的變量之間。進(jìn)行相關(guān)分析時(shí),我們一般會(huì)同時(shí)對(duì)兩變量繪制散點(diǎn)圖,以更直觀地考察兩變量之間的相互變化關(guān)系。當(dāng)兩變量不符合雙變量正態(tài)分布的假設(shè)時(shí),需用Spearman秩相關(guān)來(lái)描述變量間的相互變化關(guān)系。用 Pi與 Qi之差反映 X、 Y兩變量秩排列一致性的情況。以死因構(gòu)成為X, WYPLL構(gòu)成為 Y,作等級(jí)相關(guān)分析。這個(gè)方程稱為直線回歸方程,據(jù)此方程描繪的直線就是回歸直線。其中 x可以是規(guī)律變化的或人為選定的一些數(shù)值(非隨機(jī)變量),也可以是隨機(jī)變量。回歸分析,是指在相關(guān)分析的基礎(chǔ)上,把變量之間的具體變動(dòng)關(guān)系模型化,求出關(guān)系方程式,就是找出一個(gè)能夠反映變量間變化關(guān)系的函數(shù)關(guān)系式,并據(jù)此進(jìn)行估計(jì)和推算。簡(jiǎn)單回歸又稱一元回歸,是指兩個(gè)變量之間的回歸。但是相關(guān)分析不能指出變量間相互關(guān)系的具體形式,也無(wú)法從一個(gè)變量的變化來(lái)推測(cè)另一個(gè)變量的變化情況。 ? 直線回歸分析的資料,一般要求應(yīng)變量 Y是來(lái)自正態(tài)總體的隨機(jī)變量,自變量 X可以是正態(tài)隨機(jī)變量,也可以是精確測(cè)量和嚴(yán)密控制的值。一般說(shuō),不滿足線性條件的情形下去計(jì)算回歸方程會(huì)毫無(wú)意義,最好采用非線性回歸方程的方法進(jìn)行分析。直線回歸的適用范圍一般以自變量取值范圍為限,在此范圍內(nèi)求出的估計(jì)值稱為內(nèi)插;超過(guò)自變量取值范圍所計(jì)算的稱為外延。 BY 變量名列表 。 DELETE 變量名列表 。 直線回歸分析的 SAS程序 ? MODEL語(yǔ)句:用以指定所要擬合的回歸模型。這里所用到的所有變量必須存在于所分析的數(shù)據(jù)集中,而且是數(shù)值型的。如果某一條 model語(yǔ)句指定了 cli, clm, p, r, 或者 influence選項(xiàng),結(jié)果中會(huì)有針對(duì)每一條觀測(cè)的輸出,此時(shí)用 id語(yǔ)句指定每一條觀測(cè)的標(biāo)識(shí)將會(huì)使結(jié)果更易于辨認(rèn)或理解。另外,如果你只想利用 proc reg語(yǔ)句后的選項(xiàng)執(zhí)行某些特定的功能,而并不會(huì)用到 model語(yǔ)句的話, var語(yǔ)句則是必需的。 ? mtest語(yǔ)句:用以在有多個(gè)應(yīng)變量時(shí)進(jìn)行模型的多重檢驗(yàn)。 直線回歸分析的 SAS程序 ? output語(yǔ)句:用于將回歸分析中產(chǎn)生的結(jié)果輸出到指定的數(shù)據(jù)集中,它所對(duì)應(yīng)的是最后一個(gè) model語(yǔ)句所定義的模型。等號(hào)后的符號(hào)為散點(diǎn)圖中表示點(diǎn)的圖形符號(hào),此項(xiàng)內(nèi)容可省略, SAS會(huì)用默認(rèn)方式顯示圖形,但如需指定,符號(hào)要用單引號(hào)括起來(lái)。估計(jì)IgG抗體水平( Y)與年齡( X)的直線回歸方程。 例題-對(duì)數(shù)曲線回歸 ? 以不同劑量的標(biāo)準(zhǔn)促腎上腺皮質(zhì)激素釋放因子 CRF( nmol/L)刺激離體培養(yǎng)的大鼠垂體前葉細(xì)胞,監(jiān)測(cè)其垂體合成分泌腎上腺皮質(zhì)激素 ACTH的量( pmol/L)。 多重線性回歸 ? 事物間的聯(lián)系往往是多方面的,一個(gè)反應(yīng)變量可能受其它多個(gè)解釋變量的影響。但由于多元回歸分析比較復(fù)雜,在此僅簡(jiǎn)要介紹多元線性回歸分析。 多元線性回歸 ? 多元線性回歸分析也稱為復(fù)線性回歸分析,它是一元線性回歸分析或簡(jiǎn)單線性回歸分析的推廣,它研究的是一組自變量如何直接影響一個(gè)因變量。所謂?最優(yōu)?回歸方程 , 主要是指希望在回歸方程中包含所有對(duì)因變量影響顯著的自變量而不包含對(duì)影響不顯著的自變量的回歸方程。 回歸變量的選擇與逐步回歸 ? 選擇?最優(yōu)?回歸方程的變量篩選法包括逐步回歸法,向前引入法和向后剔除法。 ? 向前引入法有一個(gè)明顯的缺點(diǎn),就是由于各自變量可能存在著相互關(guān)系,因此后續(xù)變量的選入可能會(huì)使前面已選入的自變量變得不重要。向后剔除法中終止條件與向前引入法類似。向后剔除法中被剔除的變量,將一直排除在外。 回歸變量的選擇與逐步回歸 ? 它的主要思路是在考慮的全部自變量中按其對(duì)的作用大小,顯著程度大小或者說(shuō)貢獻(xiàn)大小,由大到小地逐個(gè)引入回歸方程,而對(duì)那些對(duì)作用不顯著的變量可能始終不被引人回歸方程。 回歸變量的選擇與逐步回歸 回歸變量的選擇與逐步回歸 ? 逐步回歸分析的實(shí)施過(guò)程是每一步都要對(duì)已引入回歸方程的變量計(jì)算其偏回歸平方和(即貢獻(xiàn)),然后選一個(gè)偏回歸平方和最小的變量,在預(yù)先給定的水平下進(jìn)行顯著性檢驗(yàn),如果顯著則該變量不必從回歸方程中剔除,這時(shí)方程中其它的幾個(gè)變量也都不需要剔除(因?yàn)槠渌膸讉€(gè)變量的偏回歸平方和都大于最小的一個(gè)更不需要剔除)。 例題-多重線性回歸 ? 27名糖尿病人的血清總膽固醇、甘油三脂、空腹胰島素、糖化血紅蛋白、空腹血糖的測(cè)量值,試建立血糖與其它幾項(xiàng)指標(biāo)關(guān)系的多元線性回歸方程。有相關(guān)不一定因果關(guān)系;反之,有因果關(guān)系的,一定有相關(guān)。一般可以借助相關(guān)系數(shù)、相關(guān)表與相關(guān)圖來(lái)進(jìn)行相關(guān)分析。本章詳細(xì)對(duì) REG過(guò)程語(yǔ)句和基本格式進(jìn)行了說(shuō)明,并以實(shí)例演示如何利用 SAS程序進(jìn)行相關(guān)分析。也就是說(shuō),它不能說(shuō)明兩個(gè)變量之間的一般數(shù)量關(guān)系值。 CARDS。 means過(guò)程 , univariate過(guò)程和 freq過(guò)程 來(lái)計(jì)算常見(jiàn)的基本統(tǒng)計(jì)量 。 VAR NAME AGE。表明要進(jìn)行一項(xiàng)數(shù)據(jù)分析。(分組及其它) ? 最后一句是結(jié)束語(yǔ)句。 RUN。 過(guò)程名通常不超過(guò) 8個(gè)字符,代表一種數(shù)據(jù)分析或?qū)嵱眠^(guò)程的名字。 PROC語(yǔ)句:表示過(guò)程步的開(kāi)始及調(diào)用某一要使用的過(guò)程 VAR語(yǔ)句:定義被分析的變量 BY語(yǔ)句:按指定的變量值來(lái)分組處理數(shù)據(jù)集 CLASS語(yǔ)句:在分析中定義分類變量 SUM語(yǔ)句: 對(duì)指定的變量求和,當(dāng)然該變量必須是數(shù)值型變量。 3. 關(guān)鍵字 =SAS數(shù)據(jù)集 指定輸入或輸出的數(shù)據(jù)集 。 By sex。 例 3: ? PROC PRINT DATA=CLASS1。 format 語(yǔ)句 format語(yǔ)句是用在過(guò)程步中調(diào)用變量輸出格式的語(yǔ)句。例如。 RUN。 19950520 20 50 30 25 10 19960703 21 40 50 20 8 19961203 19 20 25 10 15 19970115 18 51 42 30 20 RUN。 例 5: OUTPUT語(yǔ)句: ? PROC MEANS DATA=CLASS1。 格式: OUTPUT OUT=數(shù)據(jù)集名 [統(tǒng)計(jì)關(guān)鍵字=名字 ] “統(tǒng)計(jì)關(guān)鍵字 ” 指在新的數(shù)據(jù)集中需要保留的統(tǒng)計(jì)量 “ 名字 ” 則是給這些統(tǒng)計(jì)量命的名字 。 cards。 run。 Title “title for two procedure”。 ? Proc print data=class1。 Var weight。 LABEL SEX=? 性別?; 四、幾個(gè)服務(wù)過(guò)程 格式: PROC PRINT [data=SAS數(shù)據(jù)集 ]。 DATA=CLASS1。 WHERE SEX=?B? 。 FORMAT DATE DATE7。 例 9: ? PROC SORT DATA=CLASS1 OUT=SORT1。 3. rank 過(guò)程步 將 SAS數(shù)據(jù)集中指定的變量的值按從小到大的順序附給一個(gè)序數(shù), 也稱為秩次。 ? 第三句是 ranks語(yǔ)句,給出秩次轉(zhuǎn)換后新的變量名。 rank過(guò)程步和 sort過(guò)程步一樣,不產(chǎn)生任何輸出信息,必須借助于 print 過(guò)程步,才能看到新數(shù)據(jù)集的結(jié)果。 VALUE $SF B=’BOY’ G=’GIRL’ 。 RUN。]/*指定分析的變量名列表 ,缺省為所 有數(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1