【正文】
run。 proc sort data=。 例 分組創(chuàng)建輸出報(bào)告 。Monthly Expenses for Offices in Each State39。 format expenses ma10.。 expenses=39。 state=39。 label month=39。Observation*Number*===========39。*39。 options nodate pageno=1 linesize=70 pagesize=60。 run。 title 39。 proc print data= double。 身高體重 Name Height Weight Alice Barbara Carol 應(yīng)用舉例 例 選擇打印輸出變量 。 id name。 title2 39。 This is a Label Obs for height 1 2 3 4 5 6 7 8 …… …… proc print data= (obs=3) noobs。This is a Label for height39。 var height。 proc print data= split=39。 Obs Name Sex Age Height Weight 1 Alice F 13 2 Barbara F 13 3 Carol F 14 4 Jane F 12 5 Ja F 15 6 Joyce F 11 7 Judy F 14 8 Louise F 12 9 Mary F 15 10 Alfred M 14 …… …… OUTPUT窗口結(jié)果 NOOBS選項(xiàng): proc print data= noobs。 proc print 。 option(s)選項(xiàng)說(shuō)明: DATA= 規(guī)定要打印列表的數(shù)據(jù)集 NOOBS 不輸出觀測(cè)數(shù)據(jù)的序號(hào) OBS= 為標(biāo)識(shí)觀測(cè)序號(hào)的變量規(guī)定標(biāo)題 ROWS= 規(guī)定一頁(yè)打印的行數(shù) WIDTH= 規(guī)定一頁(yè)的列寬 LABEL 輸出時(shí)用變量標(biāo)簽作為列標(biāo)題 例 選項(xiàng)說(shuō)明舉例 。 VAR variable(s)。 ID variable(s)。 PAGEBY BYvariable。 打印列表過(guò)程句法 PROC PRINT option(s)。 打印列表過(guò)程 ? 利用 PRINT過(guò)程打印列表展現(xiàn)詳細(xì)數(shù)據(jù)集 。 第 17章 數(shù)據(jù)展現(xiàn) 清華大學(xué)經(jīng)管學(xué)院 朱世武 Resdat樣本數(shù)據(jù): SAS論壇: 數(shù)據(jù)展現(xiàn)的方式有兩類(lèi): ? 列表方式; ? 圖形方式。100 Obs Sampled from an Exponential Distribution39。 histogram /exp(fill l=3) cfill=yellow midpoints=.05 to by .25。 proc univariate data=distrdata noprint。100 Obs Sampled from a Normal Distribution39。 histogram Normal_x /normal(noprint) cbarline=grey 。 proc univariate data=distrdata noprint。 end。 exponential_x=ranexp(18746363)。 do n=1 to 100。 exponential_x=39。 label normal_x=39。 data distrdata。 options nodate pageno=1 linesize=80 pagesize=60。 run。 title2 39。 title1 39。 run。 var test1 test2。 options nodate pageno=1 linesize=80 pagesize=60。 run。 title 39。 var citypop_90。 options nodate pageno=1 linesize=80 pagesize=68。 run。 title 39。 proc univariate data=。 應(yīng)用舉例 例 應(yīng)用單變量過(guò)程進(jìn)行多變量分析 。 規(guī)定的關(guān)鍵詞可以分為四類(lèi): ? 描述統(tǒng)計(jì)量關(guān)鍵詞; ? 分位數(shù)關(guān)鍵詞; ? 穩(wěn)健估計(jì)量關(guān)鍵詞; ? 假設(shè)檢驗(yàn)關(guān)鍵詞 。 要求 UNIVARIATE過(guò)程把計(jì)算的描述統(tǒng)計(jì)量輸出到新的 SAS數(shù)據(jù)集里 , keyword為統(tǒng)計(jì)量關(guān)鍵詞 , names為存放輸出統(tǒng)計(jì)量的變量名稱(chēng) 。 如果有兩個(gè)以上 ID變量,這個(gè)最大值的選擇是對(duì)輸入數(shù)據(jù)集的相應(yīng)觀測(cè)組中的每個(gè)觀測(cè),這些 ID變量組合成一個(gè)值的最大值。在輸出數(shù)據(jù)集里,某個(gè)觀測(cè)的 ID變量值規(guī)定為生成這個(gè)觀測(cè)的數(shù)據(jù)集中相應(yīng)觀測(cè)。 ID語(yǔ)句 ID variablelist。該變量的值應(yīng)大于零。 WEIGHT語(yǔ)句 WEIGHT variable。 該變量的值應(yīng)為正整數(shù) 。 FREQ語(yǔ)句 FREQ variable。 對(duì) BY變量定義 BY組計(jì)算統(tǒng)計(jì)量。缺省時(shí),為BY, CLASS, ID,FREQ和 WEIGHT語(yǔ)句中列出的變量之外所有數(shù)值變量。 選項(xiàng)說(shuō)明: VARDEF=選項(xiàng)及說(shuō)明: D A T A = 規(guī)定輸入數(shù)據(jù)集N O P R I N T 規(guī)定不輸出描述統(tǒng)計(jì)量P L O T 要求生成莖葉圖(或水平直方圖)、盒形圖和正態(tài)概率圖F R E Q 規(guī)定生成包括變量值、頻數(shù)、百分?jǐn)?shù)和累計(jì)頻數(shù)的頻率表N O R M A L 規(guī)定計(jì)算關(guān)于輸入數(shù)據(jù)服從正態(tài)分布假設(shè)檢驗(yàn)的統(tǒng)計(jì)量P C T L D E F = 規(guī)定計(jì)算百分位數(shù)V A R D E F = 規(guī)定方差計(jì)算公式中的除數(shù)R O U N D = 規(guī)定變量數(shù)值四舍五入的單位DF 缺省值,規(guī)定除數(shù)使用自由度 N 1W E I G H T | W G T 規(guī)定除數(shù)使用權(quán)數(shù)和N 規(guī)定除數(shù)使用觀測(cè)個(gè)數(shù) NW D F 規(guī)定除數(shù)使用權(quán)數(shù)總和減 1其它語(yǔ)句 VAR語(yǔ)句 VAR variablelist。 WEIGHT variable。 PLOT variable(s) / option(s)。 OUTPUT OUT=SASdatasetstatistickeyword1=name(s) ... statistickeywordn=name(s) percentilesspecification。 ID variable(s)。 FREQ variable。value239。value139。value139。 BY DESCENDING variable1 ...DESCENDING variablen NOTSORTED。 單變量過(guò)程 單變量過(guò)程 ( UNIVARIATE) 除了能計(jì)算均值過(guò)程的基本統(tǒng)計(jì)量外 , 還可以實(shí)現(xiàn)的計(jì)算和功能有: ? 穩(wěn)健性估計(jì)量; ? 描述變量的分布圖; ? 頻數(shù)表; ? 多項(xiàng)檢驗(yàn)。Best Results: Most Money Raised and Most Hours Worked39。 proc print data=Prize。Summary of Volunteer Work by School and Year39。 output out=Prize maxid(MoneyRaised(name) hoursVolunteered(name))=MostCash MostTime max= 。 class School Year。 options nodate pageno=1 linesize=80 pagesize=60。 run。 title2 39。 title1 39。 run。 var finalgrade。 proc means data= noprint。 例 計(jì)算輸出統(tǒng)計(jì)量 。19929439。Confidence Limits for Fund Raising Statistics39。 var MoneyRaised HoursVolunteered。 proc means data= fw=8 maxdec=2 alpha=.1 clm mean std。 run。 title2 39。 title1 39。 class Status Year。 proc means data=GradeBySection min max median。 by section。 options nodate pageno=1 linesize=80 pagesize=60。 run。 title 39。 types () status*year。 proc means data= maxdec=3。 run。 title 39。 proc means data= n mean max min range std fw=8。 例 計(jì)算特定的描述統(tǒng)計(jì)量 。 output out=sum sum=sum_c。 by date。 by date。 應(yīng)用舉例 例 分組求均值 。 OUTPUT語(yǔ)句 OUTPUT OUT= SASdataset outputstatisticlist MINID|MAXID (var1(idlist1) ...varn(idlistn))=namelist。在輸出數(shù)據(jù)集里,某個(gè)觀測(cè)的 ID變量值規(guī)定為生成這個(gè)觀測(cè)的數(shù)據(jù)集中相應(yīng)觀測(cè)組里 ID變量具有的最大值,除非在 PROC MEANS語(yǔ)句的選項(xiàng)中指定IDMIN。 ID語(yǔ)句 ID variablelist。該變量的值應(yīng)大于零。 WEIGHT語(yǔ)句 WEIGHT variable。該變量的值應(yīng)為正整數(shù)。 FREQ語(yǔ)句 FREQ variable。不同點(diǎn)是在排序要求及輸出格式上的不同,CLASS語(yǔ)句不要求輸入數(shù)據(jù)集事先已按 CLASS變量排序。 CLASS語(yǔ)句 CLASS variablelist。 對(duì) BY變量定義的 BY組分別計(jì)算其相應(yīng)的簡(jiǎn)單統(tǒng)計(jì)量。缺省時(shí)指輸入數(shù)據(jù)集中除 BY、 CLASS、