freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析散布圖折線圖和層次圖-文庫(kù)吧

2025-07-16 17:32 本頁(yè)面


【正文】 線的類型 —— 例如 , l=2。 ? C=定義顏色 —— 例如 , c=red。 ? FONT=定義一種字體 —— 例如 , font=swissb。 SYMBOLn 語(yǔ)句所定義的各種選 項(xiàng) ,由于數(shù)量眾多,用戶一般很難記憶,我們上面所列出的僅僅是一小部分。通??梢栽诿钶斎肟蛑邪l(fā)布 SYMBOL命令,調(diào)出 SYMBOL 窗口,上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 7 of 28 在選項(xiàng)參數(shù)的橫線上鍵入?后,在參數(shù)對(duì)話框中選擇參數(shù)。共有 14項(xiàng)參數(shù)選 項(xiàng) ,每項(xiàng)中還有許多參數(shù)值。 一個(gè) SYMBOLn 語(yǔ)句一旦被定義就一直保持有效,直到重新定義或者退出 SAS 系統(tǒng)。執(zhí)行一個(gè)不帶任何選項(xiàng)的 SYMBOLn 語(yǔ)句將取消 SYMBOLn 的全部定義,并不影響 其他 的SYMBOL 語(yǔ)句。如果想要取消所有的 SYMBOL 語(yǔ)句定義,提交下面的語(yǔ)句: goptions reset=symbol 。 4. 用 AXISn 語(yǔ)句定義坐標(biāo)軸 在 PROC GPLOT 中,可以通過 PLOT 語(yǔ)句的選項(xiàng)、 LABEL 語(yǔ)句和 FORMAT 語(yǔ)句來修飾坐標(biāo)軸。 PLOT 語(yǔ)句的選項(xiàng)允許控制坐標(biāo)軸的刻度、文本和顏色。但使用 AXISn 語(yǔ)句的選項(xiàng)可以更集中、更方便地控制和管理坐標(biāo)軸。常見的使用格式如下: Proc Gplot DATA=數(shù)據(jù)集 。 Plot Y*X / vaxis=axis1 haxis=axis2 。 Symboln 選項(xiàng)列表 。 axis1 label=(?Price?) order=(100 to 1500 by 200 ) offset=(20,10) 。 axis2 label=(?Date?) order=(?21dec90?d to ?01jan93?d by 98 ) 。 Run 。 AXISn 語(yǔ)句的 LABEL 選項(xiàng)規(guī)定該軸的標(biāo)簽, ORDER選項(xiàng)規(guī)定該軸的取值范圍, OFFSET選項(xiàng)規(guī)定從 該軸的原點(diǎn)開始的第一個(gè)主刻度空間大小,及從該軸最末端到最后一個(gè)刻度的空間大小。例如 , 語(yǔ)句中的 OFFSET=( 20, 10),當(dāng)單位是 PCT 時(shí),表示第一個(gè)主刻度空間為圖形輸出區(qū)域的 20%,最后一個(gè)刻度的空間為圖形輸出區(qū)域的 10%。 有時(shí)需要給圖形加第二根縱軸,用來表示在同一時(shí)間期間上的另一個(gè)變量。兩個(gè)變量不用同一縱坐標(biāo)軸的原因,常常是兩個(gè)變量的值相差太大,如果兩個(gè)變量的值顯示在同一縱軸上,在圖形上就會(huì)很難分辨值較小那個(gè)變量的值的變化。定義第二根縱軸(右軸)的方法如下: Proc Gplot DATA=數(shù)據(jù)集 。 Plot Y1*X / vaxis=axis1 haxis=axis2 。 Plot2 Y2*X / vaxis=axis3 。 Symboln 選項(xiàng)列表 。 axis1 選項(xiàng)列表 。 axis2 選項(xiàng)列表 。 axis3 選項(xiàng)列表 。 Run 。 用第二條 PLOT2 語(yǔ)句定義了第二根縱軸 AXIS3。 例如,我們要在同一圖形上繪制上證指數(shù)的最高 價(jià)- 最低 價(jià)- 收盤價(jià)和交易量的圖形。由于價(jià)格和交易量的取值 范圍不同且相差懸殊,交易量用左邊的縱軸來度量,價(jià)格采用右邊的縱軸來度量。要生成最高 價(jià)- 最低 價(jià)- 收盤價(jià)圖,原來 INDEXSH 數(shù)據(jù)集中的數(shù)據(jù)排列格式不符合要求,需要用數(shù)據(jù)步修改 INDEXSH 為 INDEXSH2,將一條觀測(cè)中最高 價(jià) HIGH、上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 8 of 28 最低 價(jià) LOW、收盤價(jià) CLOSE 三個(gè)數(shù)據(jù),轉(zhuǎn)換成三條觀測(cè)中 VALUE 變量的數(shù)據(jù),且三條觀測(cè)的日期 DATE 不變。程序如下: Libname study d:\sasdata\mydir 。 data 。 set 。 value=high。 output。 value=low。 output。 value=close。 output。 Run 。 Goptions reset=global gunit=pct cback=white border htitle=6 htext=3 ftext=swissb colors=(back) 。 Proc gplot data=。 plot volume*date /vaxis=axis1 hvxis=axis2。 plot2 value*date /vaxis=axis3 vref=0。 symbol1 i=needle。 symbol2 i=hiloc。 axis1 label=(39。Volume39。) order=( 0 to 700000 by 100000) offset=(0,50) 。 axis2 label=(39。Date39。) order=(39。21dec9039。d to 39。01jan9339。d by 98) 。 axis3 label=(39。Price39。) order=(0 to 1500 by 100) offset=(25,0) 。 title 39。Shanghai StockIndex39。 Run 。 程序的運(yùn)行結(jié)果顯示在 GRAPH 窗口中, 如圖 所示。 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 9 of 28 在用 PROC GPLOT 過程繪制高分辨率的 圖形 前,首先把繪圖的數(shù)據(jù)轉(zhuǎn)換和處理成能符合I=HOLOC 連接方式的數(shù)據(jù)格式,另外為了確保在生成圖形時(shí),各種符號(hào)定義準(zhǔn)確,一般先使用 GOPTIONS語(yǔ)句,清除先前 定義 的 各種符號(hào)( RESET=GLOBAL),然后再定義將在圖中使用的全局符號(hào)體系。 三、 散布圖 散布圖又稱散點(diǎn)圖或相關(guān)圖。它是以散點(diǎn)的分布反映變量之間相關(guān)情況的統(tǒng)計(jì)圖。根據(jù)圖中的各點(diǎn)分布和密集程度,大致可以判斷變量之間協(xié)變關(guān)系的類型。在回歸模型中,常用散布圖來描述變量之間的相關(guān)關(guān)系,橫軸上自變量的改變將引起縱軸上因變量的改變 。 回歸模型中參數(shù)的計(jì)算 , 是通過使因變量的理論值與實(shí)際值之間偏差的平方和達(dá)到最小而得到的。 為了便于理解散布圖在回歸模型中的應(yīng)用,我們先用已知的線性方程來虛擬構(gòu)造一組樣本數(shù)據(jù),畫出散布圖,從圖 中各散點(diǎn)形成的趨勢(shì)看,是否符合線性關(guān)系,然后決定用線性回歸模型求回歸方程 。 作為對(duì)總體回歸直線的近似,必須進(jìn)行統(tǒng)計(jì)檢驗(yàn)才能確定這種近似是否恰當(dāng),最后我們可以得到確認(rèn)的總體回歸方程,再比較我們已知的方程,應(yīng)該發(fā)現(xiàn)非常接近。 例如,新創(chuàng)建的數(shù)據(jù)集 LINE,是我們用身高( HEIGH) =體重( WEIGHT) +100 這樣一個(gè)簡(jiǎn)單直線方程來生成的模擬數(shù)據(jù)集。數(shù)據(jù)集中有一組高度 HEIGH 和體重 WEIGHT 的觀測(cè)值。假設(shè)我們需要繪制回歸直線及置信帶等 , 可以先畫出高度對(duì)體重的散布圖進(jìn)行觀察和分析,然后利用回歸過程建立高度(因變 量)和體重(自變量)的線性方程式后,進(jìn)一步畫出高度預(yù)測(cè)值對(duì)體重的散布圖 , 進(jìn)行比較和分析。程序如下: Libname study d:\sasdata\mydir。 data 。 圖 用 GPLOT 過程 訂 制的價(jià)格和成交量圖 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 10 of 28 do n=1 to 200 by 1。 weight=40+60*ranuni(1) 。 height=1*weight+100+5*normal(1) 。 output 。 end 。 Proc reg data=。 model height=weight。 output out= p=predict 。 proc gplot data= 。 plot height*weight predict*weight / overlay。 symbol1 v=dot c=red i=none。 symbol2 v=none c=blue i=spline。 Run 。 程序說明:數(shù)據(jù)步 DATA 自動(dòng)生成 200 條觀測(cè), SAS 系統(tǒng)提供了兩個(gè)均勻分 布的隨機(jī)函數(shù) RANUNI()和 UNIFORM()產(chǎn)生 0~ 1之間的隨機(jī)數(shù),用隨機(jī)函數(shù)構(gòu)成的 40+60*ranuni(1)表達(dá)式,將使 WEIGHT 變量的取值范圍為 40~ 100公斤之間的隨機(jī)值。 SAS 系統(tǒng)還提供了兩個(gè)標(biāo)準(zhǔn)正態(tài)分布的隨機(jī)函數(shù) NORMAL()和 RANNOR(),產(chǎn)生均值為 0標(biāo)準(zhǔn)差為 1 標(biāo)準(zhǔn)正態(tài)隨機(jī)數(shù)。隨機(jī)數(shù) 表達(dá)式 1*weight+100+5*normal(1)是經(jīng)過線性變換 產(chǎn)生的均值為1*weight+100,標(biāo)準(zhǔn)差為 5 的隨機(jī)數(shù),對(duì)于 正態(tài)分布 將有 95%的數(shù)據(jù)落在均值附近的兩個(gè)標(biāo)準(zhǔn)差之內(nèi),例如,對(duì)于 weight=50 來說,身高的均值為 50+100=150,因此 HEIGHT 變量的取值范圍 將有 95%的可能 為 140~ 160厘米。 PROC REG 回歸過程,首先建立輸入為 WEIGHT輸出為 HEIGHT的回歸模型,并用 OUTPUT語(yǔ)句創(chuàng)建包含身高預(yù)測(cè)值的輸出數(shù)據(jù)集,定義輸出數(shù)據(jù)集名為 ,定義存放預(yù)測(cè)值的變量名為 PREDICT。最后 , 用 PROC GPLOT 過程把實(shí)際高度對(duì)重量及預(yù)測(cè)高度對(duì)重量?jī)蓮埳⒉紙D重疊放在一張圖上,通常兩張圖應(yīng)該用不同的作圖字符來表示散點(diǎn),實(shí)際高度對(duì)重量用無(wú)任何連線的小圓點(diǎn)表示 ,預(yù)測(cè)高度對(duì)重量用平滑曲線連接散點(diǎn)。 高分辨率的輸出圖形顯示在 GRAPH窗口,在 OUTPUT 窗口還顯示輸出 PROC REG過程的統(tǒng)計(jì)報(bào)告,如下所示: 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 11 of 28 從回歸分析報(bào)告中我們看出,對(duì)樣本回歸直線與觀測(cè)值之間的擬合程度的檢驗(yàn)(也稱擬合優(yōu)度檢驗(yàn)) ——用判定系數(shù) R2檢驗(yàn), R2的取值范圍 為 0~ 1,越接近 1,擬合程度越好;反之越差。本例中 R2為 ,調(diào)整后的 R2也為 ,非常接近于 1。還有參數(shù)顯著性檢驗(yàn)( T 檢驗(yàn))和回歸總體線性的顯著性檢驗(yàn)( F 檢驗(yàn))都顯示高度顯著。我們可以確認(rèn)回歸模型的估計(jì)式為: HEIGHT=*WEIGHT+ SAS 系統(tǒng)的許多圖形過程都帶有統(tǒng)計(jì)計(jì)算,許多統(tǒng)計(jì)分析過程都帶有圖形輸出。 PROC GPLOT 畫圖過程就帶有回歸模型的預(yù)測(cè)值和置信帶計(jì)算,并用曲線連接。程序如下: Goptions reset=global gunit=pct cback=white border htitle=6 htext=3 ftext=swissb colors=(back) 。 proc gplot data= 。 plot height*weight height*weight /vaxis=axis1 haxis=axis2 overlay。 symbol1 i=none v=dot cv=black h= 。 symbol2 i=rlcli95 ci=black cv=black co=black w= L=1。 axis1 label=(39。Height39。) order=(130 to 210 by 10) 。 axis2 label=(39。Weight39。) order=(40 to 100 by 10) 。 title 39。Linear Regression39。 Run 。 程序說明:對(duì)樣本數(shù)據(jù)集 不先調(diào)用統(tǒng)計(jì)計(jì)算過程求回歸預(yù)測(cè)值,而是直接繪制實(shí)際身高對(duì)體重的兩張重疊散點(diǎn)圖。然后對(duì)第二張圖的連接方式 I 選項(xiàng)確定為 RLCLI95,包括 三部分含義: ⑴ RL表示作直線回歸,還可用表示作 2次回歸 RQ 和 RQ0(消除截距,強(qiáng)制線經(jīng)過原點(diǎn))代替,或表示作 3次回歸的 RC、 RC0 代替; ⑵ CLI 表示作單個(gè)預(yù)測(cè)值的置信Model: MODEL1 Dependent Variable: HEIGHT Analysis of Variance Sum of Mean Source DF Squares Square F Value ProbF
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1