freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析編輯統(tǒng)計(jì)圖形(已改無(wú)錯(cuò)字)

2022-10-01 17:32:03 本頁(yè)面
  

【正文】 FREQ_ MEANW MEANH 1 A 0 5 2 A F 1 2 3 A M 1 3 4 B 0 5 5 B F 1 2 6 B M 1 3 7 C 0 5 8 C F 1 3 9 C M 1 2 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 21 of 29 data x 。 input x @@。 cards。 7 2 1 3 6 10 15 21 30 。 proc means data=x n mean var std stderr t prt 。 run。 程序運(yùn)行的主要結(jié)果如表 所示。 表 計(jì)算 T 值和 P概率值 從計(jì)算結(jié)果可見(jiàn), T值為 (臨界值),故在 5%的顯著水平上接受假設(shè) H0。如果選擇顯著性水平為 10%,這時(shí) T 分布的臨界值為 , ,故應(yīng)拒絕原假設(shè)。因?yàn)榇死龢颖玖刻。越Y(jié)論的有效性非常強(qiáng)地依賴于總體的分布接近正態(tài)分布的程度。 另外,一種更直接的檢驗(yàn)方法是查看計(jì)算出的 P 值。該值說(shuō)明總體均值在此概率水平上顯著地不為 0。一般地,若取顯著水平 ? =,因 ,故接 受 H0的假設(shè);若取 ? =,因 ,故拒絕 H0的原假設(shè)。 5. 與均值有關(guān)的單組統(tǒng)計(jì)分析 例 某物品的某成分的數(shù)據(jù)真值為 ,現(xiàn)用某法重復(fù)測(cè)定物品成分 11 次(數(shù)據(jù)見(jiàn)程序中),問(wèn)用該法測(cè)定所得的總體均值與真值之間的差別是否有顯著性。程序如下: data meantest 。 input x @@ 。 y=。 cards。 。 run。 proc means mean stderr t prt 。 var y。 run。 輸出的主要結(jié)果見(jiàn)表 所示。 表 與均值有關(guān)的單組統(tǒng)計(jì)分析結(jié)果 The SAS System Analysis Variable : X N Mean Variance Std Dev Std Error T Prob|T| 9 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 22 of 29 輸出結(jié)果分析: T=, P=,不能拒絕原假設(shè) u=0,接受原假設(shè),即用該法測(cè)定所得的總體均值與真值之間的差別無(wú)顯著性。 六、 詳細(xì)的描述性統(tǒng)計(jì) proc univariate 過(guò) 程 SAS 的 univariate 過(guò)程主要用于對(duì)指定隨機(jī)變量進(jìn)行詳細(xì)的描述性統(tǒng)計(jì)。該過(guò)程除了可以完成 means 過(guò)程的基本統(tǒng)計(jì)量的計(jì)算外,它還可以生成統(tǒng)計(jì)圖和計(jì)算其他的一些統(tǒng)計(jì)量。兩者的用法基本類似,主要區(qū)別在于 means 允許使用 class 語(yǔ)句,而 univariate 過(guò)程可繪制莖葉圖、盒型圖和計(jì)算各種百分位值。 1. 單變量統(tǒng)計(jì)分析 對(duì)一組單指標(biāo)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析常采用兩種方法: ? 圖示法 —— 包括莖葉圖、盒型圖和正態(tài)概率圖。 ? 描述統(tǒng)計(jì)量 —— 包括矩、分位數(shù)、極端值和頻數(shù)分布表。 2. 莖葉圖( Stemandleaf display) 莖葉圖是探索性數(shù)據(jù)分析中對(duì)數(shù)據(jù)的初步形象描述 ,有點(diǎn)像直方圖,但主要的差異在于莖葉圖是用數(shù)據(jù)代替直方圖中的矩形,這樣既有了直觀的圖示,又有了對(duì)具體數(shù)據(jù)的大致了解。每一個(gè)數(shù)據(jù)分解為三個(gè)部分: ? 莖 ? 葉 ? 可忽略部分 3. 盒型圖( Boxplot) 我們對(duì)數(shù)據(jù)組分布的粗略描述,常采用“五數(shù)概括” (five number summaries), 即數(shù)據(jù)組中的最小數(shù)、下四分位數(shù)、中位數(shù)、上四分位數(shù)與最大數(shù)。但五數(shù)概括沒(méi)有像直方圖、莖葉圖那樣給人以直觀的感覺(jué)。與五數(shù)概括聯(lián)系在一起的圖像是盒型圖,它與莖葉圖一樣常用于探索性 數(shù)據(jù)分析。盒型圖的主要特點(diǎn)如下: ? 矩形描述了居中的 50%數(shù)據(jù) ? 上下兩線段(觸須線)代表上下各 25%的數(shù)據(jù)的分布狀況 ? 矩形盒較短表明數(shù)據(jù)比較集中 ? 兩端的觸須線對(duì)稱或長(zhǎng)短不一反映數(shù)據(jù)的分布特性 4. Univariate 過(guò)程的語(yǔ)句格式 Univariate 過(guò)程的主要控制語(yǔ)句如下: The SAS System Analysis Variable : Y Mean Std Error T Prob|T| 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 23 of 29 proc univariate 輸入數(shù)據(jù)集名 選項(xiàng)列表 。 var 變量列表 。 by 變量列表 。 freq 變量 。 weight 變量 。 id 變量列表 。 output out=輸出數(shù)據(jù)集名 統(tǒng)計(jì)量關(guān)鍵字 =變量名列表 pctlpts=百分位數(shù) pctlpre=變量前綴名 pctlname=變量后綴名 。 run。 ( 1) proc univariate 語(yǔ)句中的 選項(xiàng)列表 。 ? vardef=df/weight/wgt/n/wdf—— 在方差計(jì)算中規(guī)定除數(shù) d.。與上面的 proc univariate 語(yǔ)句中的選項(xiàng) vardef意義相同。 ? freq—— 要求生成包括變量值、頻數(shù)、百分?jǐn)?shù)和累計(jì)頻數(shù)的頻率表。 ? normal—— 要求計(jì)算關(guān)于輸入數(shù)據(jù)服從正態(tài)分布的假設(shè)的檢 驗(yàn)統(tǒng)計(jì)量。 ? plot—— 要求生成一個(gè)莖葉圖、一個(gè)盒型圖和一個(gè)正態(tài)概率圖。 ? round=舍入單位列表 —— 規(guī)定 var語(yǔ)句中變量的四舍五入的單位。 ? pctldef=1/2/3/4/5—— 規(guī)定計(jì)算百分位的五種方法 , 缺省值為 5。 ( 2) output 語(yǔ)句中的選項(xiàng)。 ? pctlpts=百分位數(shù) pctlpre=變量前綴名 pctlname=變量后綴名 —— 提供用戶自己想計(jì)算的百分位數(shù)和規(guī)定在輸出數(shù)據(jù)集中合成的變量名。 ? 統(tǒng)計(jì)量關(guān)鍵字 =變量名 列表 —— 規(guī)定在輸出數(shù)據(jù)集中要包含的統(tǒng)計(jì)量并規(guī)定這些統(tǒng)計(jì)量在新數(shù)據(jù)集中的變量名。 在這 里可以使用的統(tǒng)計(jì)量的關(guān)鍵字名稱見(jiàn)表 。 表 univeriate 過(guò)程中的統(tǒng)計(jì)量關(guān)鍵字 統(tǒng)計(jì)量名稱 含義 統(tǒng)計(jì)量名稱 含義 n 未丟失的觀測(cè)個(gè)數(shù) mode 眾數(shù),出現(xiàn)頻數(shù)最高的數(shù) nmiss 丟失的觀測(cè)個(gè)數(shù) t 總體均值等于 0的 t統(tǒng)計(jì)量 nobs 觀測(cè)個(gè)數(shù) prt t分布的雙尾 p值 mean 算術(shù)平均 q3 上四分位數(shù)( 75%) stderr 均值的標(biāo)準(zhǔn)誤差 q1 下四分位數(shù)( 75%) sum 加權(quán)和 qrange 上下四分位數(shù)差( q3q1) std 標(biāo)準(zhǔn)偏差 p1 1%分位數(shù) var 方差 p5 5%分位數(shù) cv 變異系數(shù)的百分?jǐn)?shù) p10 10%分位數(shù) uss 加權(quán)平方和 p90 90%分位數(shù) css 關(guān)于均值偏差的加權(quán)平方和 p95 95%分位數(shù) skewness 對(duì)稱性的度量 —— 偏度 p99 99%分位數(shù) kurtosis 對(duì)尾部陡平的度量 —— 峰度 msign 符號(hào)統(tǒng)計(jì)量 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 24 of 29 sumwgt 權(quán)數(shù)和 probm 大于符號(hào)秩統(tǒng)計(jì)量的絕對(duì)值概率 max 最大值 signrank 符號(hào)秩統(tǒng)計(jì)量 min 最小值 probs 大于中心符號(hào)秩統(tǒng)計(jì)量的絕對(duì)值 p range 極差, max— min normal 檢驗(yàn)正態(tài)性的統(tǒng)計(jì)量 median 中間值 probn 檢驗(yàn)正態(tài)分布假設(shè)的概率值 ( 3) 其他語(yǔ)句。 ? var語(yǔ)句 —— 規(guī)定要求計(jì)算簡(jiǎn)單描述性統(tǒng)計(jì)量的數(shù)值變量的次序。 ? by語(yǔ)句 —— 按 by語(yǔ)句定義的變量進(jìn)行分組計(jì)算其相應(yīng)的簡(jiǎn)單統(tǒng)計(jì)量 ,要求輸入數(shù)據(jù)集已按 by 變量排序。 ? freq 語(yǔ)句 —— 指定一個(gè)數(shù)值型的 freq變量,它的值表示輸入數(shù)據(jù)集中相應(yīng)觀測(cè)出現(xiàn)的頻數(shù)。 ? weight 語(yǔ)句 —— 規(guī)定一個(gè) weight 變量,它的值表示相應(yīng)觀測(cè)的權(quán)數(shù)。 ? id 語(yǔ)句 —— 在輸出數(shù)據(jù)集中增加一個(gè)或 幾個(gè)附加變量,目的在于識(shí)別輸出數(shù)據(jù)集里的觀測(cè)。其值為生成這個(gè)觀測(cè)的輸入數(shù)據(jù)集中相應(yīng)觀測(cè)組里 id 變量具有的最大值。 七、 實(shí)例分析 —— 單變量數(shù)據(jù)的詳細(xì)描述統(tǒng)計(jì)量 例 有 68個(gè)抽樣數(shù)據(jù),現(xiàn)要求計(jì)算此單變量數(shù)據(jù)的描述統(tǒng)計(jì)量,并分析此抽樣數(shù)據(jù)的統(tǒng)計(jì)特征。程序如下: data 。 input x @@。 cards。 。 proc univariate data= plot normal。 var x。 run。 程序說(shuō)明: data步產(chǎn)生一個(gè)單變量的數(shù)據(jù)集 aaa03,共有 68 條觀測(cè)。 univariate 過(guò)程步中各選項(xiàng)的含義是: plot 要求繪制莖葉圖、盒型圖和正態(tài)概率圖; normal 要求對(duì)抽樣數(shù)據(jù)進(jìn)行正態(tài)性檢驗(yàn)。程序提交后 , 輸出分別見(jiàn)表 ( a) (b)( c) 所示。運(yùn)行結(jié)果分析如下面所述。 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 25 of 29 1. Moments:矩或稱動(dòng)差。 見(jiàn)表 (a)所示,輸入數(shù)據(jù)集 68條觀測(cè)( n)中的變量 x 的算術(shù)平均值( mean)為 ,總和( sum)為 ,方差 ( variance)為 ,標(biāo)準(zhǔn)差( std dev)為 ,均值的標(biāo)準(zhǔn)誤差( std mean)為 ,變異系數(shù)( cv)為 %。由于沒(méi)有指定權(quán)數(shù)變量,每一條觀測(cè) x 變量的權(quán)數(shù)默認(rèn)值為 1,因此,權(quán)數(shù)和( sum wgts)為 68,加權(quán)平方和( uss)為 ,均值偏差的加權(quán)平方和( css)為 。這 68個(gè)數(shù)列分布的偏度系數(shù)( skewness)為 ,峰度系數(shù)( kurtosis)為 。 由于 t=, P=,說(shuō)明數(shù)據(jù)并非抽自均值為零的正態(tài)總體。非零觀察的 個(gè)數(shù)( Num ^= 0)為 68,正觀察的個(gè)數(shù)( Num 0)為 68。符號(hào)檢驗(yàn)的統(tǒng)計(jì)量( M(Sign))為 34及檢驗(yàn)概率( Pr=|M|)為 ,拒絕數(shù)據(jù)抽自中位數(shù)為零的總體。符號(hào)秩和檢驗(yàn)統(tǒng)計(jì)量( Sgn Rank)為 1173及檢驗(yàn)概率( Pr=|S|)為 ,同樣拒絕數(shù)據(jù)抽自中位數(shù)為零的總體。因選擇項(xiàng) normal 的要求進(jìn)行正態(tài)性檢驗(yàn), W=, P=,說(shuō)明該數(shù)據(jù)不服從正態(tài)分布。當(dāng) N2020時(shí),使用 ShapiroWilk 統(tǒng)計(jì)量 W計(jì)算;如果 N2020,則為 Kolmogorov 統(tǒng)計(jì)量, SAS系統(tǒng)將采用 D 檢驗(yàn)法進(jìn)行正態(tài)性檢驗(yàn)。 表 (a) proc univariate 過(guò)程輸出的矩、分位數(shù)和極端值 2. Quantiles(def=5):分位數(shù)。 包括四分位數(shù)、百分位數(shù)、極差( range)、四分位數(shù)間距 ( Q3Q1) 、眾數(shù) (mode)。 def=5說(shuō)明從 5 種計(jì)算分位數(shù)的定義中挑選一種為 5(缺省值)。 3. Extremes:極端值。 列出數(shù)據(jù)中最小的 5 個(gè)數(shù)值和最大的 5 個(gè)數(shù)值及其在輸入數(shù)據(jù)集中對(duì)應(yīng)的觀測(cè)順序號(hào)。 4. Stem leaf 和 Boxplot:莖葉圖和盒型圖。 如表 (b)所示,莖葉圖和盒型圖直觀地反映了 68 個(gè)原始數(shù)據(jù)主要集中在 [2, 7]之間。The SAS System Univariate Procedure Variable=X ① Moments
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1