freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析總體均值的估計(jì)-展示頁(yè)

2024-09-02 20:41本頁(yè)面
  

【正文】 ,位次處于中間的那個(gè)觀(guān)察值為中位數(shù)。調(diào)和平均值有簡(jiǎn)單 調(diào)和平均值與加權(quán)調(diào)和平均值兩種。也常用于速度、比率等變量的平均。根據(jù)資料是否分組,也分為簡(jiǎn)單幾何平均和加權(quán)幾何平均兩種方法。簡(jiǎn)單算術(shù)平均為: nxx ni i /)( 1??? () 加權(quán)算術(shù)平均為: ?? ??? ni ini ii ffxx 11 /)( () 算術(shù)平均值有兩個(gè)重要的數(shù)學(xué)性質(zhì): ① 各個(gè)變量值與平均值離差之和等于零, ② 各個(gè)變量值與平均值的離差平方之和為最小值。 1. 集中位置的指標(biāo) ( 1) 算術(shù)平均值 算術(shù)平均值( arithmetic mean)簡(jiǎn)稱(chēng)為均值( mean),總體均值用希臘字母 ? 表示,樣本均值用 x 表示。 設(shè)原始觀(guān)察值為 nxxx , 21 ? ,第 i 組頻數(shù)記為 if ,組中值記為 ix 。計(jì)量資料的統(tǒng)計(jì)指標(biāo)分成兩大類(lèi): ? 表達(dá)計(jì)量 資料集中位置的指標(biāo),用以描述觀(guān)察值的平均水平,如算術(shù)均值、幾何均值、調(diào)和均值、中位數(shù)、眾數(shù)、百分位數(shù)。fca48c22ad1925ee3c7b5a972c278094 SAS 系統(tǒng)和數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 1 of 55 第二十四課 總體均值的估計(jì) 對(duì)于樣本來(lái)自正態(tài)總體和方差齊性的基本假設(shè),根據(jù)觀(guān)察結(jié)果(結(jié)果變量或反映變量)的水平數(shù),一元時(shí)基本的分析方法有 U 檢驗(yàn)、 t 檢驗(yàn),多元時(shí)用多元檢驗(yàn)( 2T 或 Wilks’∧檢驗(yàn))。 一、 計(jì)量資料的統(tǒng)計(jì)指標(biāo) 測(cè)定每個(gè)觀(guān)察單位某項(xiàng)指標(biāo)值的大小,所得的資料稱(chēng)為計(jì)量資料( measurement data)又稱(chēng)測(cè)量資料,這類(lèi)資料一般具有計(jì)量單位。 ? 表達(dá)計(jì)量資料變異的指標(biāo),又稱(chēng)離散指標(biāo),用以描述觀(guān)察值間參差不齊的程度,即離散度或稱(chēng)變異度,如全距、標(biāo)準(zhǔn)差、方差、標(biāo)準(zhǔn)誤差、變異系數(shù)、四分位數(shù)間距等。在不發(fā)生混淆的場(chǎng)合,有時(shí)將下標(biāo)省 略,如 ??ni ix1,有時(shí)簡(jiǎn)記為 ?x 。算術(shù)平均值的具體計(jì)算方法分為簡(jiǎn)單算術(shù)平均和加權(quán)算術(shù)平均兩種。 ( 2) 幾何均值 fca48c22ad1925ee3c7b5a972c278094 SAS 系統(tǒng)和數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 2 of 55 幾何均值( geometric mean)用 G 表示,為觀(guān)察值的總乘積開(kāi) n 次方根。簡(jiǎn)單幾何平均為: nni ixG/11 )(??? () 為避免溢出及方便計(jì)算,常用對(duì)數(shù)計(jì)算,也稱(chēng)對(duì)數(shù)平均值,兩邊取對(duì)數(shù)有: )/)lg((lg 11 nxG ni i???? () ( 3) 加權(quán)幾何平均 )/)lg((lg 111 ?? ???? ni ini ii fxfG () 幾何均值適用于表達(dá)呈對(duì)數(shù)正態(tài)分布資料的平均水平。 ( 4) 調(diào)和均值 調(diào)和均值( harmonic mean )用 H 表示,為觀(guān)察值的倒數(shù)求平均,然后再取倒數(shù)而得到的平均值,也稱(chēng)倒數(shù)平均值。簡(jiǎn)單調(diào)和平均值為: ??? ni ixnH 1 )/1(/ () 加權(quán)調(diào)和平均值為: ?? ??? ni iini i xffH 11 )/(/ () 調(diào)和均值適用于表達(dá)呈極嚴(yán)重的正偏態(tài)分布資料的平均水平。觀(guān)察值為奇數(shù)時(shí),處于中間 的那個(gè)數(shù)為中位數(shù)。 中位數(shù)是位置平均值,它不受極端值的影響,在具有個(gè)別極大或極小值的分布數(shù)列中,中位數(shù)比算術(shù)平均值更具有代表性。適用于粗略地表示呈單峰分布資料的集中趨勢(shì)。 ( 7) 百分位數(shù) fca48c22ad1925ee3c7b5a972c278094 SAS 系統(tǒng)和數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 3 of 55 百分位數(shù)( percentile)以 xP 表示,它將總體或樣本的全部觀(guān)察值分成兩個(gè)部分,其中有%x 的 觀(guān)察值小于 xP ,( 100- x ) %個(gè)觀(guān)察值大于 xP 。中位數(shù) M 就是百分之 50 分位數(shù) 50P 。用極差反映總體分布的離散程度雖然簡(jiǎn)便,但它只從兩端數(shù)值考察,忽略了中間數(shù)據(jù)的變動(dòng)情況,不能說(shuō)明整體的差異程度,尤其是存在極端值情況下,使用極差往往會(huì)造成錯(cuò)誤的結(jié)論。標(biāo)準(zhǔn)差的平方為方差,標(biāo)準(zhǔn)差(或方差)越大,表示觀(guān)察值的分布越分散;反之,標(biāo)準(zhǔn)差(或 方差)越小,表示觀(guān)察值的分布越集中。實(shí)際應(yīng)用時(shí)常以均值177。 總體的標(biāo)準(zhǔn)差和方差分別以 ? 和 2? 表示,樣本的標(biāo)準(zhǔn)差和方差分別以 s 和 2s 表示,當(dāng)用樣本標(biāo)準(zhǔn)差 s 作為 ? 的估計(jì)值 時(shí),有: 1 )(2??? ? n xxs () 其中 , n 為樣本含量, 2)(? ?xx 稱(chēng)為離均差平方和,也可以如下計(jì)算: nxxxx /)()( 222 ??? ??? () 如用頻數(shù)表資料,有: 1)( 2??? ??fxxfs () ( 3) 變異系數(shù) 變異系數(shù)( coefficient of variantion)是一種離散指標(biāo),簡(jiǎn)記為 CV ,它是標(biāo)準(zhǔn)差與均值之比,用百分?jǐn)?shù)表示: %100/ ?? xsCV () 由于 CV 無(wú)量度單位,而且消除了原始資料的平均水平的影響,因此常用于比較量度單位不相同的指標(biāo)或者平均水平相差懸殊的指標(biāo)的變異程度。因?yàn)榻y(tǒng)計(jì)量是樣本觀(guān)察值的函數(shù),一旦樣本改變,統(tǒng)計(jì)量的取值也會(huì)隨之改變。從理論上來(lái)說(shuō),只要給出了一個(gè)統(tǒng)計(jì)量,就有其相應(yīng)的標(biāo)準(zhǔn)誤差。 用 xs 、 ps 、 rs 、 cvs 分別表示統(tǒng)計(jì)量 x (樣本均值)、 p (樣本率)、 r (樣本相關(guān)系數(shù))、CV (變異系數(shù))的標(biāo)準(zhǔn)誤差,它們的計(jì)算公式分別為: nssx ? () n pps p )1( ?? () 212??? n rsr () n CVCVs CV 2 )21(22 ?? () ( 5) 四分位數(shù)間距 四分位數(shù)間距( interquartile range)是一種離散指標(biāo),它是第 3 個(gè)四分位數(shù) 3Q 與第 1 個(gè)四分位數(shù) 1Q 之差,即 257513 PP ??? 。偏斜度反映以平均值為中心的分布的不對(duì)稱(chēng)程度。負(fù)偏斜度表示不對(duì)稱(chēng)部分的分布更趨向負(fù)值。 ( 7) 峰度系數(shù) 峰度系數(shù)( kurtosis) 返回?cái)?shù)據(jù)集的峰值 ,簡(jiǎn)記為 KURT。正峰值表示相對(duì)尖銳的分布。峰值的計(jì)算 為樣本觀(guān)察值 ix 消除量綱影響的四階中心矩減去 3(因?yàn)闃?biāo)準(zhǔn)正態(tài)分布的四階原點(diǎn)矩為3),然后按樣本數(shù) n 進(jìn)行無(wú)偏修正, 公式如下: )3)(2( )1(3)()3)(2)(1( )1(24?? ?????? ?? ? nn ns xxnnn nnK U R T i () 式中 , s 為樣本的標(biāo)準(zhǔn)差。檢驗(yàn)資料是否服從正態(tài)分布的主要方法有: Wilk- Shapiro(威爾克斯 夏皮羅 )的 W 檢驗(yàn)和 Dagustino的 D 檢驗(yàn)。 1. 小樣本的 W 檢驗(yàn) 在觀(guān)察值為小樣本時(shí), Wilk與 Shapiro提出用如下的 W 統(tǒng)計(jì)量: ? ?? ???????222)()())((xxaaxxaaWiiii () 它可以看成是數(shù)對(duì)( ii xa, )相關(guān)系數(shù)的平方,所以 W 的取值在 0和 1 之間。不同的樣本數(shù) n 有不同的系列值。 2. 大樣本的 D 檢驗(yàn) 在觀(guān)察值為大樣本時(shí), Dagustino建議用以下的 D 統(tǒng)計(jì)量: ??????223)()2 1(xxnxniDii () 在 0H 原假設(shè)為真時(shí), D 統(tǒng)計(jì)量的標(biāo)準(zhǔn)化后漸近分布為標(biāo)準(zhǔn)正態(tài)分布。點(diǎn)估計(jì)即用樣本均值來(lái)估計(jì)總體均值: x??? 。區(qū)間估計(jì)即按一定的概率估計(jì)總體均值在哪個(gè)范圍內(nèi),這個(gè)范圍稱(chēng)為置信區(qū)間,這個(gè)概率稱(chēng)為可 信度或置信度,用 ??1 表示,常取 95%( ?? )或 99%( ?? ),按此確定的可信區(qū)間分別稱(chēng)之為 95%或 99%可信區(qū)間。主要分成三種情況: ( 1) 正態(tài)總體方差已知 如果總體服從正態(tài)分布 ),( 2??N 且總體的方差 2? 已知,于是樣本的均值分布為: ),(~ 2nNX ?? () 對(duì) X 變量作標(biāo)準(zhǔn)化處理,得 到 統(tǒng)計(jì)量 : )1,0(~/ NnXU ? ??? () 稱(chēng)為 U 檢驗(yàn)。其意義是在給定的置信度的條件下對(duì)總體參數(shù)進(jìn)行區(qū)間估計(jì)所允許的最大誤差。設(shè)總體服從正態(tài)分布 ),( 2??N 且總體的方差 2? 未知。則總體均值的 ??1 可信區(qū)間為: fca48c22ad1925ee3c7b5a972c278094 SAS 系統(tǒng)和數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 7 of 55 ))1(,)1((22 nsntXnsntX ???? ?? () 2. 非正態(tài)總體 在大多數(shù)實(shí)際問(wèn)題中,不能假定總體服從或近似服從正態(tài)分布。若方差 2? 已知(通常根據(jù)歷史資料或經(jīng)驗(yàn)得到),則可用公式 ( ) 來(lái)計(jì)算總體均值的 ??1 可信區(qū)間。配對(duì)的條件一般為年齡、性別、體重等等。有些試驗(yàn)中就同一受試對(duì)象作比較稱(chēng)為自身對(duì)照,例如 , 觀(guān)察某指標(biāo)不同時(shí)間的變化,或試驗(yàn)前后的變化,也屬于配對(duì)試驗(yàn)。可以先求出成對(duì)數(shù)據(jù)之差 iii xxd 21 ?? 。用樣本 id 標(biāo)準(zhǔn)差 ds 代替總體標(biāo)準(zhǔn)差 ? ,然后使用 t 檢驗(yàn),檢驗(yàn) id 是否來(lái)自均值為 0( 0?? )的總體。 fca48c22ad1925ee3c7b5a972c278094 SAS 系統(tǒng)和數(shù)據(jù)分析 電子商務(wù)系列 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 8 of 55 設(shè)總體 ),(~ 2111 ??NX , ),(~ 2222 ??NX ,如果 21? 和 22? 都已知,則 ),(~2221212121 nnNXX ???? ??? () 經(jīng)標(biāo)準(zhǔn)化變換 : )1,0(~)()(2221212121 NnnXXU????????? () 如果 21? 和 22? 都未知,但方差相等 22221 ??? ?? ,其中 ? 未知需要估計(jì)。當(dāng) 21? 和 22? 分別使用 各自方差估計(jì)法( Separate Variance Estimate),即分別使用其相合估計(jì) 21s 和 22s 代替后,有 : )(~)()(2221212121* ltnsnsXXt????? ?? () 這時(shí) , *t 就不再服從 )1,0(N 分布了,其形式很 像 t 統(tǒng)計(jì)量。一般地, Chchran 和 Cox檢驗(yàn)趨于保守。 當(dāng)樣本數(shù) 1n 和 2n 較大時(shí),式中的 l 值也將隨之而增大,我們知道,當(dāng) 30?l 時(shí),自由度為 l 的 t 分布就很接近于正態(tài)分布 )1,0(N ,故在 1n 和 2n 較大時(shí),我們將認(rèn)為 *t 統(tǒng)計(jì)量服從)1,0(N 分布。 設(shè)從正態(tài)總體 ),(~ 2111 ??NX 中獲得的 1n 個(gè)樣本均值為 1X ,樣本無(wú)偏方差為 21s ,從另一正態(tài)總體 ),(~ 2222 ??NX 中獲得的 2n 個(gè)樣本均值為 2X ,樣本無(wú)偏方差為 22s ,且兩個(gè)樣本獨(dú)立?,F(xiàn)在要檢驗(yàn)的原假設(shè)是 22210 : ?? ?H ,備擇假設(shè)是21211 : ?? ?H 。實(shí)際計(jì)算 F 值時(shí)常用:較大的樣本方差 /較小的樣本方差,所以 ,拒絕區(qū)域只要看 )1,1(2121 ??? ? nnFF ?。如檢查試驗(yàn)的本身,尋找原因 給 出可能的解釋?zhuān)换蜃髯兞恐脫Q;或用非參數(shù)統(tǒng)計(jì)分析方法;或用 *t 檢驗(yàn)。樣本容量相等,假設(shè)為 nnnn r ???? ?21 ,常用的有兩種檢驗(yàn)方法:最大 F 檢驗(yàn)( Hartley(哈特利 )檢驗(yàn))和最大方差檢驗(yàn)( Cochran(卡克倫 )檢驗(yàn))。它是從廣義似然比導(dǎo)出。這些過(guò)程可完成單變量或多變量的描述統(tǒng)計(jì)量計(jì)算。 1. Means 過(guò)程的語(yǔ)句格式 Means 過(guò)程的主要控制語(yǔ)句如下: proc means 輸入數(shù)據(jù)集名 選項(xiàng)列表 。 class 變量列表 。 freq 變量 。 id 變量列表 。 run 。 ( 1) 例 vardef
點(diǎn)擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1