freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

sas系統(tǒng)和數(shù)據(jù)分析編輯統(tǒng)計(jì)圖形-文庫吧

2025-07-16 17:32 本頁面


【正文】 算,也稱對(duì)數(shù)平均值,兩邊取對(duì)數(shù)有: )/)lg((lg 11 nxG ni i???? () ( 3) 加權(quán)幾何平均 )/)lg((lg 111 ?? ???? ni ini ii fxfG () 幾何均值適用于表達(dá)呈對(duì)數(shù)正態(tài)分布資料的平均水平。也常用于速度、比率等變量的平均。 ( 4) 調(diào)和均值 調(diào)和均值( harmonic mean )用 H 表示,為觀察值的倒數(shù)求平均,然后再取倒數(shù)而得到的平均值,也稱倒數(shù)平均值。調(diào)和平均值有簡單調(diào)和平均值與加權(quán)調(diào)和平均值兩種。簡單調(diào)和平均值為: 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 9 of 29 ??? ni ixnH 1 )/1(/ () 加權(quán)調(diào)和平均值為: ?? ??? ni iini i xffH 11 )/(/ () 調(diào)和均值適用于表達(dá)呈極嚴(yán)重的正偏態(tài)分布資料的平均水平。 ( 5) 中位數(shù) 中位數(shù)( median)用 M 表示,它將總體或樣本的全部觀察值分成兩部分,每部分各有 50%的觀察值,其計(jì)算方法為:先將原始觀察值按由小到大順序排列后,位次處于中間的那個(gè)觀察值為中位數(shù)。觀察值為奇數(shù)時(shí),處于中間的那個(gè)數(shù)為中位數(shù)。偶數(shù)時(shí)處于中間的兩個(gè)數(shù)的均值為中位數(shù)。 中位數(shù)是位置平均值,它不受極端值的影響,在具有個(gè)別極大或極小值的分布數(shù)列中,中位數(shù)比算術(shù)平均值更具有代表性。 ( 6) 眾數(shù) 頻數(shù)最大的變量值稱為眾數(shù)( mode),列為頻數(shù)表的資料,頻數(shù)最大的組的組中值為眾數(shù)。適用于粗略地表示呈單峰分布資料的集中趨勢。當(dāng)數(shù)據(jù)個(gè)數(shù)較少時(shí),眾數(shù)就是出現(xiàn)次數(shù)最多的個(gè)數(shù)據(jù)。 ( 7) 百分位數(shù) 百分位數(shù)( percentile)以 xP 表示,它將總體或樣本的全部觀察值分成兩個(gè)部分,其中有%x 的觀察值小于 xP ,( 100- x ) %個(gè)觀察值大于 xP 。如百分之 25 分位數(shù)或稱第 25 百分位數(shù) 25P ,表示有 25%個(gè)觀察值小于 25P ; 75%個(gè)觀察值大于 25P 。中位數(shù) M 就是百分之 50 分位數(shù) 50P 。 2. 離散程度的指標(biāo) ( 1) 全距 全距( range)也稱極差是一種離散指標(biāo),是最大與最小觀察值之差。用極差反映總體分布的離散程度雖然簡便,但它只從兩端數(shù)值考察,忽略了中間數(shù)據(jù)的變動(dòng)情況,不能說明整體的差異程度,尤其是存在極端值情況下,使用極差往往會(huì)造成錯(cuò)誤的結(jié)論。 ( 2) 標(biāo)準(zhǔn)差與方差 標(biāo)準(zhǔn)差( standard deviation)與方差( variance)是一種常用 的離散指標(biāo),結(jié)合均值能給出正態(tài)分布的特征。標(biāo)準(zhǔn)差的平方為方差,標(biāo)準(zhǔn)差(或方差)越大,表示觀察值的分布越分散;反之,標(biāo)準(zhǔn)差(或方差)越小,表示觀察值的分布越集中。如果標(biāo)準(zhǔn)差為 0,表示這組觀察值都為一個(gè)相同的值。實(shí)際應(yīng)用時(shí)常以均值177。標(biāo)準(zhǔn)差的寫法綜合觀察值的集中和離散特上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 10 of 29 征。 總體的標(biāo)準(zhǔn)差和方差分別以 ? 和 2? 表示,樣本的標(biāo)準(zhǔn)差和方差分別以 s 和 2s 表示,當(dāng)用樣本標(biāo)準(zhǔn)差 s 作為 ? 的估計(jì)值時(shí),有: 1 )(2??? ? n xxs () 其中, n 為樣本含量, 2)(? ?xx 稱為離均差平方和,也可以如下計(jì)算: nxxxx /)()( 222 ??? ??? () 如用頻數(shù)表資料,有: 1)( 2??? ??fxxfs () ( 3) 變異系數(shù) 變異系 數(shù)( coefficient of variantion)是一種離散指標(biāo),簡記為 CV ,它是標(biāo)準(zhǔn)差與均值之比,用百分?jǐn)?shù)表示: %100/ ?? xsCV () 由于 CV 無量度單位,而且消除了原始資料的平均水平的影響,因此常用于比較量度單位不相同的指標(biāo)或者平均水平相差懸殊的指標(biāo)的變異程度。 ( 4) 標(biāo)準(zhǔn)誤差 標(biāo)準(zhǔn)誤差( standard error)是統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。因?yàn)榻y(tǒng)計(jì)量是樣本觀察值的函數(shù),一旦樣本改變, 統(tǒng)計(jì)量的取值也會(huì)隨之改變。為了避免與樣本觀察值的標(biāo)準(zhǔn)差相混淆,在統(tǒng)計(jì)學(xué)上,把反映一群性質(zhì)相同的統(tǒng)計(jì)量離散程度大小的量稱為標(biāo)準(zhǔn)誤差。從理論上來說,只要給出了一個(gè)統(tǒng)計(jì)量,就有其相應(yīng)的標(biāo)準(zhǔn)誤差。在參數(shù)估計(jì)中,用樣本的統(tǒng)計(jì)量去估計(jì)參數(shù)時(shí),統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差越小,表示抽樣誤差小,統(tǒng)計(jì)量較穩(wěn)定,與參數(shù)較接近。 用 xs 、 ps 、 rs 、 cvs 分別表示統(tǒng)計(jì)量 x (樣本均值)、 p (樣本率)、 r (樣本相關(guān)系數(shù))、CV (變異系數(shù))的標(biāo)準(zhǔn)誤差,它們的計(jì)算公式分別為: nssx ? () n pps p )1( ?? () 212??? n rsr () n CVCVs CV 2 )21(22 ?? () 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 11 of 29 ( 5) 四分位數(shù)間距 四分位數(shù)間距( interquartile range)是一種離散指標(biāo),它是第 3 個(gè)四分位數(shù) 3Q 與第 1 個(gè)四分位數(shù) 1Q 之差,即 257513 PP ??? 。 ( 6) 偏度系數(shù) 偏度系數(shù)( skewness) 返回分布的偏斜度 ,簡記為 SKEW。偏斜度反映以平均值為中心的分布的不對(duì)稱程度。正偏斜度表示不對(duì)稱部分的分布更趨向正值。負(fù)偏斜度表示不對(duì)稱部分的分布更趨向負(fù)值。偏斜度的計(jì)算公式 為樣本觀察 值 ix 消除量綱影響的三階中心矩,然后按樣本數(shù) n 進(jìn)行無偏修正, 定義如下 : 3)()2)(1( ? ???? s xxnn nSKE W i () 式中 , s 為樣本的標(biāo)準(zhǔn)差。 ( 7) 峰度系數(shù) 峰度系數(shù)( kurtosis) 返回?cái)?shù)據(jù)集的峰值 ,簡記為 KURT。峰值反映與正態(tài)分布相比某一分布的尖銳度或平坦度。正峰值表示相對(duì)尖銳的分布。負(fù)峰值表示相對(duì)平坦的分布。峰值的計(jì)算 為樣本觀察值 ix 消除量綱影響的四階中心矩減去 3(因?yàn)闃?biāo)準(zhǔn)正態(tài)分布的四階原點(diǎn)矩為3),然后按樣本數(shù) n 進(jìn)行無偏修正, 公式如下: )3)(2( )1(3)()3)(2)(1( )1(24?? ?????? ?? ? nn ns xxnnn nnKU R T i () 式中 , s 為樣本的標(biāo)準(zhǔn)差。 二、 正態(tài)性檢驗(yàn) 用于判斷總體分布是否為正態(tài)分布的檢驗(yàn)稱為正態(tài)性檢驗(yàn)。檢驗(yàn)資料是否服從正態(tài)分布的主要方法有: Wilk- Shapiro(威爾克斯 夏皮羅 )的 W 檢驗(yàn)和 Dagustino的 D 檢驗(yàn)。 0H 原假設(shè)為總體 X 服從正態(tài)分布。 1. 小樣本的 W 檢驗(yàn) 在觀察值為小樣本時(shí), Wilk與 Shapiro提出用如下的 W 統(tǒng)計(jì)量: ? ?? ???????222)()())((xxaaxxaaWiiii () 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 12 of 29 它可以看成是數(shù)對(duì)( ii xa, )相關(guān)系數(shù)的平方,所 以 W 的取值在 0 和 1之間。系數(shù) ia 按標(biāo)準(zhǔn)正態(tài)分布構(gòu)造,均值為 0,標(biāo)準(zhǔn)差為 1,且是對(duì)稱值。不同的樣本數(shù) n 有不同的系列值??梢宰C明,在 0H 原假設(shè)為真時(shí), W 的取值應(yīng)接近于 1。 2. 大樣本的 D 檢驗(yàn) 在觀察值為大樣本時(shí), Dagustino建議用以下的 D 統(tǒng)計(jì)量: ??????223)()2 1(xxnxniDii () 在 0H 原假設(shè)為真時(shí), D 統(tǒng)計(jì)量的標(biāo)準(zhǔn)化后漸近分布為標(biāo)準(zhǔn)正態(tài)分布。 三、 總體均值的估計(jì)和 t 檢驗(yàn) 1. 總體均值的估計(jì) 總體均值用 ? 表示,總體均值的估計(jì)包括點(diǎn)估計(jì)和區(qū)間估計(jì)。點(diǎn)估計(jì)即用樣本均值來估計(jì)總體均值: x??? 。點(diǎn)估計(jì)雖然簡單,但未考慮抽樣誤差。區(qū)間估計(jì)即按一定的概率估計(jì)總體均值在哪個(gè)范圍內(nèi),這個(gè)范圍稱為置信區(qū)間,這個(gè)概率稱為可信度或置信度,用 ??1 表示,常取 95%( ?? )或 99%( ?? ),按此確定的可信區(qū)間分別稱之為 95%或 99%可信區(qū)間。總體均值的區(qū)間估計(jì)因研究的問題和已知條件不同而用不同的方法。主要分成三種情況: ( 1) 正態(tài)總體方差已知 如果總體服從正態(tài)分布 ),( 2??N 且總體的方差 2? 已知,于是樣本的均值分布為: ),(~ 2nNX ?? () 對(duì) X 變量作標(biāo)準(zhǔn)化處理,得到統(tǒng)計(jì)量: )1,0(~/ NnXU ? ??? () 稱為 U 檢驗(yàn)。則總體均值的 ??1 可信區(qū)間為: ),(22 nuXnuX ?? ?? ?? () 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 13 of 29 n/? 是抽樣誤差, nu /2 ?? ?為一定倍數(shù)的抽樣誤差,稱為極限誤差,或誤差范圍。其意義是在給定的置信度的條件下對(duì)總體參數(shù)進(jìn)行區(qū)間估計(jì)所允許的最大誤差。 ( 2) 正態(tài)總體方差未知 實(shí)際上,總體均值 ? 未知而總體方差 2? 已知的情況是不常有的,通常的情況是 ? 和 2?都未知。設(shè)總體服從正態(tài) 分布 ),( 2??N 且總體的方差 2? 未知。在這種情況下,可用樣本標(biāo)準(zhǔn)差 s 來代替總體標(biāo)準(zhǔn)差 ? ,這樣就得到了統(tǒng)計(jì)量: )1(~/ ??? ntnsXt ? () 稱為 t 檢驗(yàn)。則總體均值的 ??1 可信區(qū)間為: ))1(,)1((22 nsntXnsntX ???? ?? () 2. 非正態(tài)總體 在大多數(shù)實(shí)際問題中,不能假定總體服從或近似服從正態(tài)分布。但是,根據(jù)中心極限定理,只要樣本容量 n 足夠大,樣本均值 X 的抽樣分布就近似為正態(tài)分布。若方差 2? 已知(通常根據(jù)歷史資料或經(jīng)驗(yàn)得到),則可用公式( )來計(jì)算總體均值的 ??1 可信區(qū)間。若 2?未知,則用樣本標(biāo) 準(zhǔn)差 s 來代替總體標(biāo)準(zhǔn)差 ? ,總體均值的 ??1 可信區(qū)間為: ),(22 nsuXnsuX ?? ?? () 3. 配對(duì) t 檢驗(yàn) 配對(duì) t 檢驗(yàn)( paried t test)用于配對(duì)試驗(yàn)設(shè)計(jì)( paired design),它是按一些非試驗(yàn)因素條件將受試 對(duì)象配對(duì)對(duì)子,給予每對(duì)中的個(gè)體以不同的處理。配對(duì)的條件一般為年齡、性別、體重等等。其優(yōu)點(diǎn)是在同一對(duì)的試驗(yàn)對(duì)象間取得均衡,從而提高試驗(yàn)效率。有些試驗(yàn)中就同一受試對(duì)象作比較稱為自身對(duì)照,例如,觀察某指標(biāo)不同時(shí)間的變化,或試驗(yàn)前后的變化,也屬于配對(duì)試驗(yàn)。 想要比較配對(duì)試驗(yàn)中兩種處理( ix1 和 ix2 )的效果,或者自身對(duì)照中比較試驗(yàn)前后某指標(biāo)( ix1 和 ix2 ) 的變化??梢韵惹蟪龀蓪?duì)數(shù)據(jù)之差 iii xxd 21 ?? 。在這種試驗(yàn)設(shè)計(jì)的情況下,可以認(rèn)為均值 D 總體服從正態(tài)分布 ),( 2??N 且總體的方差 2? 未知。用樣本 id 標(biāo)準(zhǔn)差 ds 代替總體標(biāo)準(zhǔn)差 ? ,然后使用 t 檢驗(yàn), 檢驗(yàn) id 是否來自均值為 0( 0?? )的總體。因此,配對(duì)上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 14 of 29 t 檢驗(yàn)公式為: )1(~/ ?? ntns Dtd () 4. 成組 t 檢驗(yàn) 當(dāng)按完全隨機(jī)化設(shè)計(jì)的兩個(gè)樣本均值比較時(shí),可用成組 t 檢驗(yàn)( grouped t test),比較的目的是檢驗(yàn)它 們各種所代表的總體是否具有相同的均值,其假設(shè)檢驗(yàn) 210 : ?? ?H ,211 : ?? ?H 。 設(shè)總體 ),(~ 2111 ??NX , ),(~ 2222 ??NX ,如果 21? 和 22? 都已知,則 ),(~2221212121 nnNXX ???? ??? () 經(jīng)標(biāo)準(zhǔn)化變換: )1,0(~)()(2221212121 NnnXXU????????? () 如果 21? 和 22? 都未知,但方差相等 22221 ??? ?? ,其中 ? 未知需要估計(jì)。由于 21s 和22s 都是 2? 的無偏估計(jì),集中了各自樣本中有關(guān) 2? 的信息,故可以使用合并方差估計(jì)法( Pooled Variance Estimate),有: 2 )1()1(2 )()( 21222211212222112?? ?????? ???? ? ? nn snsnnn xxxxs p () 然后,用樣本合并標(biāo)準(zhǔn)差 ps 來代替 U 中的總體標(biāo)準(zhǔn)差 ? ,這樣就得到了統(tǒng)計(jì)量: )2(~11 )()( 21212121 ??????? nntnnsXXtp?? () 如果在 21? 和 22? 都未知的一般場合,即 2221 ?? ? 。當(dāng) 21? 和 22? 分別使用各自方差估計(jì)法( Separate Variance Estimate),即分別使用其相合估計(jì) 21s 和 22s 代替后,有: )(~)()(2221212121* ltnsnsXXt????? ?? () 上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系 IS/SHUFE Page 15 of 29 這時(shí), *t 就不再服從 )1,0(N 分布了,其形式 很像 t 統(tǒng)計(jì)量。 近似 *t 統(tǒng)計(jì)量概率水平的 Chchran 和 Cox近似是如下統(tǒng)計(jì)量的 p 值: 2221212222
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1