【正文】
為樣本的第稱由小到大排序,并記為的樣本的實(shí)現(xiàn),如將是抽自總體設(shè)???例 ???????????????????????35513440)(355,351,351,347,34435134435534735155)5()4()3()2()1(xxxxxxFxxxxx所以,經(jīng)驗(yàn)分布函數(shù)為分別為解:次序統(tǒng)計(jì)量的實(shí)現(xiàn)樣本求經(jīng)驗(yàn)分布函數(shù)。 ) / n ] . ? SPSS : Gr a ph s ? Q Q P l o t s . ? P r obab i l it y P r obab il it y P l ot s ( 概率圖 ) ① 概率 圖的定義: T h e pr o b a bi li t y p l o t i s a gr a phi c a l t e c hni que f o r a s s e s s i ng w h e t h e r o r n ot a da t a s e t f o l l o ws a gi ve n d i s t r i b ut i o n s uc h a s t h e n o r m a l o r W e i b u ll . T h e pr o b a bil i t y p l o t i s f o r m e d by : ? Ve r t i c a l a xi s : Or de r e d r e s po n s e v a l ue s ; ? Ho r i z o n t a l a xi s : Or de r s t a t i s t i c m e d i a ns f o r t h e g i v e n d i s t r i b ut i o n 。 ? De t e c t o u t l i e r . ③ 箱式 圖解釋 ④ 箱式 圖的 實(shí)現(xiàn) : ? C alc u late th e m ed ian an d th e q u ar til es ( th e lo we r q u ar tile is th e 2 5 th p er ce n tile an d th e u p p er q u ar tile is th e 7 5 th p er ce n tile) ; ? P lo t a s y m b o l at th e m ed ian ( o r d r aw a lin e) an d d r aw a b o x ( h en ce th e n am e b o x p lo t) b etw ee n th e lo we r an d u p p er q u ar tiles。 以例說(shuō)明枝葉圖的做法: 名應(yīng)聘人員的得分,下面是為行能力測(cè)試,測(cè)試滿分設(shè)某公司對(duì)應(yīng)聘人員進(jìn)50150例 64 67 70 72 74 76 76 79 80 81 82 82 83 85 86 88 91 91 92 93 93 93 95 95 95 97 97 99 100 100 102 104 106 106 107 108 108 112 112 114 116 118 119 119 122 123 125 126 128 133 試作枝葉圖 解:將數(shù)據(jù)的百位和十位作枝,個(gè)位 作葉,用豎線將枝葉分開,形成圖。 ? S pr e a d ( i . e . , t h e s c a l e ) o f t h e da t a 。 4. 計(jì)算出各組頻數(shù),作頻數(shù)、頻率分布表 。 ? P r e s e nc e o f m u l t i p l e m o de s i n t h e da t a . ③ 直方圖解釋 Normal Symmetric, NonNormal, ShortTailed Bimodal Mixture of 2 Normals Skewed (NonSymmetric) Right Symmetric and Bimodal Symmetric with Outlier ④ 直方圖 的實(shí)現(xiàn) ? 確定數(shù)據(jù)最小值與最大值,計(jì)算級(jí)差 ? ? ? ?ii xxR m i nm a x ??; ? 確定分組數(shù),組距 nRd /? ,各組上下限 ? ? ? ?)m i n,)1([ m i n kdxdkx ii ???; ? 統(tǒng)計(jì)各組數(shù)據(jù)的頻數(shù),計(jì)算頻率kf; ? 以頻率為縱坐標(biāo),數(shù)據(jù)為橫坐標(biāo)作圖。 ? P r obab i l it y P r obab il it y P l ot s ( 概率圖 ) ? S c at t e r P l ot s( 散點(diǎn)圖 ). 2. 探索性數(shù)據(jù)分析 圖技術(shù) 作用與實(shí)現(xiàn) ? His t ogr am s ( 直方圖 ) ① 直方圖的定義: T he m o s t c o m m o n f o r m o f th e hi s t o gr a m i s o b t a i n e d by s p l i t t i n g t h e r a n ge o f t h e da t a i n t o e qua l s i z e d bi ns ( c a l led c l a s s e s ) . T h e n f o r e a c h bi n , t h e n u m be r o f po i n t s f r o m t h e da t a s e t t h a t f a l l i n t o e a c h bi n a r e c o un t e d. T h a t i s ? Ve r t i c a l a xi s : F r e que n c y ( i . e . , c o un t s f o r e a c h bi n ) ? Ho r i z o n t a l a xi s : R e s po ns e v a r i a bl e ②直方圖的作用 : Gr a phi c a ll y s u mm a r i z e t h e d i s t r i b ut i o n o f a u ni va r i a t e da t a s e t ,s h o ws t h e f o l l o w i n g: ? C e n t e r ( i . e . , t h e l o c a t i o n ) o f t h e da t a 。 ? De t e r m in e opt im al f a c t or s e t t in gs . 二、探索性數(shù)據(jù)分析常用 圖技術(shù)及其實(shí)現(xiàn) 1. 探索性數(shù)據(jù)分析常用圖技術(shù) ? His t ogr am s ( 直方圖 ) 。 ? E x t r ac t im p o r t ant var iab l e s 。,(,)2()2(),。說(shuō)明則有令解:因?yàn)闉槌浞纸y(tǒng)計(jì)量。證明其為充分統(tǒng)計(jì)量為樣本,令,設(shè)總體例題計(jì)量。有 抽 樣: 分 布 定 理解 知222222222 1 )~ ( , ) ~ ( 1 )~ ( 1 ) 1 ) 11/ 1 ) 11~ ( 1 ) ./nSX N n X SnXntnnSnXXnTSn nSnXT t nSn??????????????????????(與 相 互 獨(dú) 立從 而(又 由 于(所 以 有(1.)~ ( , )3 ~ ( , ).~5. 6( , ( 1 ) )( 1 )~ ( , )nnnpXnm p pm W W N pnnm B n pD e M oiv re L ap l ac em N np np pppW N pn? ? ?? ? ?? ? ?????設(shè) 總 體 頻 率 為 , 以 重 復(fù) 抽 樣 方 式 自 總 體 抽 取樣 本 容 量 為 的 樣 本 , 其 中 具 有 某 特 點(diǎn) 的 樣 本 單 元 數(shù) 為, 令 , 證 明證 明 : 有 抽 樣 分 布 定 理 有 ,于 是 , 由 定 理 有所 以 有例充分統(tǒng)計(jì)量 樣本 ),(21 nXXX ?統(tǒng)計(jì)量 ),(21 nXXXT ?加工信息 樣本分布 )。1(~)1()2()。例 0. 05 0. 051 0. 950. 05( 3 , 9) ( 3 , 9) ( 3 , 9) 1( 3 , 9) ( 3 , 9)( 9 , 3 )1 5F F FFFF?????????查 表 得解 :抽樣分布 ? 抽樣分布 (Sampling Distribution ) 1. D e f 統(tǒng) 計(jì) 量 的 分 布 稱 為 抽 樣 分 布 。121212( , )( , )58 ( , ) F F n nF n n FFF n n?????分 布 上 側(cè) 分 位 數(shù) 的 概 率 意 義如 圖 所 示 , 可 以 通 過(guò) 查 分 布上 側(cè) 分 位 數(shù) 表 求 得 。 Snedcor于 1934年 給出概率密度函數(shù)。 x( 。 ) ( 1 )()2nnxf x n x Rn nn ?????? ? ??10( ) 0txx e t d t x????? ? ??其 中 , 稱 為 伽 瑪 函 數(shù) 。分 布 上 側(cè) 分 位 數(shù)分 布 上 側(cè) 分 位 數(shù) 的 概 率 意 義如 圖 所 示 , 可 以 通 過(guò) 查 分 布上 側(cè) 分 位 數(shù) 表 求 得 。理論推導(dǎo)可得概率密度函數(shù)為 122210( 。? ?? ?? ?? ?1111211 2 1 2111( 1 ) 0 , 1, , ,( 1 ) 0 , 1 1 , 2 , ,( , , , ) ( , , , )( 1 )( 1 )iiiinniiiixxnxxi i innniiinxxix n xX P X x p p xx x x i i dP X x p p x i nP X X X x x xP X xpppp????????? ? ? ?? ? ? ? ????????????總 體 的 概 率 函 數(shù) 為設(shè) 樣 本 任 意 一 組 實(shí) 現(xiàn) 為 , 由 于 樣 本 為所 以于 是 , 樣 本 分 布 的 概 率 函 數(shù) 為解 :例 12~ ( ) , , , nX e X X X X iid?設(shè) 總 體 , 是 抽 自 總 體 的樣 本 , 求 樣 本 分 布 。但當(dāng)總量 N很大時(shí), 可近似看成 是簡(jiǎn)單隨機(jī)抽樣。樣本 12, , , nX X X樣本實(shí)現(xiàn) 12, , , nx x x抽定 ? 樣本 應(yīng)滿足的性質(zhì) (1) 代表性; (2) 隨機(jī)性。樣本與統(tǒng)計(jì)量 一、樣本 ? 樣本 (Sample) Def 按一定規(guī)則從總體中抽取一部分總體單元進(jìn)行觀測(cè)或試驗(yàn),這一抽取過(guò)程稱為“抽樣”,所抽取的部分總體單元的整體