【正文】
如果第二個(gè)調(diào)查僅僅調(diào)查了 50個(gè)人 ,有 35個(gè)人反對(duì)該觀點(diǎn) 。 這樣則可以由此推算出置信度 ( 由后面給出的公式 ) , 反之亦然 。 關(guān)于置信區(qū)間的注意點(diǎn) ? 置信區(qū)間的論述是由區(qū)間和置信度兩部分組成 。 關(guān)于置信區(qū)間的注意點(diǎn) ? 但是把一個(gè)樣本數(shù)據(jù)帶入統(tǒng)計(jì)量的公式所得到的一個(gè)區(qū)間 ,只是這些區(qū)間中的一個(gè) 。 167。 ? (b)求兩個(gè)均值差 ?1?2的點(diǎn)估計(jì)和95%置信區(qū)間 。 ? 如想知道兩個(gè)地區(qū)學(xué)生成績(jī)的差異 , 可以建造兩個(gè)地區(qū)成績(jī)均值之差 ?1 ?2的置信區(qū)間 。 在用天平稱量了商場(chǎng)中的 48包掛面之后 ,得到樣本量為 48的關(guān)于掛面重量( 單位:克 ) 的一個(gè)樣本: 446. 1 D e s c r i p t i v e s (描述統(tǒng)計(jì)量)4 4 9 . 0 1 0 4 . 7 9 4 3 54 4 7 . 4 1 2 44 5 0 . 6 0 8 44 4 8 . 9 5 0 03 0 . 2 8 75 . 5 0 3 3 94 3 9 . 6 04 6 1 . 1 02 1 . 5 08 . 1 8統(tǒng)計(jì)量M e a n (樣本均數(shù))L o w e r B o u n d (下限) U p p e r B o u n d (上限)9 5 % C o n f id e n c e In t e r v a l f o r M e a n(總體均數(shù)的 9 5 % 可信區(qū)間)M e d ia n (中位數(shù))V a r ia n c e (方差)S t d . D e v ia t io n (標(biāo)準(zhǔn)差)M in i m u m (最小值)M a x im u m (最大值)R a n g e (極差)In t e r q u a r t il e R a n g e (四分位數(shù)極差)結(jié)果變量w e ig h t統(tǒng)計(jì)量值 標(biāo)準(zhǔn)誤差用計(jì)算機(jī)可以很容易地得到掛面重量的樣本均值、總體均值的置信區(qū)間等等。 ? 這里的區(qū)間 (93%, 87%)是固定的 ,而總體比例 p也是固定的值 。 ? 顯然置信度的概念又是大量重復(fù)抽樣時(shí)的一個(gè)漸近概念 。 ? 3. 如用類似的方式 , 重復(fù)抽取大量 ( 樣本量相同的 ) 樣本時(shí) , 產(chǎn)生的大量類似區(qū)間中有些會(huì)覆蓋真正的 p, 而有些不會(huì);但其中大約有95%會(huì)覆蓋真正的總體比例 。 這這種說法意味著下面三點(diǎn) 167。 167。我們不想在這里涉及太多此方面的細(xì)節(jié) 。 167。 167。 這些在前面都已經(jīng)介紹過 , 大家也知道如何通過計(jì)算機(jī) ( 或公式 ) 來計(jì)算它們 。 ? 這樣就出現(xiàn)了按照這些標(biāo)準(zhǔn)定義的各種名目的估計(jì)量 ( 如無偏估計(jì)量等 ) 。 點(diǎn)估計(jì) ? 用什么樣的估計(jì)量來估計(jì)參數(shù)呢 ? ? 實(shí)際上沒有硬性限制 。 用估計(jì)量估計(jì)總體參數(shù) ? 這里介紹兩種估計(jì),一種是 點(diǎn)估計(jì) (point estimation),即用估計(jì)量的實(shí)現(xiàn)值來近似相應(yīng)的總體參數(shù)。 ? 樣本的 ( 不包含未知總體參數(shù)的 ) 函數(shù)稱為統(tǒng)計(jì)量;而用于估計(jì)的統(tǒng)計(jì)量稱為 估計(jì)量 (estimator)。 ? 正態(tài)分布族中的成員被 ( 總體 ) 均值和標(biāo)準(zhǔn)差完全確定; ? Bernoulli分布族的成員被概率 ( 或比例 ) p完全決定 。 用估計(jì)量估計(jì)總體參數(shù) ? 人們往往先假定某數(shù)據(jù)來自一個(gè)特定的總體族(比如正態(tài)分布族)。 ? 上面調(diào)查例子是估計(jì)總體參數(shù)(某種意見的比例)的一個(gè)過程。 ? 如果我們想知道北京人認(rèn)可某飲料的比例,人們只有在北京人中進(jìn)行抽樣調(diào)查以得到樣本,并用樣本中認(rèn)可該飲料的比例來估計(jì)真實(shí)的比例。若學(xué)校共有 400名學(xué)生,設(shè)各學(xué)生參加會(huì)議的家長(zhǎng)數(shù)相互獨(dú)立,且服從同一分布。 211., , . . . ,1l im { } 1nninixxPxn? ? ????? ? ??1獨(dú)立同分布大數(shù)定律:若x 符合i . i . d , 存在有限的數(shù)學(xué)期望和方差,對(duì)任意小的正數(shù) ,有獨(dú)立同分布大數(shù)定律:提供了用樣本平均數(shù)估計(jì)總體平均數(shù)的理論依據(jù) 貝努力大數(shù)定律 2.AAl im 1nmnmPpn??????? ? ???? ?貝努力大數(shù)定律:設(shè) 是 次獨(dú)立隨機(jī)試驗(yàn)中事件 發(fā)生的次數(shù),p 是事件 在每次試驗(yàn)中發(fā)生的概率,則對(duì)對(duì)任意小的正數(shù) ,有貝努力大數(shù)定律:提供了用頻率代替概率的理論依據(jù) 中心極限定理 二、中心極限定理:闡述大量隨機(jī)變量之和的極限分布是正態(tài)分布的一系列定理的總稱。 這樣 , 就利用小概率事件來拒絕了藥廠的說法 。 這說明 , 如果藥廠正確 , 那么只有 40名患者有效這個(gè)事實(shí)是個(gè)小概率事件 , 即 “ 少于或等于 40名患者有效 ” 的可能性只有大約十萬分之四 。 用小概率事件進(jìn)行判斷 ? 由于使用了藥廠的 。 ? 這個(gè)數(shù)據(jù)是否支持藥廠的說法呢 ? 藥廠所支持的模型實(shí)際上是一個(gè)參數(shù)為 Bernoulli試驗(yàn)?zāi)P?。 用小概率事件進(jìn)行判斷 ? 判明一個(gè)事情的真?zhèn)?, 需要用事實(shí)說話 。 ? 累積分布函數(shù)概念的引進(jìn) , 對(duì)于查表或使用軟件得到概率 ( 根據(jù)上面兩個(gè)公式 ) 是很方便的 。 累積分布函數(shù) ? 在連續(xù)分布的情況 , 可以用 f(x)表示密度函數(shù) , 則概率 ( 注意在連續(xù)分布中 , 某單獨(dú)點(diǎn)的概率為0, 因此下式中的不等式中的等式可以去掉 ) ( ) ( ) ( ) ( )baP a X b f x d x P X b P X a? ? ? ? ? ? ??167。 F分布 ? F分布變量為兩個(gè) c2分布變量( 在除以它們各自自由度之后 )的比; ? 而兩個(gè) c2分布的自由度則為 F分布的自由度 , 因此 , F分布有兩個(gè)自由度;第一個(gè)自由度等于在分子上的 c2分布的自由度 , 第二個(gè)自由度等于在分母的 c2分布的自由度 。 t分布 ? 通常 用 t?表示 t分布相應(yīng)于右側(cè)尾概率 ?的 t變量的 ?上側(cè)分位數(shù) ,即對(duì)于 t分布變量 T, 有 P(Tt?)=?。 這里的自由度等于樣本量減去 1( 如果樣本量為 n, 剛才定義的 t分布的自由度為 n1) 。 這種分布稱為 t分布 (tdistribution, 或?qū)W生分布 , Student’s t)。 0 2 4 6 8 10c2(2)c2(3)c2(5)自由度為 5的 c2分布密度曲線圖 167。 該分布在一些檢驗(yàn)中會(huì)用到 。 ? 圖 z?= 及 相 應(yīng) 的 尾 概 率( ??) 。 167。如果密度函數(shù)為 f(x), 那么這個(gè)面積為積分 1 . 5 70 . 5 1( ) 0 . 2 4 6 8 2x d xf ??4 3 2 1 0 1 2 3 400 . 0 50 . 10 . 1 50 . 20 . 2 50 . 30 . 3 50 . 4P r o b a b i l i t y B e t w e e n L i m i t s i s 0 . 2 4 6 8 2DensityC r i t i c a l V a l u e標(biāo)準(zhǔn)正態(tài)變量在區(qū)間 (, )中的概率 167。左邊是N(2,)分布,右邊是 N(0, 1)分布 167。 ? 標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)用 f(x)表示 。 ? 一個(gè)正態(tài)分布用 N(?,?)表示;其中 ?為均值 , 而 ?為標(biāo)準(zhǔn)差 。 ? 在一定條件下 , 許多不是正態(tài)分布的樣本均值在樣本量很大時(shí) ,也可用正態(tài)分布來近似 。多數(shù)離 1kg不遠(yuǎn) , 離 1kg越近就越可能出現(xiàn) , 離 1kg越遠(yuǎn)就越不可能 。 ? 對(duì)于連續(xù)變量 , 取某個(gè)特定值的概率都是零 , 而只有變量取值于某個(gè) ( 或若干個(gè) ) 區(qū)間的概率才可能大于 0。 下圖為這樣形成的密度曲線 。 167。 超幾何分布 ? 這是一種所謂的 “ 不放回抽樣 ” ,也就是說 , 一次抽取若干物品 , 每檢查一個(gè)之后并不放回; ? 超幾何分布族的成員被三個(gè)參數(shù)決定 , 這里相應(yīng)于產(chǎn)品總個(gè)數(shù) n, 其中不合格產(chǎn)品數(shù)目 m, 不放回抽樣的數(shù)目 t;而樣本中有 x個(gè)不合格產(chǎn)品的概率為 ( ) , 0 , 1 , . . . ,m n mx t xp x x tnt?? ? ? ?? ? ? ??? ? ? ?????????離散型隨機(jī)變量的數(shù)學(xué)期望和方差 離散型隨機(jī)變量的數(shù)學(xué)期望 (expected value) 1. 離散型隨機(jī)變量 X的所有可能取值 xi與其取相對(duì)應(yīng)的概率 pi乘積之和 2. 描述離散型隨機(jī)變量取值的集中程度 3. 記為 ? 或 E(X) 4. 計(jì)算公式為 取無窮個(gè)值)取有限個(gè)值)XpxXEXpxXEiiiniii()(()(1?????????離散型隨機(jī)變量的方差 (variance) 1. 隨機(jī)變量 X的每一個(gè)取值與期望值的離差平方和的數(shù)學(xué)期望 , 記為 ? 2 或 D(X) 2. 描述離散型隨機(jī)變量取值的分散程度 3. 計(jì)算公式為 4. 方差的平方根稱為標(biāo)準(zhǔn)差 , 記為 ? 或 ?