freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多元統(tǒng)計(jì)分析判別分析講義(編輯修改稿)

2025-09-25 20:09 本頁面
 

【文章內(nèi)容簡(jiǎn)介】 以判別它應(yīng)屬于哪一個(gè)總體。 2.判別函數(shù)的導(dǎo)出 ( 1)找到判別式 不妨設(shè)已經(jīng)建立了判別式: 1 1 2 2 ppy c x c x c x? ? ? ?,則可以得到變換后的兩組的重心。 第一組樣品的重心: (1) (1)1pkkky c x??? 第二組樣品的重心: (2) (2)1pkkky c x??? 組間變差: ? ? ? ? 2( 1 ) ( 2 )12, , , pQ Q c c c y y? ? ? ① 這里給出的是一維 Fisher 判別函數(shù)。在有些問題中,僅用一個(gè)線性判別函數(shù)不能很好地區(qū)分各個(gè)類(組)別,可以利用前若干個(gè)特征所對(duì)應(yīng)的單位正交特征向量構(gòu)造 ()mm p? 個(gè)判別函數(shù),并稱為多維判別。 第 頁 9 組內(nèi)變差: ? ? ? ? ? ?12 22( 1 ) ( 1 ) ( 2 ) ( 2 )12 11, , ,nnp i iiiF F c c c y y y y??? ? ? ? ??? 可以構(gòu)造指標(biāo) QI F? 12, , , pc c c的選取原則就是使得 I 極大化 ① 。 11 1 1 1 2 1 12 2 1 2 2 2 211ppp p p p p pc s s s dc s s s dc s s s d?? ? ? ? ? ?? ? ? ? ? ?? ? ? ? ? ??? ? ? ? ? ?? ? ? ? ? ?? ? ? ? ? ?? ? ? ? ? ? 其中, (1) (2)k k kd x x??, ? ? ? ? ? ? ? ?12( 1 ) ( 1 ) ( 1 ) ( 1 ) ( 2 ) ( 2 ) ( 2 ) ( 2 )11nnk l ik k il l ik k il liis x x x x x x x x??? ? ? ? ? ???。 ( 2)設(shè)置判別準(zhǔn)則 有了 判別函數(shù)之后,要得到判別準(zhǔn)則還要確定臨界值(分界點(diǎn)) 0y ,在兩總體先驗(yàn)概率相等的假設(shè)下,一般常取 0y 為 (1)y 與 (2)y 的加權(quán)平均值,即 (1) (2)120 12n y n yy nn?? ? 判別準(zhǔn)則: 當(dāng) (1) (2)yy? 時(shí),若 0yy? ,則判定 1XG? ;若 0yy? ,則判定 2XG? 當(dāng) (1) (2)yy? 時(shí),若 0yy? ,則判定 2XG? ;若 0yy? ,則判定 1XG? 3. 計(jì)算步驟 其基本步驟歸納如下: STEP01: 建立判別式; STEP02: 計(jì)算臨界值 0y ,設(shè)置判別準(zhǔn)則; STEP03: 檢驗(yàn)判別效果 不妨設(shè)兩個(gè)總體服從正態(tài)分布且具有相同的協(xié)差陣。 構(gòu)造原假設(shè)和備擇假設(shè): (1 ) ( 2 )0 1 2:H Ex Ex????? ? ?, 1 1 2:H ??? 構(gòu)造檢驗(yàn)統(tǒng)計(jì)量: ? ?? ? ? ?012 2 121221 ,12 ~Hn n pF T F p n n pn n p? ? ? ?? ? ? ??? 成 立 其中 ? ? ? ? ? ?2 ( 1 ) ( 2 ) 1 ( 1 ) ( 2 )1 2 1 212 1 2 1 22 n n n nT n n X X S X Xn n n n????? ? ? ? ??????? ? ?ij ppSs?? , ? ? ? ? ? ? ? ?( 1 ) ( 1 ) ( 1 ) ( 1 ) ( 2 ) ( 2 ) ( 2 ) ( 2 )11nnij a i i a j j a i i a j jaas x x x x x x x x??? ? ? ? ? ???, ? ?( ) ( ) ( )1 ,i i ipX x x ?? 得出結(jié)論:當(dāng) 0H 被拒絕時(shí),認(rèn)為判別有效;否則,認(rèn)為判別無效。 3.應(yīng)用舉例 ① 利用微積分中求極值的必要條件可求出使 I 達(dá)到最大的12, , , pc c c ,詳細(xì)過程見教材 P117。 1G 2G 0y (2)y (1)y 2G 1G 0y (1)y (2)y 第 頁 10 例 :教材 P121。 三、 多總體的 Fisher 判別 其討論同前,注意和兩總體判別之間的關(guān)系。 第 頁 11 167。 4 貝葉斯( Bayes)判別法 統(tǒng)計(jì)學(xué)中現(xiàn)在有兩個(gè)主要的學(xué)派:頻率學(xué)派與貝葉斯學(xué)派,貝葉斯學(xué)派是在與頻率學(xué)派的爭(zhēng)論中逐步發(fā)展起來的。爭(zhēng)論的問題主要有:未知參數(shù)是否可以看作隨機(jī)變量?事件的概率是否一定要有頻率解釋?概率是否可以用經(jīng)驗(yàn)來確定? 一、 貝葉斯 統(tǒng)計(jì)概述 為了說明二者的異同,簡(jiǎn)單介紹三種信息。 1.總體信息 即總體分布或總體所屬分布族給我們的信息,譬如,“總體是正態(tài)分布”這一句話就給我們帶來很多信息:它的密度函數(shù)是 —— 條鐘形曲線;它的 — 切階矩都存在;有關(guān)正態(tài)變量的一些事件的概率可以計(jì)算;有正態(tài)分布可以導(dǎo) 出卡方分布、 t 分布和 F 分布等重要分布;還有許多成熟的點(diǎn)估計(jì)、區(qū)間估計(jì)和假設(shè)檢驗(yàn)方法可供我們選用。 總體信息是很重要的信息,為了獲取此種信息往往耗資巨大。美國(guó)軍界為了獲得某種新的電子元器件的壽命分布,常常購買成千上萬個(gè)此種元器件,做大量壽命實(shí)驗(yàn)、獲得大量數(shù)據(jù)后才能確認(rèn)其壽命分布是什么。我國(guó)為確認(rèn)國(guó)產(chǎn)軸承壽命分布服從兩參數(shù)威布爾分布前后也花了五年時(shí)間,處理幾干個(gè)數(shù)據(jù)后才定下的。又如保險(xiǎn)費(fèi)的確定與人的壽命分布密切相關(guān),在保險(xiǎn)業(yè)中,人的壽命分布被稱為壽命表,中國(guó)人的壽命表人不同于外國(guó)人的壽命表,男人的壽命表不同于女 人的壽命表,北方人的壽命表不同于南方人的壽命表,當(dāng)代人的壽命表與若干年前人的壽命表也是不同的,而要確定這些壽命表是一項(xiàng)耗資費(fèi)時(shí)的工作,至今我國(guó)還缺乏此類壽命決。確定我國(guó)各類人群的壽命表是我國(guó)統(tǒng)計(jì)工作者的重要任務(wù)。 2.樣本信息 即從總體抽取的樣本給我們提供的信息。這是最“新鮮”的信息,并巳愈多愈好。人們希望通過對(duì)樣本的加工和處理對(duì)總體的某些特征作比較為精確的統(tǒng)計(jì)推斷,沒有樣本就沒有統(tǒng)計(jì)學(xué)可言。 基于上述兩種信息進(jìn)行的統(tǒng)計(jì)推斷被稱為經(jīng)典統(tǒng)計(jì)學(xué),它的基本觀點(diǎn)是把數(shù)據(jù) (樣本 )看成是來自具有一定概率分布的總體,所研 究的對(duì)象是這個(gè)總體,而不局限于數(shù)據(jù)本身。據(jù)現(xiàn)有資料看,這方面最早的工作是高斯 (Gauss, 1777— 1855)和勒讓德 (Legendre, 1752— 1833)的誤差分析、正態(tài)分布和最小二乘法。從十九世紀(jì)末期到二十世紀(jì)上半葉,經(jīng)皮爾遜 (Pearson, 1857— 1936)、費(fèi)歇爾 (Fisher, 1890— 1962)奈曼(Keyman)的等人杰出的工作創(chuàng)立了經(jīng)典統(tǒng)汁學(xué)。如今統(tǒng)計(jì)學(xué)教材幾乎全是敘述經(jīng)典統(tǒng)汁學(xué)的理論與方法。二十世紀(jì)下半葉,經(jīng)典統(tǒng)計(jì)學(xué)在工業(yè)、農(nóng)業(yè)、醫(yī)學(xué)、經(jīng)濟(jì)、管理、軍事等領(lǐng)域里獲得了廣泛的應(yīng)用。這些領(lǐng)域中又不斷提出新的統(tǒng)計(jì)問題,這又促進(jìn)了經(jīng)典統(tǒng)計(jì)學(xué)的發(fā)展,隨著經(jīng)典統(tǒng)計(jì)學(xué)的持續(xù)發(fā)展與廣泛應(yīng)用、它本身的缺陷也逐漸暴露出來,主要集中在:小樣本問題研究上、區(qū)間估計(jì)的解釋上、似然原理的認(rèn)識(shí)上。 除上述兩種信息外,在我們周圍還存在第三種信息 —— 先驗(yàn)信息,它也可用于統(tǒng)計(jì)推斷。 3.先驗(yàn)信息 即在抽樣之前有關(guān)統(tǒng)計(jì)問題的一些信息,一般說來,先驗(yàn)信息主要來源于經(jīng)驗(yàn)和歷史資料。先驗(yàn)信息在日常生活和工作中也經(jīng)??梢?,不少人在自覺地或不自覺地使用它??聪旅娑€(gè)例子。 例 1. 英國(guó)統(tǒng)計(jì)學(xué)家 Savage(1961)曾考察如下二個(gè) 統(tǒng)計(jì)實(shí)驗(yàn): A.一位常飲牛奶加茶的婦女聲稱,她能辨別先倒進(jìn)杯子里的是茶還是牛奶。對(duì)此做了十次試驗(yàn).她都正確地說出了。 B.一位音樂家聲稱,他能從一頁樂譜辨別出是海頓 (Haydn)還是莫扎持 (Mozart)的作品。在這十次試驗(yàn)中,他都能正確辨別。 第 頁 12 在這兩個(gè)統(tǒng)計(jì)試驗(yàn)中,假如認(rèn)為被實(shí)驗(yàn)者是在猜測(cè),每次成功概率為 ,那么十次都猜中的概率為102 ? ? ,這是 — 個(gè)很小的概率,是幾乎不可能發(fā)生的,所以“每次成功概率為 ”的假設(shè)應(yīng)被拒絕。被實(shí)驗(yàn)者每次成功概率要比 。這就不是猜測(cè),而是他們的經(jīng)驗(yàn)在幫了他們的忙。可見經(jīng)驗(yàn) (先驗(yàn)信息的一種 )在推斷中不可忽視,應(yīng)加以利用。 例 2 “免檢產(chǎn)品”是怎樣決定的 ?某廠的產(chǎn)品每天都要抽檢幾件,獲得不合格品率 ? 的估計(jì)。經(jīng)過一段時(shí)間后就積累大量的資料,根據(jù)這些歷史資料(先驗(yàn)信息的一種)對(duì)過去產(chǎn)品的不合格率可構(gòu)造一個(gè)分布: ( ) 0 ,1, 2 , ,iiP i nn??? ? ? 這個(gè)對(duì)先驗(yàn)信息進(jìn)行加工獲得的分布稱為先驗(yàn)分布。這個(gè)先驗(yàn)分布是綜合了該廠過去產(chǎn)品的質(zhì)量情況。如果這個(gè)分布的概率絕 大部分集中在 0?? 附近,那該產(chǎn)品可認(rèn)為足“信得過產(chǎn)品”。假如以后的多次抽檢結(jié)果與歷史資料提供的先驗(yàn)分布是一致的。使用單位就可以對(duì)它作出“免檢產(chǎn)品”的決定,或者每月抽檢一、二次就足夠丁,這就省去了大量的人力與物力??梢姎v史資料在統(tǒng)計(jì)推斷中應(yīng)加以利用。 基于上述三種信息 (總體信息、樣本信息和先驗(yàn)信息 )進(jìn)行的統(tǒng)計(jì)推斷被稱為貝葉斯統(tǒng)計(jì)學(xué),它與經(jīng)典統(tǒng)計(jì)學(xué)的主要差別在于是否利用先驗(yàn)信息。在使用樣本信息上也是有差異的。貝葉斯學(xué)派重視已出現(xiàn)的樣本觀察值,而對(duì)尚未發(fā)生的樣本觀察 值不予考慮,貝葉斯學(xué)派很重視先驗(yàn)信息的收集、挖掘和加工,使它數(shù)量化,形成先驗(yàn)分市,參加到統(tǒng)計(jì)推斷中來,以提高統(tǒng)計(jì)推斷的質(zhì)雖。忽視先驗(yàn)信息的利用,有時(shí)是一種浪費(fèi),有時(shí)還會(huì)導(dǎo)致不合理的結(jié)論。 貝葉斯統(tǒng)計(jì)起源于英國(guó)學(xué)者貝葉斯( Bayes,1702一 1761)死后發(fā)表的一篇論文“論有關(guān)機(jī)遇問題的求解”。在此論文中他提出著名的貝葉斯公式和一種歸納推理方法。隨后拉普拉斯等人用貝葉斯提出的方法導(dǎo)出些有意義的結(jié)果。之后雖有一些研究和應(yīng)用,但由于其理論尚不完整,應(yīng)用中又出現(xiàn) — 些問題,致使貝葉斯方法長(zhǎng)期未被普遍接受。真到二次大 戰(zhàn)后,瓦爾德提出統(tǒng)計(jì)決策函數(shù)論后又引起很多人對(duì)貝葉斯方法研究的興趣。因?yàn)樵谶@個(gè)理論中貝葉斯解被認(rèn)為是一種最優(yōu)決策函數(shù)。在 Savage(1954)、 Jeffreys(1961)、Good(1950)、 Lindley(1961)、 Box(1973)、 Tiao(1973)、 Berger(1985)等貝葉斯學(xué)者的努力下,對(duì)貝葉斯方法在觀點(diǎn)、方法和理論上不斷的完善。另外在這段時(shí)期貝葉斯統(tǒng)計(jì)在工業(yè)、經(jīng)濟(jì)、管理等領(lǐng)域內(nèi)獲得一批無可非議的成功應(yīng)用。貝葉斯統(tǒng)計(jì)的研究論文和著作愈來愈多,國(guó)際會(huì)議也經(jīng)常舉行。如今貝葉斯統(tǒng)計(jì)已趨成 熟,貝葉斯學(xué)派巳發(fā)展成為一個(gè)有影響的統(tǒng)計(jì)學(xué)派,開始打破了經(jīng)典統(tǒng)汁學(xué)一統(tǒng)天下的局面。 貝葉斯學(xué)派的最基本的觀點(diǎn)是:任一個(gè)未知量 ? 都可看作一個(gè)隨機(jī)變量,應(yīng)用一個(gè)概率分布去描述對(duì) ?的未知狀況。這個(gè)概率分布是在抽樣前就有的關(guān)于 ? 的先驗(yàn)信息的概率陳述。這個(gè)概率分布被稱為先驗(yàn)分布。有時(shí)還簡(jiǎn)稱為先驗(yàn) (Prior)。因?yàn)槿我晃粗慷加胁淮_定性,而在表述不確定性程度時(shí),概 率與概率分心是最好的語言。 例 3 學(xué)生估計(jì)一新教師的年齡。依據(jù)學(xué)生們的生活經(jīng)歷,在看了新教師的照片后立即會(huì)有反應(yīng):“新教師的年齡在 20歲到 40歲之間,極有可能在 30歲左右?!币晃唤y(tǒng)計(jì)學(xué)家與學(xué)生們交談,明確這句話中“左右”可理解為 3? 歲,“極有可能”可理解為 90%的把握。于是學(xué)生們對(duì)新教師年齡 (未知量 )的認(rèn)識(shí) (先驗(yàn)信息 )可綜合為圖所示的概率分布,這也是學(xué)生們對(duì)未知量 (新教師年齡 )的概率表述。 這里有二 個(gè)問題需要進(jìn) — 步討論。第一,按圖所示的概率分布我們可談?wù)撐粗?? 位于某個(gè)區(qū)間的概5% 5% 90% 20 ? 25 35 30 40 第 頁 13 率。譬如, ? 位于 37到 43 歲間的概率為 、即 (37 43) ?? ? ? 可這個(gè)概率陳述在經(jīng)典統(tǒng)計(jì)中是不允許的,因?yàn)榻?jīng)典統(tǒng)計(jì)認(rèn)為 ? 是常量,它要么在 37歲列 43歲之間 (概率為 1),要么在這個(gè)區(qū)間之外 (上述事件概率為 0),不應(yīng)有 。然而 ,實(shí)際這種說法經(jīng)常存在。 第二,圖中的概率 ,而是學(xué)生們根據(jù)自己的生活經(jīng)歷的積累對(duì)該事件發(fā)生可能性所給出的信念,這樣給出的概率在貝葉斯統(tǒng)計(jì)中是允許的,并稱為它為主觀概率。它與古典概率和用頻率確定的概率有相同的含義,只要它符合概率的三條公理即可。這 — 點(diǎn)頻率學(xué)派是難以接受的,他們認(rèn)為經(jīng)典統(tǒng)計(jì)學(xué)是用大量重復(fù)試驗(yàn)的頻率來確定概率、是“客觀的”,因此符合科學(xué)的要求,而認(rèn)為貝葉斯統(tǒng)計(jì)是“主觀的”,因比 (至多 )只對(duì)個(gè)人作決策有用。這是當(dāng)前對(duì)貝葉斯統(tǒng)計(jì)的主要批評(píng)。 貝葉斯學(xué)派認(rèn)為引入主觀概率 及由此確定的先驗(yàn)分布至少把概率與統(tǒng)計(jì)的研究與應(yīng)用范圍擴(kuò)大到不能大量重復(fù)的隨機(jī)現(xiàn)象中來。其次,主觀概率的確定不是隨意的,而是要求當(dāng)事人對(duì)所考察的事件有較透徹的了解和豐富的經(jīng)驗(yàn),甚至是這一行的專家,在這個(gè)基礎(chǔ)上確定的主觀概率就能符合實(shí)際。把這樣一些有用的先驗(yàn)信息引入統(tǒng)計(jì)推斷中來只會(huì)有好處,當(dāng)然誤用主觀概率與先驗(yàn)分布的可能性是存在的。最后,貝葉斯學(xué)派也經(jīng)常揭露頻率學(xué)派的“客觀性”,總體分布的選擇對(duì)答案所產(chǎn)生的影響遠(yuǎn)比先驗(yàn)分布選擇所產(chǎn)生的影響重大的多,而前者恰好也經(jīng)常是主觀的。另外評(píng)價(jià)一個(gè)統(tǒng)計(jì)方法好壞的標(biāo)準(zhǔn)上的選擇 ,主觀性也是很大的,都朝著對(duì)自己有利的方向選擇。 G
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1