freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

多元統(tǒng)計分析判別分析講義-wenkub.com

2025-08-06 20:09 本頁面
   

【正文】 它們的用途是在于識別由這些函數攜帶的在分組間進行判別的信息。當這個系數的絕對值很大(接近于 1)時,這個函數表達的信息與這個變量的信息幾 乎相同。非標準化判別系數( unstandardized)也稱粗系數( raw coefficients)?,F依據這些變量作為判別變量對各地區(qū)進行判別分析。 二、 引入和剔除變量所選用的統(tǒng)計量 1.引入變量的檢驗統(tǒng)計量 2.刪除變量的檢驗統(tǒng)計量 3.計算步驟 三、 應用舉 例 第 頁 21 167。 167。 情形二:當 12??? 時,由表中數據可以求得 因此可以得到: 由 K 的計算公式可得: 第 頁 20 利用此準則對原 14個樣本進行回判得 *W(x) 的值見表 。 表 某氣象站預報有無春旱的數據 春旱 無春旱 第 頁 19 序號 1x 2x ()Wx 序號 1x 2x ()Wx 1 1 2 2 3 3 4* 4 5 5 6 6 7 8 注: *代表誤判。 3.應用舉例 表數據是某氣象站預報某地區(qū)有無春旱的觀測資料, 1x 和 2x 是與氣象有關的綜合預報因子。若假定了等先驗概率和等誤判損失,則二者就完全一樣了。通常的作法是利用訓練樣本對總體的概率密度作非參數估計(如最鄰近估計,核估計等)。這只需選擇 1D 為上式中的被積函數取非正值的范圍即可,即取 1D 為 ? ? 121 2 2 1 1 21( ) ( 1 | 2 )| ( 1 | 2 ) ( ) ( 2 | 1 ) ( ) 0 | ( ) ( 2 | 1 )f x q cD x q c f x q c f x x f x q c??? ? ? ? ????? 此時, 12221( ) (1 | 2 )| ( ) ( 2 | 1)f x q cDx f x q c???????? 因此,兩一般總體的 Bayes 判別如下:對給定的樣品 x ,計算兩總體的概率密度函數在 x 處的值,判定準則為 1212112221( ) (1 | 2),( ) ( 2 | 1)( ) (1 | 2),( ) ( 2 | 1)f x q cxGf x q cf x q cxGf x q c? ?????? ????若若 下面給出此判別準 則的幾個特例: ( 1)等先驗概率 的 情形 實際應用中,若各總體的先驗 概率分布未知,一般有兩種處理方法,如果訓練樣本是通過隨機觀測得到的,通常取先驗概率為各個訓練樣本的容量占總觀測數的比例。因此,在一個給定的判別準則 D之下對 iG 而言所造成的損失,應該是誤判為 1 2 1 1, , , , , ,i i kG G G G G??的所有損失,按照各誤判概率加權求和,即在此判別準則下,將來自 iG 的樣品錯判為其它總體的期望損失為(注意 ( | ) 0ci i ? ) 1 , 1( | , ) ( | ) ( | , ) ( | )kki j j i jl P j i D c j i P j i D c j i? ? ???? 又由于各總體 iG 出現的先驗概率為 ( 1,2, , )iq i k? ,故在判別準則 D之下總期 望損失為 1 1 1 ( | ) ( | , )k k ki i ii i jL q l q c j i P j i D? ? ??? ? ? 我們看到,總期望損失 L與判別準則 D有關, Bayes判別即選擇 ? ?12, , , kD D D D? ,使 L達到最小。而這通常在判別分析前就是可以估計的,我們用表 。例如,將一個正品電子元件判為次品,所損失的只是生產廠家(如果這種元件的成本不是很昂貴的話), 但若判為正品而使用在更大的系統(tǒng)中,則有可能造成整個系統(tǒng)的損壞(這種損失往往是很大的)。因此,一個合理的判別準則應該考慮到每個總體出現的可能性的大?。聪闰灨怕史植迹?。 設 12, , , kG G G 為 k 個 p 維總體,分別具有互不相同的 p 維概率密度函數 12( ), ( ), , ( )kf x f x f x。 經理看到,經過二次試驗, 1? (高質量產品可占 90% )的概率已上升到 ,到可以下決心的時候了,他能以 88. 3%的把握保證此項投資能取得較大經濟效益。為此又做了一批試驗,試驗結果(記為 B)如下: B:試制 10個產品,有 9個是高 質量產品。最后由( 2)式可算得 1 1 1( | ) ( | ) ( ) / ( ) 0 . 2 3 6 / 0 . 3 3 7 0 . 7 0 0A P A P A? ? ? ? ?? ? ? 2 2 2( | ) ( | ) ( ) / ( ) 0 . 1 0 1 / 0 . 3 3 7 0 . 3 0 0A P A P A? ? ? ? ?? ? ? 這表明,經理根據試驗 A的信息調整自已的看法,把對 1? 和 2? 的可信度 0. 4和 0. 7和 0. 3。 經理對這次試驗結果很高興.希望用此試驗結果來修改他原先對 1? 和 2? 的看法,即要求后驗概率1( | )A?? 與 2( | )A?? 。但根據下屬二個部門過去建議被采納的情況、經理認為, 1? 的可信程度只有 40%, 2? 的可信程度只有 60%。 5.后驗分布是三種信息的綜合 一般說來,先驗分布 ()??是反映人們在抽樣前對 ? 的認識,后驗分布 ( | )??x 是反映人們在抽樣后對 ?的認識。故基于后驗分布 ( | )??x 對 ? 進行統(tǒng)計推斷是更為有效,也是最合理的。因此能用來對 ? 作出推斷的僅是條件分布 ( | )??x 。 ( 5)我們的任務是要對未知數 ? 作出統(tǒng)計推斷。頻率學派和貝葉斯學派都承認似然函數,他們都認為:在有了樣本觀察值 12( , , , )nx x x?x 后,總體和樣本中所含 ? 的信息都被包含布似然函數 ()L?? 之中,可在使用似然函數作統(tǒng)計推斷時,二派之間存在差異。 ( 2)根據參數 ? 的先驗信息確定先驗分布 ()??。 全概率公式 定義 1:把基本空間 ? 分為 n個事件 12, , , nB B B ,假如: ( 1) ( ) 0, 1, 2, ,iP B i n?? ; ( 2) 12, , , nB B B 之間互不相容; ( 3)1n ii BU? ?? 則稱事件組 12, , , nB B B 為基本空間 ? 的一個分割。最后,貝葉斯學派也經常揭露頻率學派的“客觀性”,總體分布的選擇對答案所產生的影響遠比先驗分布選擇所產生的影響重大的多,而前者恰好也經常是主觀的。這是當前對貝葉斯統(tǒng)計的主要批評。然而 ,實際這種說法經常存在。于是學生們對新教師年齡 (未知量 )的認識 (先驗信息 )可綜合為圖所示的概率分布,這也是學生們對未知量 (新教師年齡 )的概率表述。因為任一未知量都有不確定性,而在表述不確定性程度時,概 率與概率分心是最好的語言。 貝葉斯學派的最基本的觀點是:任一個未知量 ? 都可看作一個隨機變量,應用一個概率分布去描述對 ?的未知狀況。在 Savage(1954)、 Jeffreys(1961)、Good(1950)、 Lindley(1961)、 Box(1973)、 Tiao(1973)、 Berger(1985)等貝葉斯學者的努力下,對貝葉斯方法在觀點、方法和理論上不斷的完善。隨后拉普拉斯等人用貝葉斯提出的方法導出些有意義的結果。貝葉斯學派重視已出現的樣本觀察值,而對尚未發(fā)生的樣本觀察 值不予考慮,貝葉斯學派很重視先驗信息的收集、挖掘和加工,使它數量化,形成先驗分市,參加到統(tǒng)計推斷中來,以提高統(tǒng)計推斷的質雖。使用單位就可以對它作出“免檢產品”的決定,或者每月抽檢一、二次就足夠丁,這就省去了大量的人力與物力。經過一段時間后就積累大量的資料,根據這些歷史資料(先驗信息的一種)對過去產品的不合格率可構造一個分布: ( ) 0 ,1, 2 , ,iiP i nn??? ? ? 這個對先驗信息進行加工獲得的分布稱為先驗分布。被實驗者每次成功概率要比 。對此做了十次試驗.她都正確地說出了。 3.先驗信息 即在抽樣之前有關統(tǒng)計問題的一些信息,一般說來,先驗信息主要來源于經驗和歷史資料。如今統(tǒng)計學教材幾乎全是敘述經典統(tǒng)汁學的理論與方法。人們希望通過對樣本的加工和處理對總體的某些特征作比較為精確的統(tǒng)計推斷,沒有樣本就沒有統(tǒng)計學可言。又如保險費的確定與人的壽命分布密切相關,在保險業(yè)中,人的壽命分布被稱為壽命表,中國人的壽命表人不同于外國人的壽命表,男人的壽命表不同于女 人的壽命表,北方人的壽命表不同于南方人的壽命表,當代人的壽命表與若干年前人的壽命表也是不同的,而要確定這些壽命表是一項耗資費時的工作,至今我國還缺乏此類壽命決。 1.總體信息 即總體分布或總體所屬分布族給我們的信息,譬如,“總體是正態(tài)分布”這一句話就給我們帶來很多信息:它的密度函數是 —— 條鐘形曲線;它的 — 切階矩都存在;有關正態(tài)變量的一些事件的概率可以計算;有正態(tài)分布可以導 出卡方分布、 t 分布和 F 分布等重要分布;還有許多成熟的點估計、區(qū)間估計和假設檢驗方法可供我們選用。 三、 多總體的 Fisher 判別 其討論同前,注意和兩總體判別之間的關系。 ( 2)設置判別準則 有了 判別函數之后,要得到判別準則還要確定臨界值(分界點) 0y ,在兩總體先驗概率相等的假設下,一般常取 0y 為 (1)y 與 (2)y 的加權平均值,即 (1) (2)120 12n y n yy nn?? ? 判別準則: 當 (1) (2)yy? 時,若 0yy? ,則判定 1XG? ;若 0yy? ,則判定 2XG? 當 (1) (2)yy? 時,若 0yy? ,則判定 2XG? ;若 0yy? ,則判定 1XG? 3. 計算步驟 其基本步驟歸納如下: STEP01: 建立判別式; STEP02: 計算臨界值 0y ,設置判別準則; STEP03: 檢驗判別效果 不妨設兩個總體服從正態(tài)分布且具有相同的協差陣。 第一組樣品的重心: (1) (1)1pkkky c x??? 第二組樣品的重心: (2) (2)1pkkky c x??? 組間變差: ? ? ? ? 2( 1 ) ( 2 )12, , , pQ Q c c c y y? ? ? ① 這里給出的是一維 Fisher 判別函數。由于 ()?? 的大小可以衡量判別函數的判別效果,故稱 ()?? 為判別效率。其中 ( ) ( )Y k X k??? , ( ) ( )Y k X k??? 121212( ) ( ) ( )( ) ( ) ( )()( ) ( ) ( )pppx k x k x kx k x k x kXkx k x k x k???????, ? ?ij ppBb??, ? ? ? ?1 ( ) ( )qij i i j jkb x k x x k x? ?? ? ??,11 ()qjjkx x kq ?? ? a b 1x 2x 1x 2x 3x 第 頁 8 因此,可以構造函數 ()() ()BW ??? ?? 選擇適當的 ? 使得 ()?? 達到最大值。 如圖 所示,若判別函數選擇 x?? ,由于三個組的重心在 ? 的投影相距較遠,比較容 易判別待判樣本點屬于哪一個組。 一、 判別原理(基本思想) 設 ( )( )kX k n p? 是來自第 k 類(組)的樣本數據陣, 1,2, ,kq? ,其中的行表示樣本點,列表示變量(值),? ?12( ) ( ), ( ), , ( )px k x k x k x k ?? 。 五、 應用舉例 例 P108。當各總體服從多元正態(tài)分布時,我們可以對各總體的均值向量是否相等進行統(tǒng)計檢驗以確定使用判別分析是否有意義。在 SAS等統(tǒng)計軟件中有專門的計算程序,因此借助計算 機的威力,刀切法還是值得推薦的一種評價判別準則優(yōu)良性的方法。其 基本思想 是每次剔除訓練樣本中的一個樣本,利用其余容量為 121nn??的訓練樣本建立判別準則(或判別函數),再用所建立的判別準則對刪除的那個樣本觀測值作判斷,對訓練樣本中的每個樣本觀測值重復上述步驟,以其誤判的比例 作為誤判概率的估計。 定義貌似誤判率為回歸中判錯樣品的比例,記為 ?? ,即 12 2112?nnnn? ?? ? ?? 在一定程度上反映了某判別準則的誤判率且對任何誤判準則都易于計算。它們也很容易推廣到多個總體的情況。以兩總體為例,一個判別準則的誤判概率即 X 屬于 1G 而判歸 2G 或者相反的概率。 同樣地,若 (1) (2) ( ), , , k? ? ? 和 ? 是未知的,則可以用它們的估計量 ()?i? 和 iS 計算得到 X 到各總體的距離,從而進行判斷。 1.當 (1) ( )k? ? ?? ??時 此時, 由前面的 馬氏距離 定義知: ? ? ? ? ?
點擊復制文檔內容
法律信息相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1