【正文】
第十八章 判別分析 Discriminant Analysis Content ? Fisher discriminant analysis ? Maximum likelihood method ? Bayes formula discriminant analysis ? Bayes discriminant analysis ? Stepwise discriminant analysis 講述內(nèi)容 第一節(jié) Fisher判別 第二節(jié) 最大似然判別法 第三節(jié) Bayes公式判別法 第四節(jié) Bayes判別 第五節(jié) 逐步判別 第六節(jié) 判別分析中應(yīng)注意的問(wèn)題 ?目的 :作出以多個(gè)判別指標(biāo)判別個(gè)體分類的判別函數(shù)或概率公式。 ?資料 :個(gè)體分兩類或多類,判別指標(biāo)全部為數(shù)值變量或全部為分類變量。 ?用途 :解釋和預(yù)報(bào)(主要用于計(jì)量診斷)。 ?分類 (經(jīng)典): Fisher判別和 Bayes判別。 1. 計(jì)量資料判別分析 。 目的是作出以定量指標(biāo)判別個(gè)體屬性分類或等級(jí)的判別函數(shù) 。 按資料類型分 : 2. 計(jì)數(shù)資料判別分析。目的是作出以定性或等 級(jí)指標(biāo)判別個(gè)體屬性分類或等級(jí)的 概率公式 。 按方法名分 ?1. Fisher判別 ?2. 最大似然判別法 ?3. Bayes公式判別法 ?4. Bayes判別 ?5. 逐步判別 第一節(jié) Fisher判別 適用于指標(biāo)為定量指標(biāo)的兩類判別( 或多類判別 ) 1. Fisher判別的原理 已知 A 、 B 兩類觀察對(duì)象, A 類有An 例,B 類有Bn 例,分別記錄了mXXX ,21? 個(gè)觀察指標(biāo),稱為判別指標(biāo)或變量。 F i s h e r 判別法就是找出一個(gè)線性組合 1 1 2 2 ( 1 8 1 )mmZ C X C X C X? ? ? ?一、兩類判別 F i s h e r 準(zhǔn)則 :使得綜合指標(biāo) Z 在 A 類的均數(shù)AZ 與在 B 類的均數(shù) BZ 的差異ABZZ ? 盡可能大,而兩類內(nèi)綜合指標(biāo) Z 的變異22ABSS ? 盡可能小,即使得 ? 達(dá)到最大。 AB22AB ZZSS???? (1 8 2 )判別系數(shù) C 可通過(guò)對(duì) λ 求導(dǎo),由下列方程組解出 11 1 12 2 1 121 1 22 2 2 21 1 2 2 ( 18 3)mmmmm m mm m mS C S C S C DS C S C S C DS C S C S C D? ? ? ???? ? ? ?????? ? ? ?? 式中( A ) ( B )j j jD X X??,( A ) ( B ),jjXX分別是 A 類和 B 類第 j 個(gè) 指標(biāo)的均數(shù)),2,1( mj ??; ijS是12, , ,mX X X的合并協(xié)方差陣的元素。 ( A ) ( A ) ( A ) ( A ) ( B ) ( B ) ( B ) ( B )AB( )( ) ( ))( ) (18 4 )2i i j j i i j jijX X X X X X X XSnn? ? ? ? ? ? ???? 式中( A ) ( B ) ( A ) ( B ), , , i i j jX X X X分別為 ijXX 和于 A 類和 B 類的觀察值。 2 .判別規(guī)則 建立判別函數(shù)后,按公式( 18 1 )逐例計(jì)算判別函數(shù)值iZ ,進(jìn)一步求iZ 的兩類均數(shù)AZ 、BZ 與總均數(shù) Z ,按下式計(jì)算判別界值 : AB 18 52cZZZ?? () 判別規(guī)則: , A , B 1 8 6 icicicZZZZZZ????????判為 類判為 類 ( ), 判為任意一類 例 181 收集了 22例某病患者的三個(gè)指標(biāo) ( X1, X2, X3) 的資料列于表 181, 其中前期患者 ( A) 類 12例 , 晚期患者 ( B) 類 10例 。 試作判別分析 。 觀察值 類別 編號(hào) X1 X2 X3 Z F i s he r 判別結(jié)果 A 1 23 8 0 0. 19 A A 2 1 9 2 2. 73 A A 3 10 5 0 1. 83 A A 4 7 2 1 0. 28 B A 5 11 3 4 2. 72 A A 6 10 3 1 1. 69 A A 7 25 9 2 0. 91 A A 8 19 12 3 4. 98 A A 9 9 8 2 1. 81 A A 10 25 3 1 1 . 39 A A 11 0 2 2 1. 09 B A 12 10 2 0 0. 25 A B 13 9 5 1 2. 07 B B 14 2 1 1 0. 05 A B 15 17 6 1 2. 22 B B 16 8 2 1 1. 33 B B 17 17 9 1 3. 53 B B 18 0 11 3 3. 43 B B 19 9 20 3 4. 82 B B 20 7 2 3 0. 91 B B 21 9 6 0 1. 98 A B 22 12 0 0 0. 84 B 表 181 22例患者三項(xiàng)指標(biāo)觀察結(jié)果( Zc=) 類別 例數(shù) 1X 2X 3X A 12 - 3 4 - 1 B 10 4 - 5 1 類間均值差jD - 7 9 - 2 表 182 變量的均數(shù)及類間均值差 ( 1) 計(jì)算變量的類均數(shù)及類間均值差 Dj,計(jì)算結(jié)果列于表 182。 ( 2) 計(jì)算合并協(xié)方差矩陣 : 按公式( 184),例如: ])412()42()49[(])310()31()323[(22222211 ??????????????????? ??S 1 7 5 . 3 2 0 . 3 2 . 32 0 . 3 3 8 . 2 5 . 82 . 3 5 . 8 2 . 7?????????????S代入公式 ( 183) 得 ????????????