【正文】
決策面是兩類別均值連線的垂直平分面 m1 m2 x g(x)=0 x 44 分段線性距離分類器 ?分段線性距離分類器 :將各類別劃分成相對密集的 子類 ,每個子類以它們的均值作為代表點,然后按最小距離分類 45 基于距離的分段線性判別函數(shù) ?判別函數(shù)定義 : ωi有 li個子類,即屬于 ωi 的決策域 Ri分成 li個子域 Ri1, Ri2,… , Rili),每個子區(qū)域用均值 mik作為代表點 1 , . . . ,( ) m inx x m???ikiiklg?判別規(guī)則 : 1 , .. .,a r gm in ( )x?? iicjg1 , . . . ,i f ( ) m i n ( ) t h e n x x x ????j i jicgg46 分段線性判別函數(shù) ?分段線性判別函數(shù)的形式 : gik(x)表示第 i類第 k段線性判別函數(shù), li為 i類所具有的判別函數(shù)個數(shù), wik與 wi0k分別是第 k段的權(quán)向量與閾值 ()0( ) , 1 , 2 , . . . , 。如欲采用 廣義線性方程 求解,試問其 廣義樣本向量 與 廣義權(quán)向量 的表達式,其維數(shù)是多少? 答: 設該二次曲面方程為 : 2 2 21 2 3 1 2 1 3 2 3 1 2 3 0a x b x c x d x x e x x f x x g x h x l x m? ? ? ? ? ? ? ? ? ?( , , , , , , , , , ) Ta b c d e f g h l m?a2 2 21 2 3 1 2 1 3 2 3 1 2 3( , , , , , , , , ,1 , ) Tx x x x x x x x x x x x?y二次 曲面 廣義 權(quán)向量 廣義樣本向量 維數(shù)為 10 ( ) ( ) Tz g h? ? ?x y a y廣義線性 判別函數(shù) 19 Fisher線性判別 — 降維 /兩類 ?線性判別函數(shù) y = g(x) = wTx : ? 樣本向量 x各分量的線性加權(quán) ? 樣本向量 x與權(quán)向量 w的向量 點積 ? 如果 || w ||=1,則視作向量 x在 w上的 投影 ?Fisher準則的基本原理 : 找到一個 最理想的投影軸 ,使兩類樣本在該軸上投影之間的距離盡可能遠,而每一類樣本的投影盡可能緊湊,從而使分類效果為最佳 20 Fisher線性判別 圖例 x1 x2 w1 H: g=0 w2 Fisher準則的描述:用投影后數(shù)據(jù)的統(tǒng)計性質(zhì) — 均值和離散度的函數(shù) 作為判別優(yōu)劣的標準 21 d維 X空間樣本分布的描述量 ? 各類 樣本均值向量 mi 1 1 , 2mx????iixKiiN? 樣本 類內(nèi)離散度矩陣 Si與 總類內(nèi)離散度矩陣 Sw ( )( ) , 1 , 2xS x m x m??? ? ? ??iTi i i i12S S S??w? 樣本 類間離散度 矩陣 Sb: 1 2 1 2( ) ( )S m m m m? ? ? Tb離散度矩陣在形式上與協(xié)方差矩陣很相似 22 一維 Y空間樣本分布的描述量 ? 各類 樣本均值 1 , 1 , 2?????iiyim y iN%? 樣本 類內(nèi)離散度 和總 類內(nèi)離散度 2( ) , 1 , 2??? ? ??iiiyS y m i% % 12wS S S??% % %? 樣本 類間離散度 212()bS m m??% %%以上定義描述 d維空間樣本點到一向量 投影后 的分散情況 23 原樣本與其投影統(tǒng)計量間的關(guān)系 ?樣本 x與其投影 y 的統(tǒng)計量之間的關(guān)系: 11 , 1 , 2yyx ww m???? ? ? ???iiTKiiTi iyim NN%221 2 1 21 2 1 2( ) ( )( ) ( )w m w mw m m m m w ww? ? ? ?? ? ? ?TTbTbTTmmSS%% %24 樣本與其投影統(tǒng)計量間的關(guān)系 22()()( ) ( )w x w mw x m xwwmw??????????? ? ?????????iiiiyTTi