【正文】
基于距離的分類決策-近鄰法簡介 最近鄰決策規(guī)則 最近鄰的改進之一 k近鄰 近鄰法 基本思想: 對于未知樣本(輸入模式、數(shù)據(jù)) ,比較該樣本與所有已知樣本之間的距離,并決策 與離它最近的樣本同屬一類。 xx最近鄰 (nearest neighbor)決策規(guī)則 設(shè)有 c個類別的模式識別問題 (分類問題 ), 為訓(xùn)練集,每一類 中含有 個樣本。 定義: 因此,決策規(guī)則為: 若 則,決策 1{ , , }NX x x?i? iN( ) m i n | | | | , 1 , ,ki i ikd x x x k N? ? ?( ) m in ( ) , 1 , ,ji id x d x i c??jx ??最近鄰的改進之一 設(shè)有 c類已知類別的樣本 (模式 ),從每一類中選擇一個標(biāo)準(zhǔn)樣本,例如樣本均值: 定義: 按照最小距離分類原則,決策規(guī)則為: 若 則 1 , cmm2( ) | | | | , 1 , 2 , ,iid x x m i c? ? ?( ) ( ) , 1 , , ,ijd x d x i c j i? ? ?ix ??決策規(guī)則的簡化 可以將上面的決策規(guī)則進行化簡: 可以進一步的簡化為: 因此決策規(guī)則可以表示為: ( ) ( ) ( )2Ti i iT T Ti i id x x m x mx x m x m m? ? ?? ? ?1()2TTi i i id x m x m m??( ) ( ) , 1 , , ,ijd x d x i c j i? ? ?ix ??決策函數(shù)的簡化 若定義: 決策規(guī)則將如何? ( ) | | | |iid x x m??k近鄰 基本思想是:觀察未知樣本 x的 k個最近鄰,若這 k個近鄰中的多數(shù)樣本向量屬于某一類,則就把 x判屬這一類。 也就是說,在含有 N個樣本訓(xùn)練集中,找出 x的 k個近鄰。設(shè) 類中含有 個樣本, … , 類中含有 個樣本。 x的 k個近鄰分別含有來自于 類的樣本 個樣本。 且有: 1? 1N c?cN1 , c?? 1 , ckk121 cN N Nk k k? ? ?? ? ?k近鄰法判別規(guī)則 定義:判別函數(shù)為 決策規(guī)則: 若 則,決策 ( ) , 1 , 2 , ,iid x k i c??( ) m a x ( ) m a xj i iiid x d x k??jx ??