【正文】
yE ( ) 其中 ky 為網(wǎng)絡(luò)之實(shí)際輸出,定義 如下: 2^ )( kkk yyE ?? ( ) iki ijjk OW ?? ( ) jkkjk ne tE???? ( ) 其中 : ()jk jkO f ? ( ) 于是 有: ikjkkijjkjkkijk One tEWne tne tEWE ?????????? ( ) 當(dāng) j 為輸出節(jié)點(diǎn)時, kjk yO ^? )()( 39。常用的基本激勵函數(shù)有閾值函數(shù)、分段線性函數(shù)、 Sigmoid 函數(shù)。 圖 是神經(jīng)網(wǎng)絡(luò)的示意圖。 誤差信號反向傳播 :網(wǎng)絡(luò)的實(shí)際輸出和期望輸出的差值就是誤差信號。下面介紹 BP學(xué)習(xí)算法, BP 學(xué)習(xí)過程可以描述如下 [4]: 作信號正向傳播 :輸入信號從輸入層經(jīng)過隱含層,傳向輸出層,在輸出端生輸出信 號。這里,訓(xùn)練的意思就是通過感知器的輸出來反復(fù)調(diào)整網(wǎng)絡(luò)的權(quán)值,以使其滿足所有分類都正確的要求。關(guān)于隱層神經(jīng)元的確定,將在 BP 網(wǎng)絡(luò)的設(shè)計中詳細(xì)討論。在多層網(wǎng)絡(luò)中,一般至少有 3 個層:一個輸入層、一個輸出層、一個或多個隱層。 這里, P 表示一 R 維的輸入向量, B 為偏置向量, W 為網(wǎng)絡(luò)的權(quán)值矩陣, f 為激活傳輸函數(shù), a為網(wǎng)絡(luò)的輸出向量。 圖 神經(jīng)元的抽象數(shù)學(xué)模型 圖 是將生物神 經(jīng)元模型抽象成一個信號傳遞的數(shù)學(xué)模型。樹突是樹狀的神經(jīng)纖維接受網(wǎng)絡(luò),它將電信號傳遞給細(xì)胞體,細(xì)胞體對這些輸入信號進(jìn)行整合并進(jìn)行閥值處理。 圖 神經(jīng)元示意 神經(jīng)網(wǎng)絡(luò)簡介:人工神經(jīng)網(wǎng)絡(luò)( Artificial Neural Network,ANN),也稱為神經(jīng)網(wǎng)絡(luò)( Neural Networks,NN)。 設(shè)標(biāo)準(zhǔn)字符庫中有 W1,W2,? Wm個字符類別,每一個字符類別有一個標(biāo)準(zhǔn)樣本,分別表示為, Z1,Z2,? Zm。 字符識別部分的功能就是對經(jīng)二值化后的單個字符進(jìn)行歸一化和細(xì)化處理,然后提取網(wǎng)格特征和交叉點(diǎn)特征。不同字體的同一字符的結(jié)構(gòu)約 80%相同,其主要差異在于 : (l)同字體的字符之間有較大的差異。本 技術(shù)涉及模式識別、圖像處理、數(shù)字信號處理、自然語言理解、人工智能、模糊數(shù)學(xué)、信息論、計算機(jī)、中文信息處理等學(xué)科,是一門綜合性技術(shù),在中文信息處理、辦公室自動化、機(jī)器翻譯、人工智能等高技術(shù)領(lǐng)域,都有著重要的實(shí)用價值和理論意義 [1]。對各種函件票證的分揀、傳送、驗(yàn)核等。但是,在信息技術(shù)高速發(fā)展的同時,一個難題也擺在我們面前,那就是計算機(jī)數(shù)據(jù)處理和網(wǎng)絡(luò)傳輸?shù)母咚俣扰c數(shù)據(jù)輸入的低速度之間的矛盾。 ABSTRACT This dissertation describes a printing digit recognition system. Firstly, the system preprocesses printing digital image, and extracts digital characteristic. Secondly, the system adopts specific recognition algorithm, to realize digital recognition automatically. The whole system is divided into four parts, image collection module,and image preprocessing module , characteristic extraction module and digital recognition module. Template matching is used for the recognition of printing digit. Firstly, the system pletes the process of image preprocessing and then extracts the bined characteristic of the grid and the intersections, based on which a standard feature database of characters is established. Secondly, in recognizing process, the system pares the character feature with those in the standard characteristic database and finds the nearest one. Experimental results show that the method based on template matching is effective for the printing digit. And the system is robust under some noise. Key Words: printing digit recognition BP work feature extraction template matching. 目 錄 第一章 緒論 .........................................錯誤 !未定義書簽。首先,在對數(shù)字進(jìn)行圖像處理后,采用網(wǎng)格特征和交叉點(diǎn)特征相結(jié)合的方法作為其數(shù)字特征,建立數(shù)字標(biāo)準(zhǔn)特征庫。整個系統(tǒng)包括神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,輸入圖像 、圖像預(yù)處理、特征提取與字符識別四個部分。系統(tǒng)首先對印刷體數(shù)字進(jìn)行預(yù)處理,提取 數(shù)字 特征,然后運(yùn) 用特定的識別算法,實(shí)現(xiàn)了數(shù)字圖像的自動識別。 印刷體數(shù)字采用模板匹配算法實(shí)現(xiàn)了數(shù)字的識別。 關(guān)鍵詞: 印刷體數(shù)字識別 BP 神經(jīng)網(wǎng)絡(luò) 圖 像分割 特征提取 模板匹配 。人類社會的不斷進(jìn)步帶來了 信息空間的增長和積累,而計算機(jī)的出現(xiàn)為現(xiàn)代化信息處理提供了有效的手段。人們接受信息最頻繁的是視覺通道 .在日常學(xué)習(xí)和生活中,所處理的信息有 75%— 85%是視覺信息,其中文字信息愈來愈占重要地位 .比如對各 種期刊文獻(xiàn)的閱讀、查找、翻譯 :對各種統(tǒng)計報表的匯總、計算、分析 。它的一項(xiàng)關(guān)鍵技術(shù)是光學(xué)字符識別技術(shù) (Optical Character Recognition,簡稱 OCR),即通過掃描儀把印刷體或手寫體文稿掃描成圖像,然后識別成相應(yīng)的計算機(jī)可直接處理的字符。 印刷體字符有很多種字體,而且新的字體還在不斷地產(chǎn)生。 (4)筆劃形態(tài)變化 :如黑體筆劃粗而平直,寬度一致 :楷體筆劃有較大曲率 。即分別計算提取的待識別字符的特征向量與字符標(biāo)準(zhǔn)庫中各字符特征向量的歐氏距離,與待識別字符距離最小的庫中字符就是識別結(jié)果。 符向量間的歐氏距離 D為 : ? ? 2/12/112 )()()(),( lkjTlkjdjlkjlk XXXXXXXXDD ????????? ??? ?? () 基于神經(jīng)網(wǎng)絡(luò)的 字符識別 原理 ( 1) BP神經(jīng)網(wǎng)絡(luò)簡介 下面我們首先來簡要介紹一下神經(jīng)網(wǎng)絡(luò),然后再詳細(xì)介紹 BP網(wǎng)絡(luò) [3]。神經(jīng)元由三部分組成:樹突、細(xì)胞體和軸突。 (如圖 ) 形象的說,神經(jīng)網(wǎng)絡(luò)是由大量處理單元(神經(jīng)元 Neurons)廣泛連接而成的網(wǎng)絡(luò),是對人腦的抽 象、簡化和模擬, 并且它內(nèi)部的很多的神經(jīng)元可以用來存儲這些已經(jīng)學(xué)到的知識。一個神經(jīng)元可以接受多個輸入,所以把神經(jīng)元表示成為矢量、矩陣形式更容易去處理分析實(shí)際問題。后面用到的 BP網(wǎng) 絡(luò)也是多層的。例如如果有 4 個外部變量作為輸入,那網(wǎng)絡(luò)就要有 4 個輸入。注意,感知器是單層網(wǎng)絡(luò)。本神經(jīng)網(wǎng)絡(luò)識別系統(tǒng)采用的是使用最為廣泛的 BP 網(wǎng)絡(luò)。如果在輸出層得到的輸出和期望輸出的偏差比較大,則轉(zhuǎn)入誤差信號的反向傳播。通過不斷的修改網(wǎng)絡(luò)權(quán)值從而使得網(wǎng)絡(luò)的輸出不斷的逼近期望值。 輸入節(jié)點(diǎn) 隱節(jié)點(diǎn) 輸出節(jié)點(diǎn) 圖 神經(jīng)網(wǎng)絡(luò)示意圖 神經(jīng)網(wǎng)絡(luò) 的激勵函數(shù) : 激勵函數(shù)將輸出信號壓縮在一個允許的范圍內(nèi),使其成為有限值,通常神經(jīng)元輸出的范圍在【 0, 1】或者【- 1, 1】的閉區(qū)間上。 設(shè)有含 n 個節(jié)點(diǎn)的 BP 網(wǎng)絡(luò), 采用 s 型激勵函數(shù) 。 jkjkijk OWE ???? ( ) BP 網(wǎng)絡(luò)的學(xué)習(xí)過程。 第四步 : 對輸入樣本,前向計算 BP 網(wǎng)絡(luò)每層神經(jīng)元的輸入信號和輸出信號。 第七步 : 根據(jù)局部梯度修正各個矩陣的權(quán)值。初始值過大或者過小都會影響學(xué)習(xí)速度。 C. 神經(jīng)元的激勵函數(shù)是 s 型函數(shù)。 BP 網(wǎng)絡(luò)的一個重要的用途就是用于模式識別。設(shè)計 BP 網(wǎng)絡(luò)的關(guān)鍵之處在于高效的特征提取方法、大量有代表性的訓(xùn)練樣本、高效穩(wěn)定速收斂的學(xué)習(xí)方法。 70 年代以來,日本學(xué)者做了許多工作,其中有代表性的系統(tǒng)有 1977 年東芝綜合研究所研制的可以識別 2021 漢字的單體印刷漢字識別系統(tǒng); 80 年代初期,日本武藏野電氣研究所研制的可以識別 2300 個多體漢字的印刷體漢字識別系統(tǒng),代表了當(dāng)時漢字識別的最高水平。 第三章介紹 了具體的基于神經(jīng)網(wǎng)絡(luò)的印刷體阿拉伯?dāng)?shù)字識別的算法。 模板匹配算法 模板匹配算法分析 標(biāo)準(zhǔn)特征庫 [15]建立起來后,字符識別時 ,讀入測試數(shù)字,首先計算測試數(shù)字與標(biāo)準(zhǔn)特征庫 網(wǎng)格特征向量的距離,具體方法如下 [8]: 81 0( , )k l k i liiD X X X X???? () 其次計算測試數(shù)字與標(biāo)準(zhǔn)特征庫交叉點(diǎn)特征向量的距離,具體方法如下 : 1229( , ) * 9k l k j ljjD X X X X???? () 式 和 中, kX 為待識別字符的 13 維特征向量, lX 為標(biāo)準(zhǔn)特征庫中的模板字符 13維特征向量, kiX 和 liX 分別為歸一化和細(xì)化后待識別字符與標(biāo)準(zhǔn)字符庫的 9 個小格子內(nèi)的像素數(shù), kjX 和 ljX 分別為歸一化和細(xì)化后待識別字符與標(biāo)準(zhǔn)字符庫的 4個交叉點(diǎn)的像素數(shù) ( 0 8 , 9 13 )ij? ? ? ?。由于實(shí)際中獲得的圖片往往帶有一些噪聲, 要求所設(shè)計的識別系統(tǒng)具有一定抗干擾能力,使其具有在一定不規(guī)范書寫的情況下的 仍然能夠識別字母或數(shù)字能力, 這給系統(tǒng)設(shè)計實(shí)現(xiàn)帶來很大困難,人工神經(jīng)網(wǎng)絡(luò)技術(shù)的出現(xiàn)和發(fā)展為解決這一問題提供了很好的方法和技術(shù)。 BackPropagation Network,反向傳播網(wǎng)絡(luò))是用在模式識別的典型方法。在正向傳播過程中,網(wǎng)絡(luò)的權(quán)值不變; ( 2)反向傳播:根據(jù)輸出值與期望值的誤差,把誤差信號按原來正向傳播的通路反向傳回,并對每個隱層的各個神經(jīng)元的權(quán)值進(jìn)行修改,以使誤差信號趨于最小。其拓?fù)浣Y(jié)構(gòu)如前面的圖 所示。 輸入端為其中的每一個列向量,因此輸入端的節(jié)點(diǎn)個數(shù)應(yīng)為 256 個。以下公式( )可以作為選擇隱層節(jié)點(diǎn)個數(shù)的參考: a n1 ??? nm ( ) 其中, m為輸出層節(jié)點(diǎn)個數(shù), n 為輸入層節(jié)點(diǎn)個數(shù), a 為 [1, 10]之間的常數(shù)。為了選擇最優(yōu)節(jié)點(diǎn)個數(shù), 試驗(yàn)同時還記錄下了 s1 在 16~ 34 之間的誤差曲線圖,由于篇幅限制,只列出其中 4 個結(jié)果。在 MatLab 中已經(jīng)將其編寫成函數(shù)的形式, 可以調(diào)用函數(shù) [13]這里它的輸出計算公式如公式( ) og ( * , )A l si g W P B? ( ) 系統(tǒng)最終結(jié)構(gòu) 根據(jù)以上分析,系統(tǒng)的結(jié)構(gòu)設(shè)計為:只有一個隱含層的三層 BP 網(wǎng)絡(luò), 432 個