【正文】
人員限制較多,或者對書寫的正規(guī)程度有要求,或者對書寫位置有要求,或者對所用筆、紙有要求,例如對稅務(wù)報(bào)表的識別就要求用規(guī)定的字型書寫數(shù)字,并且對書寫的位置有要求,而真正的無限制手寫體數(shù)字的識別的研究還有待進(jìn)一步提高。清華大學(xué)采用SVM對金融票據(jù)中的手寫體數(shù)字進(jìn)行識別,測試樣本20000個(gè),識別率約為92%。其它用傳統(tǒng)方法進(jìn)行識別研究的有中國科學(xué)院自動化研究所,該所對手寫體數(shù)字識別的研究歷史幾乎有20年了,在他們新近的報(bào)告中,利用以有限狀態(tài)自動機(jī)為主的識別途徑識別1100個(gè)手寫體數(shù)字,%,拒識4%,%,上海交通大學(xué)基于壓縮字結(jié)構(gòu)特征的手寫體數(shù)字識別算法選取了12600個(gè)樣本組成訓(xùn)練集,6000個(gè)樣本組成測試集,用BP網(wǎng)絡(luò)進(jìn)行分類,%,%,%。通過幾十年來各國研究學(xué)者得對數(shù)字識別的研究,國內(nèi)外在手寫識別上也取得了一定的成就。 國內(nèi)外研究現(xiàn)狀手寫體數(shù)字識別在學(xué)科上屬于模式識別和人工智能的范疇。因此,對手寫數(shù)字識別系統(tǒng)的要求不僅僅是單純的高正確率,更重要的是極低的誤識率。這是因?yàn)?,文字組合一般都存在上下文關(guān)系,但數(shù)字組合存在極少的或沒有上下文關(guān)系,所以每個(gè)孤立數(shù)字的識別都至關(guān)重要[13]。2) 數(shù)字雖然只用10種,而且筆畫簡單,但書寫上帶有明顯的地域特性,同一數(shù)字寫法千差萬別,不同地域的人寫法也不相同,所以很難做到兼顧各種寫法的極高識別率的通用型數(shù)字識別系統(tǒng)[12]。因此針對這類問題,就要求手寫數(shù)字識別系統(tǒng)具有高可靠性和高識別率。 手寫數(shù)字識別的難點(diǎn)雖然,人們對字符識別的研究有百余年,并在字符識別取得了可喜的成績(其漢字識別也越來越多的應(yīng)用到實(shí)際應(yīng)用中),然而字符識別的一個(gè)分支——數(shù)字識別的研究卻離實(shí)際應(yīng)用還有一定差距。隱馬爾科夫模型對于隨機(jī)信號具有很強(qiáng)的學(xué)習(xí)和建模能力,因此在語音識別中取得了很大的成功。由于其出色的學(xué)習(xí)性能,該技術(shù)已成為機(jī)器學(xué)習(xí)界的研究熱點(diǎn),并在很多領(lǐng)域都得到了成功的應(yīng)用,如人臉識別、手寫體數(shù)字識別、文本自動分類等。1) 在人工神經(jīng)網(wǎng)絡(luò)識別方法中,模式類的描述方法一般還是特征向量,只是在分類時(shí),利用了神經(jīng)網(wǎng)絡(luò)的自動學(xué)習(xí)和記憶功能,通過對樣本的訓(xùn)練建立起記憶,然后將未知樣本作為輸入讓神經(jīng)網(wǎng)絡(luò)“回憶”出該樣本所屬的類別。但真正OCR是在本世紀(jì)50年代隨著計(jì)算機(jī)的出現(xiàn)而到來的。 字符識別的研究與發(fā)展字符識別的最早能追溯到1890年一項(xiàng)幫助盲人閱讀裝置的發(fā)明專利。3) 盡管人們對手寫體數(shù)字識別已經(jīng)從事了很長時(shí)間的研究,并取得了一定的成果,但是到目前為止,機(jī)器識別本領(lǐng)與人的認(rèn)知能力相比,還是有很大的差距。這方面最明顯的例子是人工神經(jīng)網(wǎng)絡(luò)(ANN)。由上可見,對手寫體數(shù)字識別有著很高的實(shí)用價(jià)值,除此之外,手寫體數(shù)字識別作為模式識別領(lǐng)域的一個(gè)重要問題,也有著重要的理論價(jià)值:1) 阿拉伯?dāng)?shù)字是唯一的被世界各國通用的符號,對于手寫體數(shù)字識別的研究基本上與文化背景無關(guān),這樣就為世界各國研究者提供了一個(gè)供大家共同探討技術(shù)的平臺,研究并比較各種算法的優(yōu)缺點(diǎn)。隨著我國經(jīng)濟(jì)的快速發(fā)展,每天會有大量的財(cái)務(wù)、稅務(wù)、支票等需要處理。例如:人口普查、成績單錄入、行業(yè)年檢、財(cái)務(wù)報(bào)表錄入等應(yīng)用中。如果通過手寫體字符識別技術(shù)來實(shí)現(xiàn)信息的自動錄入,無疑將會有效解決傳統(tǒng)人工處理方式中存在的工作量大、成本高、效率低、時(shí)效性差等問題。其中個(gè)人憑證,支票,發(fā)票,進(jìn)賬單等等票據(jù)均需要處理大量的信息。 手寫數(shù)字識別的意義和應(yīng)用前景對手寫體數(shù)字的識別研究不僅有著重大的現(xiàn)實(shí)意義而且還有十分廣闊的應(yīng)用前景。雖然脫機(jī)手寫體數(shù)字識別難度較大,識別率較低,但是比起聯(lián)機(jī)手寫體數(shù)字識別來說,脫機(jī)手寫體數(shù)字識別不要求書寫者在特定的輸入設(shè)備上書寫,它可以與平常一樣書寫,所以脫機(jī)手寫體數(shù)字識別的應(yīng)用更為廣泛,如郵政編碼、統(tǒng)計(jì)報(bào)表、財(cái)務(wù)報(bào)表、銀行票據(jù)、學(xué)生成績、車牌號碼等。因此一般的聯(lián)機(jī)識別要比脫機(jī)識別的識別率要高。相對于聯(lián)機(jī)手寫體數(shù)字識別技術(shù),脫機(jī)手寫體數(shù)字識別技術(shù)識別率相對要低,而且在生活實(shí)際應(yīng)用得到很多應(yīng)用(例如:手機(jī)手寫輸入,手寫板等都是基于聯(lián)機(jī)識別)。當(dāng)今手寫體數(shù)字識別是人們研究的一個(gè)熱點(diǎn),而且手寫體數(shù)字識別的技術(shù)相對于以前已經(jīng)有了較大的提高。 字符識別可以分為兩個(gè)大類,文字識別和數(shù)字識別。文字識別是新一代智能計(jì)算機(jī)接口的重要組成部分。手寫體數(shù)字的識別是人們研究較為深入的一個(gè)領(lǐng)域。手寫數(shù)字識別(Handwritten Numeral Recognition,簡稱HNR)是OCR的一個(gè)分支,它的任務(wù)是把手寫阿拉伯?dāng)?shù)字(如0,1,2,……,9)通過非鍵盤方式輸入到計(jì)算機(jī)中,以便作進(jìn)一步的處理和應(yīng)用,給計(jì)算機(jī)建立視覺系統(tǒng),自動辨識人用筆寫在紙(介質(zhì))上的數(shù)字。其目的就是通過掃描、攝像等光學(xué)輸入方式將漢字報(bào)刊、書籍、文稿及其它印刷品的文字轉(zhuǎn)化為圖像信息,將圖形、表格的圖像進(jìn)行保存,再利用文字識別技術(shù)將圖像內(nèi)的文字或表格中的資料一律變成計(jì)算機(jī)能識別的文字,以便于計(jì)算機(jī)的管理維護(hù)。關(guān)鍵詞:手寫體數(shù)字識別,特征向量,二值化算法,凸凹特征The Software Design of Handwritten Numeral Recognition AbstractThe handwritten numeral recognition is a technology, which auto recognizes the handwriting Arabian numeral via machines or puters, and a special field in the Optical Character Recognition technology. Then handwritten numeral recognition research is greatly generalpurpose and significative, because of the universal Arabic numerals. On the same score, the handwritten numeral, recognition technologies are playing an important role in a number of automatization systems.In this paper, the main study focused on image preprocessing and selection of appropriate feature vectors, and to realize a plete system of handwritten numeral recognition. There are several mon parisons of binarization algorithm in this article, and choose the gradientbased binarization algorithm finally。另外本文還提出將一般用來直接識別字符的凸凹特征作為字符的特征向量之一。本文主要的研究的工作集中在圖像預(yù)處理和選擇合適的特征向量,并實(shí)現(xiàn)一個(gè)完整手寫體數(shù)字識別系統(tǒng)。畢業(yè)設(shè)計(jì)說明書手寫體數(shù)字識別的軟件設(shè)計(jì)電子與計(jì)算機(jī)科學(xué)技術(shù)學(xué)院學(xué)生姓名: 學(xué)號: 計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)學(xué) 院: 專 業(yè): 指導(dǎo)教師: 2009年 6月手寫體數(shù)字識別的軟件設(shè)計(jì) 摘 要手寫體數(shù)字識別是利用機(jī)器或計(jì)算機(jī)自動辨認(rèn)手寫體阿拉伯?dāng)?shù)字的一種技術(shù),是光學(xué)字符識別技術(shù)的一個(gè)分支。由于阿拉伯?dāng)?shù)字的世界通用性,并且數(shù)字的識別和處理也常常是一些自動化系統(tǒng)的核心和關(guān)鍵,所以對手寫體數(shù)字識別研究通用性強(qiáng),且意義重大。本文中對幾種常見的二值化算法進(jìn)行比較,并最終選擇基于梯度的二值化算法;在本文中,提出了一種方法來解決結(jié)構(gòu)點(diǎn)檢測的傳統(tǒng)方法的缺陷。通過對NIST的數(shù)據(jù)進(jìn)行測試,實(shí)驗(yàn)數(shù)據(jù)表明本文設(shè)計(jì)的數(shù)字識別系統(tǒng)對手寫體數(shù)字識別具有較高的識別率。 and objecting to the defection of traditional methods of structural point detection, a solution to the problem was put up in this article. In addition, this paper also raises the convexconcave feature as one of the character feature vectors.Through the NIST test data, experimental data shows that the digital identification system designed for handwritten numeral recognition has a high recognition rate.Keywords: Handwritten numeral recognition, Character feature vectors, Binarization algorithm, Convexconcave feature中北大學(xué)2009屆畢業(yè)設(shè)計(jì)說明書目 錄1 緒論 1 字符識別概述 1 手寫數(shù)字識別的意義和應(yīng)用前景 2 字符識別的研究與發(fā)展 3 手寫數(shù)字識別的難點(diǎn) 3 國內(nèi)外研究現(xiàn)狀 4 手寫體數(shù)字識別系統(tǒng)概述 5 本文內(nèi)容安排 62 手寫體數(shù)字識別中預(yù)處理技術(shù) 8 平滑去噪 8 二值化 10 歸一化 16 傾斜校正 20 細(xì)化 223 手寫體數(shù)字識別中串切分技術(shù) 25 切分方法概述 25 手寫數(shù)字串常用方法簡介 25 投影法的直線切分 25 滴水算法 26 動態(tài)規(guī)劃算法 26 滑動窗口法 26 多模具切分法 26 本文手寫數(shù)字串切分方法介紹 274 手寫體數(shù)字識別中特征值提取技術(shù) 29 特征提取概述 29 手寫體字符特征提取方法概述 30 手寫體數(shù)字識別中的結(jié)構(gòu)特征提取 32 結(jié)構(gòu)點(diǎn)特征 32第 Ⅰ 頁 共 Ⅱ 頁 穿越密度特征 34 投影特征 35 手寫體數(shù)字識別中的統(tǒng)計(jì)特征提取 36 重心矩特征 36 粗網(wǎng)格特征 36 水平、垂直投影特征 37 環(huán)凸凹特征 38 全局Kirsh邊緣方向特征 395 人工神經(jīng)網(wǎng)絡(luò)分類器 41 人工神經(jīng)網(wǎng)絡(luò)概述 41 BP神經(jīng)網(wǎng)絡(luò)概述 42 本文的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì) 446 系統(tǒng)實(shí)現(xiàn)與結(jié)果分析 47 系統(tǒng)實(shí)現(xiàn) 47 系統(tǒng)實(shí)現(xiàn)環(huán)境 47 系統(tǒng)處理過程圖 47 結(jié)果分析 487 結(jié)束語 50附錄:NIST樣本庫的文件結(jié)構(gòu) 51參 考 文 獻(xiàn) 52致 謝 54第 Ⅱ 頁 共 Ⅱ 頁中北大學(xué)2009屆畢業(yè)設(shè)計(jì)說明書1 緒論 字符識別概述光學(xué)字符識別(Optical Character Recognition,簡稱OCR)是20世紀(jì)20年逐步發(fā)展起來的一門自動化技術(shù),是圖像處理與模式識別領(lǐng)域的一個(gè)重要分支[1]。它能夠減少存儲容量、通訊交流的信息、循環(huán)利用已識別出的文字以及節(jié)省因鍵盤輸入而浪費(fèi)的人力、物力、財(cái)力和時(shí)間。它屬于模式識別、人工智能的一個(gè)重要分支,涉及到模式識別和圖像處理、人工智能、統(tǒng)計(jì)決策理論、模糊數(shù)學(xué)、組合數(shù)學(xué)、信息論、計(jì)算機(jī)等學(xué)科;同時(shí)也涉及心理學(xué)等,是介于基礎(chǔ)研究與應(yīng)用研究之間的一門綜合性的技術(shù)[2],在辦公室、機(jī)器翻譯等方面具有重大實(shí)用意義。文字識別作為計(jì)算機(jī)技術(shù)的一個(gè)領(lǐng)域在許多的環(huán)境當(dāng)中都有著非常廣泛的應(yīng)用。近二十年來,國內(nèi)外對各種字符進(jìn)行了廣泛深入的研究,研究出了許多非常有效的識別算法,與此同時(shí)用于各種字符識別的應(yīng)用軟件也越來越豐富。數(shù)字識別又可以分為手寫體數(shù)字識別和印刷體數(shù)字識別,而對于手寫體數(shù)字識別可分為聯(lián)機(jī)手寫體數(shù)字和脫機(jī)手寫體數(shù)字的識別。國內(nèi)專門做識別技術(shù)成果比較好的是漢王公司,該公司的識別軟件對各種字符識別率已經(jīng)很不錯。由于聯(lián)機(jī)識別相對于脫機(jī)識別能夠獲取更多的信息,其除了獲取了圖片信息外,計(jì)算機(jī)還可以通過與計(jì)算機(jī)相連的手寫輸入設(shè)備獲得輸入字符筆劃的順序、筆劃的方向以及字符的形狀。所以聯(lián)機(jī)識別的已經(jīng)投入使用,但是對于脫機(jī)識別由于其技術(shù)限制,以至其到現(xiàn)在還沒有大范圍的應(yīng)用。一旦脫機(jī)手寫體數(shù)字的研究取得成功,滿足實(shí)用需求,并投入應(yīng)用,將產(chǎn)生巨大的社會效益。當(dāng)今經(jīng)濟(jì)的發(fā)展,金融市場化進(jìn)程的日益加快,票據(jù)業(yè)務(wù)發(fā)展很快,票據(jù)數(shù)量也與日俱增。而目前,票據(jù)錄入仍然依賴人工處理方式,因而使得票據(jù)管理工作也相對落后。此外,手寫數(shù)字識別應(yīng)用領(lǐng)域還有:1) 手寫數(shù)字識別被應(yīng)用在大規(guī)模數(shù)據(jù)統(tǒng)計(jì)中。2) 手寫數(shù)字識別被應(yīng)用在財(cái)務(wù)、稅務(wù)、金融領(lǐng)域應(yīng)用。3) 手寫數(shù)字識別被應(yīng)用到郵件分揀系統(tǒng)中[3]。2) 由于手寫體數(shù)字識別的類別少,有助于作深入分析與驗(yàn)證一些新的理論。很多ANN模型和算法都是以手寫體數(shù)字識別作為實(shí)驗(yàn)測試平臺,驗(yàn)證其理論的有效性,評價(jià)各種方法各自的優(yōu)缺點(diǎn)。4) 手寫體數(shù)字識別的方法很容易被推廣到其它相關(guān)問題上,比如英文字母識別、漢字識別等等。1929年,有德國人Tausheck首先正式提出OCR概念,并取得了OCR專利權(quán),四年后美國人Handel也取得了同樣的專利權(quán)[4]。在字符識別大發(fā)展時(shí)期(1990年后),許多研究者對字符識別進(jìn)行了探索與研究,當(dāng)時(shí)提出許多新的有效識別工具,其中人工神經(jīng)網(wǎng)絡(luò)(