【正文】
中 南 大 學(xué) 本科生畢業(yè)論文(設(shè)計(jì))題 目 基于神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字 識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 目 錄摘要 ⅠABSTRACT Ⅱ第一章 緒論 1 1 2 論文結(jié)構(gòu)簡(jiǎn)介 3第二章 手寫體數(shù)字識(shí)別 4 4 圖像預(yù)處理概述 5 圖像預(yù)處理的處理步驟 5 圖像的平滑去噪 5 二值話處理 6 歸一化 7 細(xì)化 8 小結(jié) 9第三章 特征提取 10 特征提取的概述 10 統(tǒng)計(jì)特征 10 結(jié)構(gòu)特征 11 結(jié)構(gòu)特征提取 11 筆劃特征的提取 11 數(shù)字的特征向量說(shuō)明 12 知識(shí)庫(kù)的建立 12第四章 神經(jīng)網(wǎng)絡(luò)在數(shù)字識(shí)別中的應(yīng)用 14 神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介及其工作原理 14[14] 14 14[15] 15 BP神經(jīng)網(wǎng)絡(luò) 16 BP算法 16 BP網(wǎng)絡(luò)的一般學(xué)習(xí)算法 16 BP網(wǎng)絡(luò)的設(shè)計(jì) 18 BP學(xué)習(xí)算法的局限性與對(duì)策 20 對(duì)BP算法的改進(jìn) 21第五章 系統(tǒng)的實(shí)現(xiàn)與結(jié)果分析 23 軟件開發(fā)平臺(tái) 23 MATLAB簡(jiǎn)介 23 MATLAB的特點(diǎn) 23 使用MATLAB的優(yōu)勢(shì) 23 系統(tǒng)設(shè)計(jì)思路 24 系統(tǒng)流程圖 24 MATLAB程序設(shè)計(jì) 24 實(shí)驗(yàn)數(shù)據(jù)及結(jié)果分析 26結(jié)論 27參考文獻(xiàn) 28致謝 30附錄 31摘 要手寫體數(shù)字識(shí)別是模式識(shí)別中一個(gè)非常重要和活躍的研究領(lǐng)域,數(shù)字識(shí)別也不是一項(xiàng)孤立的技術(shù),它所涉及的問題是模式識(shí)別的其他領(lǐng)域都無(wú)法回避的;應(yīng)用上,作為一種信息處理手段,字符識(shí)別有廣闊的應(yīng)用背景和巨大的市場(chǎng)需求。因此,對(duì)數(shù)字識(shí)別的研究具有理論和應(yīng)用的雙重意義。人工神經(jīng)網(wǎng)絡(luò)識(shí)別方法是近年該研究領(lǐng)域的一種新方法,該方法具有一些傳統(tǒng)技術(shù)所沒有的優(yōu)點(diǎn):良好的容錯(cuò)能力、分類能力強(qiáng)、并行處理和自學(xué)習(xí)能力,并且是離線訓(xùn)練和在線識(shí)別的。這些優(yōu)點(diǎn)使它在手寫體字符的識(shí)別中能對(duì)大量數(shù)據(jù)進(jìn)行快速實(shí)時(shí)處理,并達(dá)到良好的識(shí)別效果。由于手寫體數(shù)字識(shí)別難于建立精確的數(shù)學(xué)模型,所以本文采用BP神經(jīng)網(wǎng)絡(luò)對(duì)這一問題進(jìn)行處理。神經(jīng)網(wǎng)絡(luò)模式識(shí)別的一個(gè)關(guān)鍵步驟是預(yù)處理和特征提取,對(duì)于手寫體數(shù)字識(shí)別,本文采用了一種基于結(jié)構(gòu)特征和統(tǒng)計(jì)特征的提取方法,并用程序?qū)崿F(xiàn)了這一特征提取過程。通過測(cè)試,本識(shí)別系統(tǒng)對(duì)于較規(guī)范的手寫體數(shù)字的識(shí)別達(dá)到了很好的識(shí)別效果。關(guān)鍵詞: 手寫體數(shù)字識(shí)別,特征提取,人工神經(jīng)網(wǎng)絡(luò),MATLABABSTRACTHandwritten character recognition is a very important and active research in pattern recognition. Theoretically, it is not an isolated technique. It concerns with the problem that all the other areas of pattern recognition must confronted。 practically, being a kind of information processing measured, character recognition has a very broad application background and vast need of market. Thus, it is of both theoretical and practical significance.Artificial neural network recognition method is a new method of the research field in recent years, and this method has some merit that traditional technique do not have。 good tolerance for error, strong sorting ability, strong parallel handling ability and strong selflearning ability as well as its offline training and online recognizing. All these merits contribute its perfect performance in handling vast data set and handling in timely manner.It’s difficult to make accurate mathematics model for handwritten numeral recognition, so BP neural networks is used here. The key steps of neural networks pattern recognition are preprocessing and feature subset selection. In this paper, algorithm of feature subset selection basing on structural characteristics and statistical characteristics has been adopted in handwritten numeral recognition, and the process of feature subset selection had been realized in program.Recognition system in this paper has achieved a good rate of recognition in random handwritten numeral by test.Keyword: handwritten numeral recognition, feature extraction, artificial neural network, MATLABII基于神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 第一章 緒論第一章 緒 論模式識(shí)別[2]是六十年代初迅速發(fā)展起來(lái)的一門學(xué)科。由于它研究的是如何用機(jī)器來(lái)實(shí)現(xiàn)人(及某些動(dòng)物)對(duì)事物的學(xué)習(xí)、識(shí)別和判斷能力,因而受到了很多科技領(lǐng)域研究人員的注意,成為人工智能研究的一個(gè)重要方面。一個(gè)模式識(shí)別系統(tǒng)的基本職能是對(duì)系統(tǒng)所要處理的模式歸屬于哪一類做出判別,從該系統(tǒng)的模式輸入到系統(tǒng)做出判別之間,主要包括信息檢測(cè)、預(yù)處理、特征提取和分類幾大環(huán)節(jié)。字符識(shí)別是模式識(shí)別領(lǐng)域中的一個(gè)非?;钴S的分支。一方面是由于問題本身的難度使之成為一個(gè)極具挑戰(zhàn)性的課題;另一方面,是因?yàn)樽址R(shí)別不是一項(xiàng)孤立的應(yīng)用技術(shù),其中包含的模式識(shí)別領(lǐng)域中其他分支都會(huì)遇到的一些基本和共性的問題。從50年代開始,許多的研究者就在這一研究領(lǐng)域開展了廣泛的探索并為模式識(shí)別的發(fā)展產(chǎn)生了積極的影響。字符識(shí)別,從采用的輸入設(shè)備來(lái)分,可分為脫機(jī)識(shí)別(又稱為光學(xué)字符識(shí)別Optical Character Recognition ,OCR)和聯(lián)機(jī)識(shí)別,脫機(jī)字符又分為印刷體和手寫字符識(shí)別,從對(duì)書寫者要求來(lái)分,手寫字符又分為限制性和非限制性的手寫字符識(shí)別。在聯(lián)機(jī)手寫字符識(shí)別中,計(jì)算機(jī)能夠通過與計(jì)算機(jī)相連的手寫輸入設(shè)備獲得輸入字符筆劃的順序、筆劃的方向以及字符的形狀,所以相對(duì)OCR來(lái)說(shuō)它更容易識(shí)別一些。但聯(lián)機(jī)字符識(shí)別有一個(gè)重要的不足就是要求輸入者必須在指定的設(shè)備上書寫,然而人們?cè)谏钪写蟛糠值臅鴮懬闆r是不滿足這一要求的,比如人們填寫各種表格資料,開具支票等。如果需要計(jì)算機(jī)去認(rèn)識(shí)這些已經(jīng)成為文字的東西,就需要OCR技術(shù)。比起聯(lián)機(jī)字符識(shí)別來(lái),OCR不要求書寫者在特定輸入設(shè)備上書寫,它可以與平常一樣書寫,所以O(shè)CR的應(yīng)用更為廣泛。OCR所使用的輸入設(shè)備可以是任何一種圖像采集設(shè)備,如掃描儀、數(shù)字相機(jī)等。通過使用這類采集設(shè)備,OCR系統(tǒng)將書寫者已經(jīng)寫好的文字作為圖像輸入到計(jì)算機(jī)中,然后由計(jì)算機(jī)去識(shí)別。由于OCR的輸入只是簡(jiǎn)單的一副圖像,它就不能像聯(lián)機(jī)輸入那樣比較容易的從物理上獲得字符筆劃的順序信息,因此OCR是一個(gè)更具挑戰(zhàn)性的問題。脫機(jī)字符識(shí)別(OCR)分為印刷體OCR和手寫OCR。印刷體字符比手寫體字符少了隨機(jī)性,它的識(shí)別相對(duì)容易些,難點(diǎn)已經(jīng)不在識(shí)別環(huán)節(jié),而在于字符的分割上。印刷體識(shí)別的錯(cuò)誤絕大多數(shù)都是錯(cuò)誤的分割引起的[3]。對(duì)于手寫體OCR,無(wú)論是聯(lián)機(jī)還是脫機(jī)識(shí)別,手寫體的識(shí)別都要經(jīng)歷由限制性手寫體識(shí)別到非限制性手寫體識(shí)別兩個(gè)階段。本文將以手寫體數(shù)字為代表,討論非限制性手寫體字符的識(shí)別。脫機(jī)字符識(shí)別的研究最早始于上個(gè)世紀(jì)六十年代,是為了應(yīng)付漢英翻譯的需要。八十年代后的研究重心轉(zhuǎn)移到脫機(jī)手寫字符的識(shí)別上。對(duì)于小類別數(shù)的字符集如數(shù)字、字母的識(shí)別,已經(jīng)可以做到對(duì)書寫不加任何的限制。非限制性手寫OCR的研究始終以阿拉伯?dāng)?shù)字為主導(dǎo)。這事因?yàn)?,第一,十個(gè)阿拉伯?dāng)?shù)字是全世界的一套通用字符。第二,在數(shù)字的許多應(yīng)用場(chǎng)合,如報(bào)表、賬單、支票等,手寫體還難以被印刷體所替代,而且對(duì)識(shí)別的可靠性要求極高。三,由于類別數(shù)少,所以模式識(shí)別中的許多方法研究均可以以數(shù)字識(shí)別作為實(shí)驗(yàn)背景。對(duì)脫機(jī)手寫體字符的研究,人們由簡(jiǎn)單集成筆畫密度、筆畫方向和背景特征方法過渡到特征匹配方法,進(jìn)而過渡到結(jié)合神經(jīng)網(wǎng)絡(luò)方法,隨著對(duì)識(shí)別可靠性要求的提高,九十年代以后,多分類器集成方法成為了一個(gè)研究重點(diǎn)。目前,隨著計(jì)算機(jī)的迅速發(fā)展,性能價(jià)格比的不斷提高,模式識(shí)別技術(shù)已經(jīng)從理論探討為主發(fā)展到大量的實(shí)際應(yīng)用,人們將更多的注意力開始轉(zhuǎn)向那些用于語(yǔ)音、圖像、機(jī)器人以及人工智能等的模式識(shí)別實(shí)際問題。解決這些問題的關(guān)鍵是需要進(jìn)行復(fù)雜而龐大的實(shí)時(shí)數(shù)據(jù)處理,而現(xiàn)有計(jì)算機(jī)的存貯容量及計(jì)算復(fù)雜性的局限,使得真正實(shí)時(shí)化的應(yīng)用受阻。這種面向?qū)崟r(shí)應(yīng)用的模式識(shí)別問題促使人們開始將并行處理的神經(jīng)網(wǎng)絡(luò)[4]應(yīng)用到模式識(shí)別,而神經(jīng)網(wǎng)絡(luò)模式識(shí)別技術(shù)又將模式識(shí)別實(shí)時(shí)應(yīng)用推進(jìn)了一大步,手寫體數(shù)字識(shí)別就是這種應(yīng)用的一個(gè)很重要的領(lǐng)域。手寫體數(shù)字識(shí)別是一項(xiàng)極具研究?jī)r(jià)值的課題,隨著神經(jīng)網(wǎng)絡(luò)[1]和模糊邏輯技術(shù)的發(fā)展,人們對(duì)這一問題的研究又采用了許多新的方法和手段,也使得這一古老的課題煥發(fā)出新的生命力[5]。目前國(guó)際上有相當(dāng)多的學(xué)者在研究這一課題,它包括了模式識(shí)別領(lǐng)域中所有典型的問題:數(shù)據(jù)的采集、處理及選擇、輸入樣本表達(dá)的選擇、模式識(shí)別分類器的選擇以及用樣本集對(duì)識(shí)別器的有指導(dǎo)的訓(xùn)練。人工神經(jīng)網(wǎng)絡(luò)為手寫體數(shù)字識(shí)別提供了新的手段。正是神經(jīng)網(wǎng)絡(luò)所具有的這種自組織自學(xué)習(xí)能力、推廣能力、非線性和運(yùn)算高度并行的能力使得模式識(shí)別成為目前神經(jīng)網(wǎng)絡(luò)最為成功的應(yīng)用領(lǐng)域。二十多年來(lái),人們?cè)跀?shù)字識(shí)別領(lǐng)域做了大量的研究工作,所提出的各種方法在印刷體和手寫印刷體數(shù)字識(shí)別方面已經(jīng)取得了較好的成績(jī),識(shí)別率穩(wěn)定在96%左右。但是自由手寫體數(shù)字的識(shí)別工作目前并不成熟,仍舊是文字識(shí)別中最有挑戰(zhàn)性的課題之一。字符識(shí)別長(zhǎng)期以來(lái)都是采用傳統(tǒng)的識(shí)別方法,對(duì)印刷體字符的識(shí)別率一般只是穩(wěn)定在96%左右,不能進(jìn)一步提高;而對(duì)手寫體字符的識(shí)別,其研究還處于探索階段,其識(shí)別率還相當(dāng)?shù)?,因此,為了提高識(shí)別率,就必須尋求新的方法和途徑。進(jìn)入九十年代以來(lái),人工神經(jīng)網(wǎng)絡(luò)(ANN)技術(shù)發(fā)展十分迅速,它具有模擬人類部分形象思維的能力,是一種模仿人腦學(xué)習(xí)、記憶、推理等認(rèn)知功能的新方法。特別是它的信息并行分布式處理能力和自學(xué)習(xí)功能等顯著優(yōu)點(diǎn),更是激起了人們對(duì)它的極大的興趣。人工神經(jīng)網(wǎng)絡(luò)是由一些類似人腦神經(jīng)元的簡(jiǎn)單處理單元相互連接而成的復(fù)雜網(wǎng)絡(luò)。已涌現(xiàn)出許多不同類型的ANN及相應(yīng)的學(xué)習(xí)算法,其中BP(或EBPError Back Propagation)網(wǎng)絡(luò)及學(xué)習(xí)算法得到了廣泛關(guān)注和研究,并在數(shù)字識(shí)別方面取得了許多有意義的應(yīng)用成果。 論文結(jié)構(gòu)簡(jiǎn)介本畢業(yè)設(shè)計(jì)主要解決以圖像形式存在的手寫體數(shù)字識(shí)別的問題。整體分為三個(gè)部分,第一部分是圖像預(yù)處理,第二部分是對(duì)手寫體數(shù)字的結(jié)構(gòu)特征的提取,第三部分是設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)并對(duì)前面得到的樣本數(shù)據(jù)進(jìn)行學(xué)習(xí)和訓(xùn)練。本文通過圖像預(yù)處理和數(shù)字特征提取以后基于神經(jīng)網(wǎng)絡(luò)的判別方法,然后結(jié)合使用了MATLAB工具箱中提供的人工神經(jīng)網(wǎng)絡(luò)函數(shù)設(shè)計(jì)了一種手寫數(shù)字識(shí)別的新方法。實(shí)驗(yàn)表明,該方法可以獲得較好的識(shí)別率。42基于神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn) 第二章 手寫數(shù)字識(shí)別第二章 手寫體數(shù)字識(shí)別字符識(shí)別問題的研究已有幾十年的歷史了,但時(shí)至今日,字符識(shí)別的研究成果遠(yuǎn)未達(dá)到人們所期望的,這其中有理論研究和技術(shù)實(shí)現(xiàn)等多方面因素. 在理論方面,我們對(duì)人類的視覺認(rèn)知機(jī)理的研究還只是初步的,遠(yuǎn)未達(dá)到深入和透徹的水平。在技術(shù)方面,我們使用的計(jì)算機(jī)的運(yùn)算水平和存儲(chǔ)能力, 比起人腦的信息存儲(chǔ)和處理能力有很大差距. 因此,目前的文字識(shí)別只能建立在現(xiàn)有的理論基礎(chǔ)上,使用現(xiàn)有的技術(shù)來(lái)研究和解決問題。手寫體數(shù)字識(shí)別是字符識(shí)別的一個(gè)分支,問題雖然簡(jiǎn)單,但卻有較大的實(shí)用價(jià)值。數(shù)字的類別雖然只有十種,筆劃又簡(jiǎn)單,其識(shí)別問題表面上是一個(gè)較簡(jiǎn)單的分類問題。但實(shí)際上,雖然各種新的識(shí)別算法不斷的推出。其識(shí)別率和誤識(shí)率仍距實(shí)用有相當(dāng)距離。手寫阿拉伯?dāng)?shù)字具有變形多差異大的特點(diǎn),字形與書寫人的職業(yè)、文化程度、書寫習(xí)慣以及所使用筆墨紙張所處環(huán)境等都有關(guān),所以手寫體數(shù)字變形多、規(guī)律復(fù)雜。具體地說(shuō)有兩個(gè):一是0~ 9 十個(gè)數(shù)字中,其中的一些數(shù)字字形相差不大,使得準(zhǔn)確區(qū)分某些數(shù)字相當(dāng)困難。二是數(shù)字雖然只有十種,但同一數(shù)字寫法千差萬(wàn)別。不同的人寫出的同一個(gè)數(shù)字都有差別,即使同一個(gè)人在不同的時(shí)候也會(huì)有不同的寫法。筆劃的書寫順序經(jīng)常發(fā)生變化,因此極大地增加了匹配的難度。一般人寫字時(shí)都不會(huì)一筆一劃的書寫,為了節(jié)省時(shí)間,連