【正文】
較結(jié)果劃分為兩類(lèi),像素的灰度值大于閾值的為一類(lèi),像素的灰度值小于閾值的為另一類(lèi),(灰度值等于閾值的像素可歸入這兩類(lèi)中的任何一類(lèi)),這兩類(lèi)像素一半對(duì)應(yīng)圖像中的兩類(lèi)區(qū)域。,有的地方空白太多或者字母和數(shù)字相靠太緊就會(huì)產(chǎn)生錯(cuò)誤。撰寫(xiě)并完成畢業(yè)論文。建議成績(jī)?cè)u(píng)定為:良簽名 年 月 日學(xué)院答辯委員會(huì)意見(jiàn) 答辯委員會(huì)主任簽名 (學(xué)院蓋章) 年 月 日注:學(xué)院、專(zhuān)業(yè)名均寫(xiě)全稱(chēng);成績(jī)登記表雙面打印人士的 50 個(gè)習(xí)慣 在行 動(dòng)前設(shè)定目標(biāo) 有目標(biāo)未必能夠成功,但沒(méi)有目 標(biāo)的肯定不能成功。杜哈提說(shuō),不論他出多小兩種能力是:第一,能思想;第二,能按事情的重要程度來(lái)做事。一名高效能人士不會(huì)到處為自己找借口,開(kāi)脫責(zé)任;相反,無(wú) 倫出現(xiàn)什么情況,他都會(huì)自覺(jué)主動(dòng)地將自己的任務(wù)執(zhí)行到底。只要把問(wèn)題 想透徹了,才能找到問(wèn)題到底是什么,才能找到解決問(wèn)題最有效的手段。 發(fā)現(xiàn)問(wèn)題 關(guān)鍵 在許多領(lǐng)導(dǎo)者看來(lái),高效能人士應(yīng)當(dāng)具備的最重要的能力就是發(fā)現(xiàn)問(wèn)題關(guān)鍵能力,因?yàn)檫@是通向問(wèn)題解決的必經(jīng)之路。蓋茨所説:“通向最高管理層的最迅捷的途徑,是主動(dòng)承擔(dān)別人都不愿意接手的工作,并在其中展示你出眾的創(chuàng)造力和解決問(wèn)題的能力。只要把問(wèn)題 想透徹了,才能找到問(wèn)題到底是什么,才能找到解決問(wèn)題最有效的手段。創(chuàng)新能力有待進(jìn)一步提高。本課題主要研究二值文檔圖像中的印刷體數(shù)字檢測(cè)與識(shí)別技術(shù)。 結(jié)論本程序基本實(shí)現(xiàn)了對(duì)訓(xùn)練過(guò)的數(shù)字字體的識(shí)別,對(duì)字母輸出1 和切割出單個(gè)字符的算法,對(duì)數(shù)字的有效識(shí)別率達(dá)到 60%以上,對(duì)于含有噪聲的圖像有時(shí)候會(huì)出現(xiàn)錯(cuò)誤,但是也在允許范圍之內(nèi),若經(jīng)過(guò)改進(jìn)會(huì)做的更好。圖 特征提取法我們?cè)谒椒较虼怪狈较蛉确值牡胤?,做水平線(xiàn)或垂直線(xiàn)穿過(guò)數(shù)字,統(tǒng)計(jì)穿過(guò)水平線(xiàn)及垂直線(xiàn)的黑像素的數(shù)目,這樣又獲得了 4 個(gè)交叉點(diǎn)特征,加起來(lái)特征量一共是 13 維。)。閾值的選取有許多方法,大多都是借助直方圖來(lái)選取的,包括極小值點(diǎn)閾值、最優(yōu)閾值、最大類(lèi)間方差法閾值。根據(jù)以上公式和輸入、輸出層節(jié)點(diǎn)個(gè)數(shù)可知隱層節(jié)點(diǎn)大致可以設(shè)置為 21~31 之間的數(shù),由于隱層的節(jié)點(diǎn)個(gè)數(shù)并不是越多越好,隱層節(jié)點(diǎn)數(shù)目太多會(huì)導(dǎo)致學(xué)習(xí)時(shí)間過(guò)長(zhǎng),誤差也不一定最佳,還可能會(huì)導(dǎo)致網(wǎng)絡(luò) [5][6]容錯(cuò)性差、不能識(shí)別以前沒(méi)有看到的樣本等問(wèn)題;而且考慮到要防止有不發(fā)生作用的節(jié)點(diǎn)影響網(wǎng)絡(luò)訓(xùn)練效果, 所以通過(guò)多次修改網(wǎng)絡(luò)隱層節(jié)點(diǎn)個(gè)數(shù)進(jìn)行試驗(yàn),并記錄其訓(xùn)練循環(huán)次數(shù)。BP 網(wǎng)絡(luò)因采用 BP 學(xué)習(xí)算法而得名。本文主要介紹了基于 BP 網(wǎng)絡(luò)的印刷體數(shù)字識(shí)別方法。為了避免權(quán)值的調(diào)整是同向的,應(yīng)該將初始值設(shè)為隨機(jī)數(shù)。為簡(jiǎn)單起見(jiàn),可以假設(shè)網(wǎng)絡(luò)只有一個(gè)輸出 y,任一節(jié)點(diǎn)的輸出為 ,并設(shè)有 N 個(gè)樣本 k = iO),(yx1,2,…,N),對(duì)某一輸入 ,網(wǎng)絡(luò)的輸出為 ,節(jié)點(diǎn) i 的輸出為 ,節(jié)點(diǎn) j 的輸kxkyikO入為: ()ikijjkW??使用平方型誤差函數(shù): ()21^)(2??NkkkkyE其中 為網(wǎng)絡(luò)之實(shí)際輸出,定義如下:ky ()2^)(kky ()ikijjkOW?? ()jkjkE???其中: ()()jkjkOft于是有: ()ikjijkjkijk OEWtE????當(dāng) j 為輸出節(jié)點(diǎn)時(shí), jky^ ())()(39。誤差信號(hào)反向傳播:網(wǎng)絡(luò)的實(shí)際輸出和期望輸出的差值就是誤差信號(hào)。在多層網(wǎng)絡(luò)中,一般至少有 3 個(gè)層:一個(gè)輸入層、一個(gè)輸出層、一個(gè)或多個(gè)隱層。圖 神經(jīng)元示意神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介:人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN),也稱(chēng)為神經(jīng)網(wǎng)絡(luò)(Neural Networks,NN)。本技術(shù)涉及模式識(shí)別、圖像處理、數(shù)字信號(hào)處理、自然語(yǔ)言理解、人工智能、模糊數(shù)學(xué)、信息論、計(jì)算機(jī)、中文信息處理等學(xué)科,是一門(mén)綜合性技術(shù),在中文信息處理、辦公室自動(dòng)化、機(jī)器翻譯、人工智能等高技術(shù)領(lǐng)域,都有著重要的實(shí)用價(jià)值和理論意義 [1]。印刷體數(shù)字采用模板匹配算法實(shí)現(xiàn)了數(shù)字的識(shí)別。ABSTRACTThis dissertation describes a printing digit recognition system. Firstly, the system preprocesses printing digital image, and extracts digital characteristic. Secondly, the system adopts specific recognition algorithm, to realize digital recognition automatically. The whole system is divided into four parts, image collection module,and image preprocessing module,characteristic extraction module and digital recognition module.Template matching is used for the recognition of printing digit. Firstly, the system pletes the process of image preprocessing and then extracts the bined characteristic of the grid and the intersections, based on which a standard feature database of characters is established. Secondly, in recognizing process, the system pares the character feature with those in the standard characteristic database and finds the nearest one. Experimental results show that the method based on template matching is effective for the printing digit. And the system is robust under some noise.Key Words: printing digit recognition BP work feature extraction template matching.目 錄 第一章 緒論 .........................................................1 研究的目的及意義 ............................................1 字符識(shí)別的方法和關(guān)鍵 .........................................2 基于模板匹配的印刷體數(shù)字識(shí)別技術(shù)的原理 .................2 基于神經(jīng)網(wǎng)絡(luò)的字符識(shí)別原理 .............................2 本文的研究背景及主要內(nèi)容 ....................................8第二章 數(shù)字識(shí)別原理及方案 ............................................9 模板匹配算法 .................................................9 模板匹配算法分析........................................9 模板匹配識(shí)別的軟件實(shí)現(xiàn) ................................9 BP 神經(jīng)網(wǎng)絡(luò)法 ...............................................10 本章小結(jié) ....................................................14第三章 基于 BP 神經(jīng)網(wǎng)絡(luò)的印刷體數(shù)字檢測(cè)與識(shí)別算法 ....................15 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練 ..............................................15 輸入訓(xùn)練樣本 ..........................................15 設(shè)定閾值 ..............................................15 Bp 網(wǎng)絡(luò)的構(gòu)造..........................................17 特征提取算法...........................................18 待識(shí)別圖像的預(yù)處理 ..........................................19 圖像的二值化處理.......................................19 圖像的去噪 ............................................19 單個(gè)數(shù)字圖像的分割 ..........................................20 調(diào)用已經(jīng)保存的神經(jīng)網(wǎng)絡(luò) ......................................20 本章小結(jié) ....................................................20第四章 仿真結(jié)果 ....................................................21 仿真結(jié)果舉例.................................................21 結(jié)論 ........................................................22第五章 總結(jié)與展望 ..........................................