【正文】
濟(jì)南大學(xué)泉城學(xué)院畢 業(yè) 論 文題 目 基于BP神經(jīng)網(wǎng)絡(luò)的字母識(shí)別系統(tǒng) 設(shè)計(jì)與實(shí)現(xiàn) 專 業(yè) 電氣工程及其自動(dòng)化 班 級(jí) 07Q2 學(xué) 生 學(xué) 號(hào) 指導(dǎo)教師 二〇一一年六月七日濟(jì)南大學(xué)泉城學(xué)院畢業(yè)論文摘 要基于前向反饋神經(jīng)網(wǎng)絡(luò)的字母識(shí)別技術(shù)在科學(xué)技術(shù)日新月異的今天迅速得到發(fā)展,在諸多的方面得到應(yīng)用包括出版、金融、軍事、現(xiàn)金登記、頁面瀏覽以及任何帶有重復(fù)性、變化性數(shù)據(jù)的文件。英文字母識(shí)別系統(tǒng)的設(shè)計(jì)經(jīng)過以下幾個(gè)過程:預(yù)處理、特征提取、BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練、識(shí)別。本文的重點(diǎn)在于BP神經(jīng)網(wǎng)絡(luò)。本文運(yùn)用的是三層神經(jīng)網(wǎng)絡(luò),輸入層、隱含層、輸出層。隱含層節(jié)點(diǎn)的確定本文給出了多種方法,本文運(yùn)用了根值的方法?;谌斯ど窠?jīng)網(wǎng)絡(luò)字母識(shí)別的特點(diǎn)和優(yōu)越性,主要表現(xiàn)在三個(gè)方面:第一,具有自學(xué)習(xí)功能。字母識(shí)別時(shí),只在先把許多不同的圖像樣板和對(duì)應(yīng)的應(yīng)識(shí)別的結(jié)果輸入人工神經(jīng)網(wǎng)絡(luò),然后在識(shí)別之前對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練形成穩(wěn)定的權(quán)值這樣網(wǎng)絡(luò)通過自學(xué)習(xí)功能,慢慢學(xué)會(huì)識(shí)別類似的圖像。第二,具有聯(lián)想存儲(chǔ)功能。用人工神經(jīng)網(wǎng)絡(luò)的反饋網(wǎng)絡(luò)在字母識(shí)別時(shí)可以實(shí)現(xiàn)這種聯(lián)想。第三,具有高速尋找優(yōu)化解的能力。字母識(shí)別時(shí)尋找一個(gè)復(fù)雜問題的優(yōu)化解,往往需要很大的計(jì)算量,利用一個(gè)針對(duì)某問題而設(shè)計(jì)的反饋型人工神經(jīng)網(wǎng)絡(luò)的字母識(shí)別系統(tǒng),發(fā)揮計(jì)算機(jī)的高速運(yùn)算能力,可能很快找到優(yōu)化解。本文是在matlab環(huán)境下模擬整個(gè)英文字母的識(shí)別過程,隨著科學(xué)技術(shù)的發(fā)展識(shí)別技術(shù)更加成熟,各種難題都將會(huì)得到解決。關(guān)鍵詞:字母識(shí)別;圖像處理;特征提??;BP神經(jīng)網(wǎng)絡(luò) 38 ABSTRACTToday the science and technology develop rapidly. Letter recognition technology based on the feedback neural network is applied in many aspects including publication, finance military, cash register, page views, and any with repeatability,and variability of data files . Letter Identification System include the following processes: preprocessing, feature extraction, BP neural network training,and recognition.. In this paper, we use a threelayer neural network, including input layer, hidden layer and output layer. This paper supply of a variety of methods to determine Hidden layer nodes . The root sign method and other proposed by the Nelson and Illingwnrth are applied .The features and advantages of Artificial neural network is reflected in three aspects :First, a selflearning function. When we recognize letters, only putting many different images and the corresponding results into the artificial neural network and forming a stable weight before the letter recognition,the network will be through selflearning function to slowly identify similar , with the association storage. Artificial neural network feedback network can achieve this association in the letter recognition. Third, finding the optimal solution with high capacity. Finding the optimal solution of a plex often require a large amount of a design that a feedback type artificial neural network for problem and playing the highspeed puting power of puter, you may quickly find the optimal solution. In the matlab environment this article simulate the entire process of letter recognition, with the development of science and technology recognition technology is more mature and have various problems will be solved.字典Keywords:Letter identification;image processing;feature extraction;the feedback neural network目 錄摘 要 IABSTRACT II1 前言 1 研究背景及意義 1 研究現(xiàn)狀 2 手寫字母識(shí)別方法 3 結(jié)構(gòu)模式識(shí)別方法 3 統(tǒng)計(jì)模式識(shí)別方法 3 統(tǒng)計(jì)與結(jié)構(gòu)相結(jié)合的識(shí)別方法 4 人工神經(jīng)網(wǎng)絡(luò)方法 4 識(shí)別系統(tǒng)性能的評(píng)價(jià) 5 論文組織結(jié)構(gòu) 52 預(yù)處理 6 系統(tǒng)框架 6 預(yù)處理概述 6 本文預(yù)處理設(shè)計(jì) 6 7 8 歸一化 10 113 字母特征提取 13 特征提取概述 13 本文特征提取設(shè)計(jì) 13 14 15 重心特征 16 提取圖像的矩陣像素特征 16 17 外輪廓特征提取 184 BP神經(jīng)網(wǎng)絡(luò) 19 人工神經(jīng)網(wǎng)絡(luò) 19 20 BP神經(jīng)網(wǎng)絡(luò)的工作原理 21 22 22 隱含層節(jié)點(diǎn)數(shù)的優(yōu)化確定 23 BP神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)計(jì)和訓(xùn)練過程[17] 255 實(shí)驗(yàn)結(jié)果及分析 28 實(shí)驗(yàn)設(shè)計(jì) 28 實(shí)驗(yàn)參數(shù) 28 訓(xùn)練和識(shí)別樣本庫設(shè)計(jì) 28 28 識(shí)別樣本的正確率 30 實(shí)驗(yàn)結(jié)果分析 31結(jié) 論 32參 考 文 獻(xiàn) 33致 謝 35附 錄 361 前言 研究背景及意義手寫字母識(shí)別技術(shù)是光學(xué)字符識(shí)別(Optical Character Recognition ,簡稱OCR)的一個(gè)分支,字母識(shí)別的研究背景要追溯到早期的光學(xué)識(shí)別技術(shù),距今已有40多年的發(fā)展歷史。早在60—70年代,世界各國就開始有關(guān)于OCR的研究,而在研究的初期,多以文字的識(shí)別方法研究為主線,且識(shí)別的文字僅為0~9的數(shù)字。以同樣擁有方塊文字的日本為例子,其開始的光學(xué)字符識(shí)別技術(shù)走在世界前列,1960年左右開始研究光學(xué)字符識(shí)別的基本識(shí)別理論,在初期以數(shù)字為對(duì)象,直到1965至1970年之間開始有一些簡單的產(chǎn)品,例如印刷文字的郵政編碼識(shí)別系統(tǒng),識(shí)別郵件上的郵政編碼,幫助郵局作區(qū)域分信的作業(yè)活動(dòng);因此至到今天郵政編碼一直是各國所倡導(dǎo)的地址書寫方式。BP神經(jīng)網(wǎng)絡(luò)手寫字母識(shí)別技術(shù)的研究有著重要的意義。神經(jīng)網(wǎng)絡(luò)可以用于分類、聚類、預(yù)測(cè)等諸多領(lǐng)域。識(shí)別技術(shù)用于計(jì)算機(jī)的數(shù)據(jù)自動(dòng)輸人,早期的識(shí)別系統(tǒng)被用于大量形式多樣的數(shù)據(jù)輸人方面,比如處理汽油借記卡等。這種應(yīng)用能夠從非打印卡的賬號(hào)中辨認(rèn)購買者。早期的設(shè)備與打孔處理器一起來使用,伴隨著計(jì)算機(jī)和識(shí)別系統(tǒng)精密程度的提高。識(shí)別的瀏覽器能夠直接訪誤碼CPO,這項(xiàng)技技術(shù)也影響到了信用卡交易的付款處理的過程。目前,這些項(xiàng)應(yīng)用仍是識(shí)別領(lǐng)域最主要用途之一。英語是世界上使用人數(shù)最多的文字之一。快速高效地將字母輸人計(jì)算機(jī),是信息處理的一個(gè)關(guān)鍵問題。人工鍵入速度慢而且勞動(dòng)強(qiáng)度大,對(duì)于大量已有的文檔資料,英文自動(dòng)識(shí)別輸人就成為了最佳的選擇。它在英文信息處理、辦公室自動(dòng)化、機(jī)器翻譯、人工智能等高技術(shù)領(lǐng)域,都有著重要的實(shí)用價(jià)值和理論意義。對(duì)于印刷體字符,首先采用光學(xué)的方式將文檔資料轉(zhuǎn)換成原始黑白點(diǎn)陣的圖像文件,然后通過識(shí)別軟件將圖像中的文字轉(zhuǎn)換成文本格式,以便文字處理軟件的進(jìn)一步加工。英文字符識(shí)別是模式識(shí)別的一個(gè)重要分支,也是文字識(shí)別領(lǐng)域比較困難的問題,它涉及模式識(shí)別、數(shù)字信號(hào)處理、圖像處理、人工智能、模糊數(shù)學(xué)、計(jì)算機(jī)、信息論、中文信息處理等諸多學(xué)科,是一門綜合性的技術(shù)。近幾年來,%,為了進(jìn)一步提高系統(tǒng)的總體識(shí)別率,掃描圖像、圖像的預(yù)處理及識(shí)別后處理等方面的技術(shù)也都得到了深入的研究,并取得了很大的的進(jìn)展,有效地提高了印刷字母識(shí)別系統(tǒng)的總體性能研究英文字母識(shí)別的BP神經(jīng)網(wǎng)絡(luò)模型,最終目的就是要使BP字母識(shí)別系統(tǒng)實(shí)現(xiàn)工業(yè)化,能像現(xiàn)在的一些手寫英文字母識(shí)別系統(tǒng)或印刷體英文字母識(shí)別系統(tǒng)一樣成為產(chǎn)品走向市場(chǎng)。字母識(shí)別固然有很多難題,但是相信隨著科學(xué)計(jì)算機(jī)技術(shù)、人工神經(jīng)網(wǎng)絡(luò)技術(shù)的快速發(fā)展以及人腦功能的進(jìn)一步揭示,我們有著對(duì)BP神經(jīng)網(wǎng)絡(luò)的展望。雖然神經(jīng)網(wǎng)絡(luò)的理論研究有著廣闊的發(fā)展前景,但是每個(gè)領(lǐng)域的研究就是既充滿誘惑又充滿挑戰(zhàn). 沒有人可以肯定告訴我們它的發(fā)展不會(huì)再經(jīng)受挫折,也沒有人會(huì)知道一旦成功實(shí)現(xiàn)其最終的目標(biāo)會(huì)給世界帶來多大的巨變. 但是我們有理由相信堅(jiān)持不懈地致力于BP神經(jīng)網(wǎng)絡(luò)理論方法研究必定會(huì)給21 世紀(jì)科學(xué)研究帶來輝煌。 研究現(xiàn)狀于21世紀(jì)40年代早期人工神經(jīng)網(wǎng)絡(luò)在國外率先得到發(fā)展。下面將以時(shí)間為順序,以著名的人物或某一方面的突出研究成果為線索,簡要介紹人工神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程。在1943年,WMcculloch和WPitts通過分析、總結(jié)神經(jīng)元的特性的基礎(chǔ)上提出了神經(jīng)元的數(shù)學(xué)模型。該模型一直沿用至今,并且一直影響該領(lǐng)域研究的進(jìn)展。因而,稱二人為人工神經(jīng)網(wǎng)絡(luò)研究領(lǐng)域的標(biāo)志人物。1982年,引入了“計(jì)算能量”的概念,給出了網(wǎng)絡(luò)穩(wěn)定性判斷。 1984年,他又提出了連續(xù)時(shí)間Hopfield神經(jīng)網(wǎng)絡(luò)模型,為神經(jīng)計(jì)算機(jī)的研究做了開拓性的貢獻(xiàn),開創(chuàng)了神經(jīng)網(wǎng)絡(luò)用于聯(lián)想記憶和優(yōu)化計(jì)算的全新的途徑,有力地推動(dòng)了神經(jīng)網(wǎng)絡(luò)的研究發(fā)展,1985年,又有學(xué)者提出了波耳茲曼模型,在學(xué)習(xí)中采用統(tǒng)計(jì)熱力學(xué)模擬退火技術(shù),保證整個(gè)系統(tǒng)趨于全局的穩(wěn)定點(diǎn)在日本的“真實(shí)世界計(jì)算”項(xiàng)目中,人工智能的研究成了一個(gè)重要的組成部分。[1] 我國在識(shí)別領(lǐng)域的研究起步較晚,在20世紀(jì)70年代才開始對(duì)符號(hào)、字母、數(shù)字進(jìn)行識(shí)別研究,對(duì)漢字的識(shí)別研究開始于70年代末期,到86年我國漢字的識(shí)別研究進(jìn)人一個(gè)跨越性的時(shí)期,并取得了豐碩成果,并相繼推出了許多中文識(shí)別的實(shí)用產(chǎn)品。我國的許多研究部門在80年代初期就開始對(duì)字符識(shí)別進(jìn)行研究,從80年代開始,神經(jīng)網(wǎng)絡(luò)的識(shí)別研究開發(fā)就一直受到國家“863”計(jì)劃的資助與支持,并已經(jīng)有了初步的回報(bào)。排列瀏覽方法以及高速計(jì)算機(jī)的出現(xiàn),產(chǎn)生了圖像處理過程這一概念?!皥D像處理過程”并不要求BP識(shí)別成功地派上用場(chǎng),例如,BP神經(jīng)網(wǎng)絡(luò)系統(tǒng)將文件轉(zhuǎn)變成電子數(shù)字條目的能力,將有效地取代顯微膠片。相對(duì)于處理現(xiàn)實(shí)中的文件式顯微膠片的圖片,這種系統(tǒng)能力為用戶提供了更方便地整理圖像的方法。當(dāng)通過上述的排列瀏覽方法生成識(shí)別邏輯單元后,圖像處理可以采用“離線”方式而不是過去的實(shí)時(shí)方式。這是區(qū)別早期識(shí)別系統(tǒng)的最大的優(yōu)點(diǎn),現(xiàn)在的識(shí)別系統(tǒng)能夠允許強(qiáng)有力的邏輯系統(tǒng)持續(xù)工作,并不再對(duì)要瀏覽的字符的大小字體及數(shù)據(jù)位置兩方面信息作出的要求。譬如金融服務(wù)業(yè)的支票處理服務(wù)的“便捷圖像數(shù)據(jù)辨別”就是這樣的。 手寫字母識(shí)別方法英文字母的結(jié)構(gòu)表達(dá)形式和相應(yīng)的單詞形成方法有多種,每種結(jié)構(gòu)形式又可以選擇不同的特征,并且特征有不同的抽取方法,這樣識(shí)別算法、標(biāo)準(zhǔn)、舉學(xué)工具也不相同,這就造成了英文字母識(shí)別的算法種類繁多,結(jié)構(gòu)不盡相同。因此,不同特征提取特征和神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)方法決定了識(shí)別系統(tǒng)所用得處理方法。通??梢苑譃榻y(tǒng)計(jì)模式方法、結(jié)構(gòu)模式方法、統(tǒng)計(jì)與結(jié)構(gòu)相結(jié)合的方法和人工神經(jīng)網(wǎng)絡(luò)方法. 結(jié)