freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫體數(shù)字識別的軟件設(shè)計畢業(yè)設(shè)計論文資料-wenkub

2023-07-08 05:06:42 本頁面
 

【正文】 :基于結(jié)構(gòu)特征的方法和基于統(tǒng)計特征的方法[15]。而且數(shù)字識別經(jīng)常涉及到財務(wù)、金融領(lǐng)域,其嚴(yán)格性更是不言而喻的??偨Y(jié)數(shù)字識別的難點主要在于以下幾方面:1) 阿拉伯?dāng)?shù)字的字型信息量很小,不同數(shù)字寫法字形相差又不大,使得準(zhǔn)確區(qū)分某些數(shù)字相當(dāng)困難[11]。從上世紀(jì)90年代開始,一些研究者已經(jīng)將隱馬爾科夫模型引入到了圖像處理、識別和分析中來。2) 支持向量機是Vapnik 等人根據(jù)統(tǒng)計學(xué)理論提出的一種新型機器學(xué)習(xí)方法。1929年,有德國人Tausheck首先正式提出OCR概念,并取得了OCR專利權(quán),四年后美國人Handel也取得了同樣的專利權(quán)[4]。很多ANN模型和算法都是以手寫體數(shù)字識別作為實驗測試平臺,驗證其理論的有效性,評價各種方法各自的優(yōu)缺點。3) 手寫數(shù)字識別被應(yīng)用到郵件分揀系統(tǒng)中[3]。此外,手寫數(shù)字識別應(yīng)用領(lǐng)域還有:1) 手寫數(shù)字識別被應(yīng)用在大規(guī)模數(shù)據(jù)統(tǒng)計中。當(dāng)今經(jīng)濟(jì)的發(fā)展,金融市場化進(jìn)程的日益加快,票據(jù)業(yè)務(wù)發(fā)展很快,票據(jù)數(shù)量也與日俱增。所以聯(lián)機識別的已經(jīng)投入使用,但是對于脫機識別由于其技術(shù)限制,以至其到現(xiàn)在還沒有大范圍的應(yīng)用。國內(nèi)專門做識別技術(shù)成果比較好的是漢王公司,該公司的識別軟件對各種字符識別率已經(jīng)很不錯。近二十年來,國內(nèi)外對各種字符進(jìn)行了廣泛深入的研究,研究出了許多非常有效的識別算法,與此同時用于各種字符識別的應(yīng)用軟件也越來越豐富。它屬于模式識別、人工智能的一個重要分支,涉及到模式識別和圖像處理、人工智能、統(tǒng)計決策理論、模糊數(shù)學(xué)、組合數(shù)學(xué)、信息論、計算機等學(xué)科;同時也涉及心理學(xué)等,是介于基礎(chǔ)研究與應(yīng)用研究之間的一門綜合性的技術(shù)[2],在辦公室、機器翻譯等方面具有重大實用意義。 and objecting to the defection of traditional methods of structural point detection, a solution to the problem was put up in this article. In addition, this paper also raises the convexconcave feature as one of the character feature vectors.Through the NIST test data, experimental data shows that the digital identification system designed for handwritten numeral recognition has a high recognition rate.Keywords: Handwritten numeral recognition, Character feature vectors, Binarization algorithm, Convexconcave feature中北大學(xué)2009屆畢業(yè)設(shè)計說明書目 錄1 緒論 1 字符識別概述 1 手寫數(shù)字識別的意義和應(yīng)用前景 2 字符識別的研究與發(fā)展 3 手寫數(shù)字識別的難點 3 國內(nèi)外研究現(xiàn)狀 4 手寫體數(shù)字識別系統(tǒng)概述 5 本文內(nèi)容安排 62 手寫體數(shù)字識別中預(yù)處理技術(shù) 8 平滑去噪 8 二值化 10 歸一化 16 傾斜校正 20 細(xì)化 223 手寫體數(shù)字識別中串切分技術(shù) 25 切分方法概述 25 手寫數(shù)字串常用方法簡介 25 投影法的直線切分 25 滴水算法 26 動態(tài)規(guī)劃算法 26 滑動窗口法 26 多模具切分法 26 本文手寫數(shù)字串切分方法介紹 274 手寫體數(shù)字識別中特征值提取技術(shù) 29 特征提取概述 29 手寫體字符特征提取方法概述 30 手寫體數(shù)字識別中的結(jié)構(gòu)特征提取 32 結(jié)構(gòu)點特征 32第 Ⅰ 頁 共 Ⅱ 頁 穿越密度特征 34 投影特征 35 手寫體數(shù)字識別中的統(tǒng)計特征提取 36 重心矩特征 36 粗網(wǎng)格特征 36 水平、垂直投影特征 37 環(huán)凸凹特征 38 全局Kirsh邊緣方向特征 395 人工神經(jīng)網(wǎng)絡(luò)分類器 41 人工神經(jīng)網(wǎng)絡(luò)概述 41 BP神經(jīng)網(wǎng)絡(luò)概述 42 本文的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計 446 系統(tǒng)實現(xiàn)與結(jié)果分析 47 系統(tǒng)實現(xiàn) 47 系統(tǒng)實現(xiàn)環(huán)境 47 系統(tǒng)處理過程圖 47 結(jié)果分析 487 結(jié)束語 50附錄:NIST樣本庫的文件結(jié)構(gòu) 51參 考 文 獻(xiàn) 52致 謝 54第 Ⅱ 頁 共 Ⅱ 頁中北大學(xué)2009屆畢業(yè)設(shè)計說明書1 緒論 字符識別概述光學(xué)字符識別(Optical Character Recognition,簡稱OCR)是20世紀(jì)20年逐步發(fā)展起來的一門自動化技術(shù),是圖像處理與模式識別領(lǐng)域的一個重要分支[1]。本文中對幾種常見的二值化算法進(jìn)行比較,并最終選擇基于梯度的二值化算法;在本文中,提出了一種方法來解決結(jié)構(gòu)點檢測的傳統(tǒng)方法的缺陷。畢業(yè)設(shè)計說明書手寫體數(shù)字識別的軟件設(shè)計電子與計算機科學(xué)技術(shù)學(xué)院學(xué)生姓名: 學(xué)號: 計算機科學(xué)與技術(shù)專業(yè)學(xué) 院: 專 業(yè): 指導(dǎo)教師: 2009年 6月手寫體數(shù)字識別的軟件設(shè)計 摘 要手寫體數(shù)字識別是利用機器或計算機自動辨認(rèn)手寫體阿拉伯?dāng)?shù)字的一種技術(shù),是光學(xué)字符識別技術(shù)的一個分支。另外本文還提出將一般用來直接識別字符的凸凹特征作為字符的特征向量之一。其目的就是通過掃描、攝像等光學(xué)輸入方式將漢字報刊、書籍、文稿及其它印刷品的文字轉(zhuǎn)化為圖像信息,將圖形、表格的圖像進(jìn)行保存,再利用文字識別技術(shù)將圖像內(nèi)的文字或表格中的資料一律變成計算機能識別的文字,以便于計算機的管理維護(hù)。手寫體數(shù)字的識別是人們研究較為深入的一個領(lǐng)域。 字符識別可以分為兩個大類,文字識別和數(shù)字識別。相對于聯(lián)機手寫體數(shù)字識別技術(shù),脫機手寫體數(shù)字識別技術(shù)識別率相對要低,而且在生活實際應(yīng)用得到很多應(yīng)用(例如:手機手寫輸入,手寫板等都是基于聯(lián)機識別)。雖然脫機手寫體數(shù)字識別難度較大,識別率較低,但是比起聯(lián)機手寫體數(shù)字識別來說,脫機手寫體數(shù)字識別不要求書寫者在特定的輸入設(shè)備上書寫,它可以與平常一樣書寫,所以脫機手寫體數(shù)字識別的應(yīng)用更為廣泛,如郵政編碼、統(tǒng)計報表、財務(wù)報表、銀行票據(jù)、學(xué)生成績、車牌號碼等。其中個人憑證,支票,發(fā)票,進(jìn)賬單等等票據(jù)均需要處理大量的信息。例如:人口普查、成績單錄入、行業(yè)年檢、財務(wù)報表錄入等應(yīng)用中。由上可見,對手寫體數(shù)字識別有著很高的實用價值,除此之外,手寫體數(shù)字識別作為模式識別領(lǐng)域的一個重要問題,也有著重要的理論價值:1) 阿拉伯?dāng)?shù)字是唯一的被世界各國通用的符號,對于手寫體數(shù)字識別的研究基本上與文化背景無關(guān),這樣就為世界各國研究者提供了一個供大家共同探討技術(shù)的平臺,研究并比較各種算法的優(yōu)缺點。3) 盡管人們對手寫體數(shù)字識別已經(jīng)從事了很長時間的研究,并取得了一定的成果,但是到目前為止,機器識別本領(lǐng)與人的認(rèn)知能力相比,還是有很大的差距。但真正OCR是在本世紀(jì)50年代隨著計算機的出現(xiàn)而到來的。由于其出色的學(xué)習(xí)性能,該技術(shù)已成為機器學(xué)習(xí)界的研究熱點,并在很多領(lǐng)域都得到了成功的應(yīng)用,如人臉識別、手寫體數(shù)字識別、文本自動分類等。 手寫數(shù)字識別的難點雖然,人們對字符識別的研究有百余年,并在字符識別取得了可喜的成績(其漢字識別也越來越多的應(yīng)用到實際應(yīng)用中),然而字符識別的一個分支——數(shù)字識別的研究卻離實際應(yīng)用還有一定差距。2) 數(shù)字雖然只用10種,而且筆畫簡單,但書寫上帶有明顯的地域特性,同一數(shù)字寫法千差萬別,不同地域的人寫法也不相同,所以很難做到兼顧各種寫法的極高識別率的通用型數(shù)字識別系統(tǒng)[12]。因此,對手寫數(shù)字識別系統(tǒng)的要求不僅僅是單純的高正確率,更重要的是極低的誤識率。通過幾十年來各國研究學(xué)者得對數(shù)字識別的研究,國內(nèi)外在手寫識別上也取得了一定的成就。清華大學(xué)采用SVM對金融票據(jù)中的手寫體數(shù)字進(jìn)行識別,測試樣本20000個,識別率約為92%。但是就一般情況看,一個完整的OCR識別系統(tǒng)可分為:原始圖像獲取,預(yù)處理,特征抽取,分類識別和判別處理等模塊。對于字符識別的預(yù)處理過程一般包括:濾波去噪、二值化、字符切分、圖像校正、歸一化處理。具體方法可以詳見第二章。3) 分類識別階段分類識別是數(shù)字識別的關(guān)鍵步驟之一,它是指分類器依據(jù)特征提取階段抽取的特征,就送入分類器中做最后的字符分類識別。4) 判別處理階段當(dāng)分類完成后,為了保持系統(tǒng)的識別性能,通常需要對識別結(jié)果作一次判別處理,認(rèn)為該結(jié)果是否被接收還是拒絕。我們將對原始獲取的數(shù)字圖像(以及模擬一個簡單的寫字板)進(jìn)行識別。第二章:主要是研究手寫體數(shù)字識別中的預(yù)處理技術(shù)。本章將對當(dāng)前無約束手寫體數(shù)字串的切分技術(shù)進(jìn)行概述,最后詳細(xì)介紹本文采用的手寫體數(shù)字串的切分方法。由于單一的特征對數(shù)字的描述有一定的局限性,因此本文將采用多特征組合的特征向量作為字符的描述特征值來識別數(shù)字。初步介紹本文采用的BP神經(jīng)網(wǎng)絡(luò),并給出本文采用的學(xué)習(xí)算法和訓(xùn)練算法。如果預(yù)處理處理得不夠理想,會從很大程度上降低整個系統(tǒng)的識別率。 平滑去噪數(shù)字圖像的噪聲主要來源于圖像的獲取(數(shù)字化過程)。噪聲對于圖像的預(yù)處理非常重要,它會影響圖像處理的輸入、采集、處理各個環(huán)節(jié)和識別結(jié)果的全過程。濾波去噪的方法可以簡單分為兩類:頻域濾波和空間域濾波。輸出圖像的每一個像素的取值都是根據(jù)模板對輸入像素相應(yīng)領(lǐng)域內(nèi)的像素值進(jìn)行計算得到的。圖中M點像素的灰度等于其領(lǐng)域內(nèi)9個(A0~A7,M)像素灰度值的中間值。但是本文在對圖片進(jìn)行二值化處理中,后期將采用基于梯度的二值化處理,在梯度二值化處理中需要采用拉普拉斯變換提取邊緣特征,而拉普拉斯變換對噪聲特別敏感,因此我將會采用高斯濾波器對圖像進(jìn)行濾波,然后再采用高斯拉普拉斯提取邊緣信息。因此高斯平滑濾波器與圖像簡單平滑不同的是,它在對領(lǐng)域內(nèi)像素灰度進(jìn)行平均時,給與了不同位置的像素不同的權(quán)值。 二值化二值圖像是指整幅圖像頁面內(nèi)僅有黑(像素值為0),白(像素值為1)的二值圖像。另一方面,在某些情況下即使圖像本身是有灰度的,也將其轉(zhuǎn)換成二值圖像再處理。圖像的二值化可以根據(jù)下面的閾值來處理:假設(shè)一幅原始圖像的像素值p(i,j)的取值范圍為[0,m],那么設(shè)有其閾值為T=t,0tm,則映射成新的二值圖像的像素值p’(i,j)為: ()對于基于灰度分布的二值化就是一個帶閾值T的二值映射過程,其分割效果的關(guān)鍵在于閾值T的選取。1) 整體閾值法(又稱全局閾值法)僅由像素點(i,j)的灰度值p(i,j)確定閾值的方法稱為整體閾值選擇法。對于書寫質(zhì)量差,干擾較嚴(yán)重的字符,采用整體閾值法二值化,效果不太理想,局部閾值法有可能得到較為滿意的二值化結(jié)果。[16]進(jìn)行分割的結(jié)果。鑒于在實際中,由于數(shù)字圖像的獲取階段由于紙張不平整、反射光不均勻、光照不均勻所導(dǎo)致而得到的數(shù)字圖像其目標(biāo)圖像和背景圖像灰度整體沒有一個明顯a) 原始圖像c) 采用基于OTSU的二維最大類間方差閾值分割的改進(jìn)算法分割效果b) 采用一維直方圖自動閥值分割效果 基于灰度分布的二值化的界限,而基于梯度信息的二值化算法能很好的對光照不均的數(shù)字圖像進(jìn)行二值化,因此本文采用的是基于梯度信息(邊緣)的二值化算法,對圖像進(jìn)行二值化處理。對于基于一階導(dǎo)數(shù)的算子可以檢測圖像中的一個點是否是邊緣點(也就是判斷一個點是否在斜坡上)。后面我們可以看到本文采用的基于梯度閾值分割的算法就是基于上述兩條二階導(dǎo)數(shù)性質(zhì)實現(xiàn)的。因此經(jīng)常使用一種方法是用絕對值對梯度進(jìn)行近似: ()這個公式在計算方面更有吸引力,而且它仍保持著同灰度級的相對變化。2) 確定一個像素是在一條邊緣暗的一邊還是亮的一邊。H的拉普拉斯算子(h關(guān)于r的二階導(dǎo)數(shù))是: ()這個公式一般叫做高斯型的拉普拉斯算子。在基于以上知識,接下來詳細(xì)介紹本文采用文獻(xiàn)[17]的閾值分割算法,其詳細(xì)步驟如下:輸入: 經(jīng)過高斯平滑濾波器濾波后的數(shù)字圖像作為閾值分割的輸入數(shù)字圖像處理。Step3:采用高斯型拉普拉斯算子對輸入數(shù)字圖像進(jìn)行計算,獲取各個像素的二階梯度信息▽2f。對象內(nèi)部的像素不是標(biāo)記為‘0’就是標(biāo)記為‘1’。沿著相同的掃描線除了那些被(2,1)和(1,2)包圍著的(0或1)的序列外,所有其它點都標(biāo)記為0(背景)。,三種算法的效果比較。由于人們在書寫、設(shè)備使用焦距不同等原因可以導(dǎo)致獲取后的數(shù)字圖像字符的大小不一。歸一化算法有:線性歸一化、非線性歸一化和矩歸一化。然而,在縱橫比歸一化中,標(biāo)準(zhǔn)平面未必總能填滿。 如果歸一化后的圖像填滿了一個方向,則Max(W2,H2)=L。設(shè)圖像的中心為P(xc,yc),則圖像重心計算如下: ()其中,設(shè)圖像的標(biāo)準(zhǔn)平面中心為Q(,),則有: ()設(shè)原圖像的長寬分別為:W1和H1,那么如果α,β表示縱橫比,通過下面公式定義: ()那么設(shè)(x,y),(,)分別表示原圖像的坐標(biāo)和歸一化后圖像的坐標(biāo),那么則有:
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1