freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文-印刷體漢字識別技術(shù)的研究-資料下載頁

2025-01-16 18:11本頁面
  

【正文】 支持向量機與神經(jīng)網(wǎng)絡(luò)的學習方法相比,支持向量機具有以下特點 : ( 1)支持向量機是基于結(jié)構(gòu)風險最小化原則,保證學習機器具有良好的泛化能力 。 ( 2)解決了算法復雜度與輸入向量密切相關(guān)的問題 。 ( 3)通過引用核函數(shù),將輸入空間中的非線性問題映射到高維特征空間中在高維空間中構(gòu)造線性函數(shù)判別 。 ( 4)支持向量機是以統(tǒng)計學理論為基礎(chǔ)的,與傳統(tǒng)統(tǒng)計 學習理論不同。它主要是針對小樣本情況,且最優(yōu)解是基于有限的樣本信息,而不是樣本數(shù)趨于無窮大時的最優(yōu)解 。 ( 5)算法可最終轉(zhuǎn)化為凸優(yōu)化問題,因而可保證算法的全局最優(yōu)性,避免了神經(jīng)網(wǎng)絡(luò)無法解決的局部最小問題 。 ( 6)支持向量機有嚴格的理論和數(shù)學基礎(chǔ),避免了神經(jīng)網(wǎng)絡(luò)實現(xiàn)中的經(jīng)驗成分。 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 18 本章小結(jié) 本章對印刷體漢字識別技術(shù)的理論部分進行了較為全面和詳細的研究,論述了漢字在識別過程中各個組成部分基本的運作原理,并對多種識別方法進行了簡要的論述及比較。文字的識別方法主要分為結(jié)構(gòu)模式識別、統(tǒng)計模式識別、人工神經(jīng) 網(wǎng)絡(luò)三種方法。其中結(jié)構(gòu)模式識別方法主要是早期文字識別的主要方法,隨著統(tǒng)計理論的發(fā)展,統(tǒng)計模式識別方法逐漸成為文字識別主要的研究力法。近年來,人工神經(jīng)網(wǎng)絡(luò)發(fā)展迅猛,它模擬人腦的活動方式,更符合人們的思維習慣。但它的建模比較復雜,而且運算量大。在印刷體漢字識別中采用有一定的難度,還需進一步改進和簡化。 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 19 4 系統(tǒng)的 Matlab 仿真 系統(tǒng)的分析 本設(shè)計要實現(xiàn)的是一個能識別三十二個印刷體漢字的識別系統(tǒng)。由于字庫容量較小,因此本設(shè)計對系統(tǒng)的預(yù)期識別率指標定為 100%。 印刷體漢字 識別系統(tǒng)采用的是十三點特征提取法和神經(jīng)網(wǎng)絡(luò)識別相結(jié)合的原理。十三點特征提取法負責提取漢字中的特征點,形成一個 131? 的向量,作為神經(jīng)網(wǎng)絡(luò)的輸入,我們可以實現(xiàn)一個標準庫神經(jīng)網(wǎng)絡(luò),由于不同的漢字對應(yīng)的特征向量不同,當輸入相應(yīng)的特征向量就輸出對應(yīng)的漢字。 印刷品上的漢字輸入,經(jīng)過預(yù)處理后,對照標準漢字修補缺損部分,用修補后的漢字進行學習,形成初始的特征庫后再進行大量樣本的學習,建立實用的特征庫。系統(tǒng)在識別過程中可進行自學習。取標準漢字,對每一漢字計算特征向量。所有按一定的順序排 列,建立每一漢字與其國標碼指針。對神經(jīng)網(wǎng)絡(luò)設(shè)置其初始權(quán)值,選取大量的標準漢字訓練網(wǎng)絡(luò),反復修改權(quán)值,直至與面積序號對應(yīng)的輸出為有效,并建立每一輸出與面積特征庫之間的連接關(guān)系。以后隨著學習過程的進行,將建立動態(tài)調(diào)整面積特征庫與神經(jīng)網(wǎng)絡(luò)之間的對應(yīng)關(guān)系。系統(tǒng)共包含五個子功能模塊(見圖 )。 圖 印刷體漢字識別系統(tǒng)功能模塊 印刷體漢字識別 系統(tǒng) 掃描 預(yù)處理 學習 識別 輸出 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 20 圖 印刷體漢字識別工作流程圖 系統(tǒng)的工作流程如圖 ,文件首先由文件管理器加載。送入圖像管理模塊,經(jīng)二值化,轉(zhuǎn)灰度,均值濾波,二值化,行、字切割等圖像處理操作后,得到待識別文字的點陣,漢字識別模塊從點陣中提取識別特征,通過十三點特征提取,精確匹配識別結(jié)果。 . 系統(tǒng)的實現(xiàn) 此次采用 MATLAB進行系統(tǒng)仿真( Matlab 仿真程序見參考附錄 1),其中學習功能使用 sim函數(shù)實現(xiàn),特征提取用十三點特征提取法。 y = sim( , P_test); %用訓練出來的神經(jīng)網(wǎng)絡(luò)計算數(shù)據(jù)的第 P_test行;其中 是 SIMULINK的模型名 ( 神經(jīng)網(wǎng)絡(luò)的對象見參考附錄 2) ; P_test 是用來測試數(shù)據(jù)的外部輸入向量。 特征提取 本系統(tǒng)采用的是十三點特征提取法,首先把字符平均分成 8份(如圖 ),統(tǒng)計每一份內(nèi)黑色像素的個數(shù)作為其中的前 8個特征,然后分為 1 3和 3 1兩種情況,分別統(tǒng)計水平方向中間兩列和豎直方向兩列的黑像素點的個數(shù)作為接下來的 4個特征,最后統(tǒng)計整個字符中所有黑色像素的個數(shù)作為第十三個特征,從而一共得到了關(guān)于該字符的 13個特征。也就是說,現(xiàn)將字符分成 8等分,得到 8個特征。再畫 4道線,統(tǒng)計穿過的黑色像素的數(shù)目,可以得 到 4個特征。最后,將字符圖像的全部黑色像素的數(shù)目的總和作為 1個特征。十三點特征提取法有著極好的適應(yīng)性,能大大縮短識別時間并提高識別率。但是由于特征點的數(shù)目太少,所以在樣本訓練的時候難收斂。漢字圖像 預(yù)處理 漢字識別 識別結(jié)果 轉(zhuǎn)灰度圖像 均值濾波 列分割 二值化 加載特征庫 特征提取 特征匹配 行分割 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 21 圖 十三點特征提取分塊 十三點特征所產(chǎn)生的數(shù)據(jù)形成一個矢量作為神經(jīng)網(wǎng)絡(luò)的輸入,此數(shù)據(jù)用于神經(jīng)網(wǎng)絡(luò)的訓練和識別過程(十三點特征提取的程序見參考附錄 1)。 BP 神經(jīng)網(wǎng)絡(luò)的建立 BP 神經(jīng)網(wǎng)絡(luò)的建立要考慮索要建立標準庫的大小,先確定標準庫 的大小,然后確定輸入向量中元素的最小個數(shù),即所要提取特征點的最少個數(shù)。這里我們只簡單建立一個具有 32個字的標準庫,我們所提取的特征點是 13個,這對于具有 32個字的標準庫來說足夠了。 神經(jīng)網(wǎng)絡(luò)輸出向量中的元素個數(shù)由我們的標準庫中字符的個數(shù)確定,由于所要建立的標準庫字符的個數(shù)是 32,并且因為計算機語言只能識別 0和 1這二個值,所以神經(jīng)網(wǎng)絡(luò)輸出向量中最少有 5 個元素才能搭配出 32個不同的數(shù)值。神經(jīng)網(wǎng)絡(luò)的建立可以參見以下程序: =newff( minmax( P) ,[50,40,5],{39。tansig39。,39。tansig39。,39。tansig39。},39。traingd39。) 。 其中 P是神經(jīng)網(wǎng)絡(luò)的輸入向量, {39。tansig39。,39。tansig39。,39。tansig39。}是包含每層用到的傳遞函數(shù)名稱的細胞數(shù)組。 39。traingd39。是用到的訓練函數(shù)的名稱。 神經(jīng)網(wǎng)絡(luò)建立后,需要對神經(jīng)網(wǎng)絡(luò)進行訓練以產(chǎn)生標準庫。訓練程序及訓練參數(shù)如下: =100。 %每 100 顯示 1次 =。 %設(shè)置學習速率 =30000。 %設(shè)置訓練次數(shù) =0。 %設(shè)置性能函數(shù)(訓練要求精度) =train( ,P,T) 。 %訓練 BP 網(wǎng)絡(luò)( P為輸入, T為輸出) save zmn123 %保存文件名為 zmn123 BP 神經(jīng)網(wǎng)絡(luò)的訓練 下圖(見圖 )是輸出向量和輸入向量都為三十二個元素的 BP 神經(jīng)網(wǎng)絡(luò)的訓練著 著 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 22 誤差,最終 誤差是 ,誤差較大并不理想。 圖 三十二輸出元素系統(tǒng)的訓練誤差曲線 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 23 圖 五輸出元素系統(tǒng)的訓練誤差曲線 上圖(圖 )是輸出向量為五個元素和輸入向量為三十二個元素的 BP 神經(jīng)網(wǎng)絡(luò)的訓練誤差,最終訓練誤差是 ,由此觀之,輸出向量含有五個元素的 BP 神經(jīng)網(wǎng)絡(luò)識別誤差更小一些,在可接受范圍之內(nèi),本系統(tǒng)可以采用。 系統(tǒng)的仿真 系統(tǒng)首先對標準圖像(見圖 )進行識別,運行程序后識別過程分別進行轉(zhuǎn)灰度(見圖 ),均值濾波(見圖 ),二值化(見圖 ),經(jīng)行列切分后得到處理結(jié)果(見圖 ),最后在命令窗口輸出識別結(jié)果(見圖 )。 圖 標準圖像 圖 標準轉(zhuǎn)灰度圖像 圖 標準均值濾波圖像 圖 標準二值化圖像 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 24 圖 標準圖像處理結(jié)果 圖 標準圖像識別結(jié)果 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 25 基于這個已建立的標準庫,我們通過 Matlab 程序仿真結(jié)果得知,此系統(tǒng)經(jīng)過自學習后對標準圖像中漢字的識別率是 100%,系統(tǒng)的技術(shù)指標符合我們的預(yù)期。 通過對標準圖像識 別學習訓練,然后再對輸入亂序圖像(見 )進行識別,運行程序后識別過程中分別進行轉(zhuǎn)灰度(見圖 ),均值濾波(見圖 ),二值化(見圖 ),經(jīng)行列切分后得到處理結(jié)果(見圖 ),最后在命令窗口輸出識別結(jié)果(見圖 )。 圖 亂序圖像 圖 亂序轉(zhuǎn)灰度圖像 圖 亂序均值濾波圖像 圖 亂序二值化圖像 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 26 圖 亂序圖像處理結(jié)果 圖 亂序圖像識別結(jié)果 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 27 基于這個已建立的標 準庫,我們通過 Matlab 程序仿真結(jié)果得知,此系統(tǒng)對亂序圖像的漢字也能 100%識別,初步驗證了本系統(tǒng)具有一定高度的識別率。 系統(tǒng)性能的進一步驗證 但由于本系統(tǒng)設(shè)定的字庫容量較小僅為三十二個字,即使以上漢字都能夠一一識別也并不能完全證明本系統(tǒng)具有較高的識別率。因此,為了進一步驗證本系統(tǒng)的性能,下面我們將采用一組總數(shù) 32個字的相似字圖片讓系統(tǒng)對其進行識別,標準庫的建立及識別過程同第一組漢字圖片的識別方法。 我們首先建立一個相似字的標準庫,并對其 BP 神經(jīng)網(wǎng)絡(luò)進行訓練。下圖(見圖)是輸出向量 為五個元素和輸入向量為三十二個元素的 BP 神經(jīng)網(wǎng)絡(luò)的訓練誤差,最終誤差是 。 圖 相似字誤差曲線 通過對相似字 BP神經(jīng)網(wǎng)絡(luò)的訓練我們得知,此網(wǎng)絡(luò)的識別誤差也非常小,可以進行下一步的識別工作。 然后我們對相似字標準圖像進行識別。運行程序后首先載入相似字標準的圖片(見圖 ),然后依次得到轉(zhuǎn)灰度圖片(見圖 ),均值濾波圖片(見圖 ),二值化圖片( ),經(jīng)行列切分后得到處理結(jié)果( )及命令窗口輸出的識別結(jié)果( ) 。 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 28 圖 相似字標準圖像 圖 相似字標準轉(zhuǎn)灰度圖像 圖 相似字標準均值濾波圖像 圖 相似字標準二值化圖像 圖 相似字標準圖像處理結(jié)果 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 29 圖 相似字標準圖像識別結(jié)果 通過 Matlab 程序仿真結(jié)果得知,此系統(tǒng)對相似字標準圖像中漢字的識別率是 100%,依然符合我們的預(yù)期。通過對相似字標準圖像的學習訓練之后,我們再對相似字亂序圖像進行識別。 運行程序后首先載入相似字亂序的圖片(見圖 ),然后依次得到 轉(zhuǎn)灰度圖片(見圖 ),均值濾波圖片(見圖 ),二值化圖片( ),經(jīng)行列切分后得到處理結(jié)果( )及命令窗口輸出的識別結(jié)果( )。 圖 相似字亂序圖像 圖 相似字亂序轉(zhuǎn)灰度圖像 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 30 圖 相似字亂序均值濾波圖像 圖 相似字亂序二值化圖像 圖 相似字亂序圖像處理結(jié)果 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學院 電氣與電子工程學院 畢業(yè)論文 31 圖 相似字亂序圖像識別結(jié)果 我們通過 Matlab 程序仿真結(jié)果得知,此系統(tǒng)對相似字亂序圖像 的漢字也能 100%識別,進一步證明了本系統(tǒng)具有卓越的性能。 仿真結(jié)果分析 由第一組圖像的仿真結(jié)果可以看出,當輸入標準圖像,經(jīng)過轉(zhuǎn)灰度,均值濾波,二值化,識別輸出。然后輸入亂序圖像在經(jīng)過轉(zhuǎn)灰度,均值濾波,二值化,特征提取,匹配識別后,系統(tǒng)能夠?qū)y序圖像中的圖像識別出。說明系統(tǒng)基本實現(xiàn)預(yù)先設(shè)想的功能,能夠在學習標準圖像識別后建立標準庫,并根據(jù)標準字庫與以后的輸入圖像進行匹配識別輸出。并且本系統(tǒng)的結(jié)構(gòu)雖然并不復雜,但識別率并未因此降低,經(jīng)過對第二組圖像的仿真,我們發(fā)現(xiàn)了本系統(tǒng)對相似字也能進行很好的識別 ,進一步證明了本系統(tǒng)卓越的識別率。經(jīng)過兩組實驗的數(shù)據(jù)顯示,本系統(tǒng)能夠?qū)嶒炈玫牡臐h字 100%的識別,說明本系統(tǒng)采用的算法有一定的實用價值。但程序的自動適應(yīng)能力有限,二值化和均值濾波參數(shù)不能很好的對文字圖像的像素值進行判別 ,部分漢字被處理后可能會出現(xiàn)出現(xiàn)特征丟失的情況。 通過以上分析得出的結(jié)論為:本文所應(yīng)用的識別技術(shù)可以識別漢字,且具有相對較高的識別率。但本系統(tǒng)仍有一些技術(shù)薄弱環(huán)節(jié)可繼續(xù)改進,一
點擊復制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1