freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文-印刷體漢字識別技術(shù)的研究(參考版)

2025-01-19 18:11本頁面
  

【正文】 但本系統(tǒng)仍有一些技術(shù)薄弱環(huán)節(jié)可繼續(xù)改進(jìn),一是程。但程序的自動適應(yīng)能力有限,二值化和均值濾波參數(shù)不能很好的對文字圖像的像素值進(jìn)行判別 ,部分漢字被處理后可能會出現(xiàn)出現(xiàn)特征丟失的情況。并且本系統(tǒng)的結(jié)構(gòu)雖然并不復(fù)雜,但識別率并未因此降低,經(jīng)過對第二組圖像的仿真,我們發(fā)現(xiàn)了本系統(tǒng)對相似字也能進(jìn)行很好的識別 ,進(jìn)一步證明了本系統(tǒng)卓越的識別率。然后輸入亂序圖像在經(jīng)過轉(zhuǎn)灰度,均值濾波,二值化,特征提取,匹配識別后,系統(tǒng)能夠?qū)y序圖像中的圖像識別出。 圖 相似字亂序圖像 圖 相似字亂序轉(zhuǎn)灰度圖像 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 30 圖 相似字亂序均值濾波圖像 圖 相似字亂序二值化圖像 圖 相似字亂序圖像處理結(jié)果 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 31 圖 相似字亂序圖像識別結(jié)果 我們通過 Matlab 程序仿真結(jié)果得知,此系統(tǒng)對相似字亂序圖像 的漢字也能 100%識別,進(jìn)一步證明了本系統(tǒng)具有卓越的性能。通過對相似字標(biāo)準(zhǔn)圖像的學(xué)習(xí)訓(xùn)練之后,我們再對相似字亂序圖像進(jìn)行識別。運行程序后首先載入相似字標(biāo)準(zhǔn)的圖片(見圖 ),然后依次得到轉(zhuǎn)灰度圖片(見圖 ),均值濾波圖片(見圖 ),二值化圖片( ),經(jīng)行列切分后得到處理結(jié)果( )及命令窗口輸出的識別結(jié)果( ) 。 圖 相似字誤差曲線 通過對相似字 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練我們得知,此網(wǎng)絡(luò)的識別誤差也非常小,可以進(jìn)行下一步的識別工作。 我們首先建立一個相似字的標(biāo)準(zhǔn)庫,并對其 BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。 系統(tǒng)性能的進(jìn)一步驗證 但由于本系統(tǒng)設(shè)定的字庫容量較小僅為三十二個字,即使以上漢字都能夠一一識別也并不能完全證明本系統(tǒng)具有較高的識別率。 通過對標(biāo)準(zhǔn)圖像識 別學(xué)習(xí)訓(xùn)練,然后再對輸入亂序圖像(見 )進(jìn)行識別,運行程序后識別過程中分別進(jìn)行轉(zhuǎn)灰度(見圖 ),均值濾波(見圖 ),二值化(見圖 ),經(jīng)行列切分后得到處理結(jié)果(見圖 ),最后在命令窗口輸出識別結(jié)果(見圖 )。 系統(tǒng)的仿真 系統(tǒng)首先對標(biāo)準(zhǔn)圖像(見圖 )進(jìn)行識別,運行程序后識別過程分別進(jìn)行轉(zhuǎn)灰度(見圖 ),均值濾波(見圖 ),二值化(見圖 ),經(jīng)行列切分后得到處理結(jié)果(見圖 ),最后在命令窗口輸出識別結(jié)果(見圖 )。 %訓(xùn)練 BP 網(wǎng)絡(luò)( P為輸入, T為輸出) save zmn123 %保存文件名為 zmn123 BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練 下圖(見圖 )是輸出向量和輸入向量都為三十二個元素的 BP 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練著 著 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 22 誤差,最終 誤差是 ,誤差較大并不理想。 %設(shè)置訓(xùn)練次數(shù) =0。 %每 100 顯示 1次 =。 神經(jīng)網(wǎng)絡(luò)建立后,需要對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練以產(chǎn)生標(biāo)準(zhǔn)庫。traingd39。}是包含每層用到的傳遞函數(shù)名稱的細(xì)胞數(shù)組。,39。,39。 其中 P是神經(jīng)網(wǎng)絡(luò)的輸入向量, {39。traingd39。tansig39。tansig39。tansig39。 神經(jīng)網(wǎng)絡(luò)輸出向量中的元素個數(shù)由我們的標(biāo)準(zhǔn)庫中字符的個數(shù)確定,由于所要建立的標(biāo)準(zhǔn)庫字符的個數(shù)是 32,并且因為計算機(jī)語言只能識別 0和 1這二個值,所以神經(jīng)網(wǎng)絡(luò)輸出向量中最少有 5 個元素才能搭配出 32個不同的數(shù)值。 BP 神經(jīng)網(wǎng)絡(luò)的建立 BP 神經(jīng)網(wǎng)絡(luò)的建立要考慮索要建立標(biāo)準(zhǔn)庫的大小,先確定標(biāo)準(zhǔn)庫 的大小,然后確定輸入向量中元素的最小個數(shù),即所要提取特征點的最少個數(shù)。但是由于特征點的數(shù)目太少,所以在樣本訓(xùn)練的時候難收斂。最后,將字符圖像的全部黑色像素的數(shù)目的總和作為 1個特征。也就是說,現(xiàn)將字符分成 8等分,得到 8個特征。 y = sim( , P_test); %用訓(xùn)練出來的神經(jīng)網(wǎng)絡(luò)計算數(shù)據(jù)的第 P_test行;其中 是 SIMULINK的模型名 ( 神經(jīng)網(wǎng)絡(luò)的對象見參考附錄 2) ; P_test 是用來測試數(shù)據(jù)的外部輸入向量。送入圖像管理模塊,經(jīng)二值化,轉(zhuǎn)灰度,均值濾波,二值化,行、字切割等圖像處理操作后,得到待識別文字的點陣,漢字識別模塊從點陣中提取識別特征,通過十三點特征提取,精確匹配識別結(jié)果。系統(tǒng)共包含五個子功能模塊(見圖 )。對神經(jīng)網(wǎng)絡(luò)設(shè)置其初始權(quán)值,選取大量的標(biāo)準(zhǔn)漢字訓(xùn)練網(wǎng)絡(luò),反復(fù)修改權(quán)值,直至與面積序號對應(yīng)的輸出為有效,并建立每一輸出與面積特征庫之間的連接關(guān)系。取標(biāo)準(zhǔn)漢字,對每一漢字計算特征向量。 印刷品上的漢字輸入,經(jīng)過預(yù)處理后,對照標(biāo)準(zhǔn)漢字修補(bǔ)缺損部分,用修補(bǔ)后的漢字進(jìn)行學(xué)習(xí),形成初始的特征庫后再進(jìn)行大量樣本的學(xué)習(xí),建立實用的特征庫。 印刷體漢字 識別系統(tǒng)采用的是十三點特征提取法和神經(jīng)網(wǎng)絡(luò)識別相結(jié)合的原理。 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 19 4 系統(tǒng)的 Matlab 仿真 系統(tǒng)的分析 本設(shè)計要實現(xiàn)的是一個能識別三十二個印刷體漢字的識別系統(tǒng)。但它的建模比較復(fù)雜,而且運算量大。其中結(jié)構(gòu)模式識別方法主要是早期文字識別的主要方法,隨著統(tǒng)計理論的發(fā)展,統(tǒng)計模式識別方法逐漸成為文字識別主要的研究力法。 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 18 本章小結(jié) 本章對印刷體漢字識別技術(shù)的理論部分進(jìn)行了較為全面和詳細(xì)的研究,論述了漢字在識別過程中各個組成部分基本的運作原理,并對多種識別方法進(jìn)行了簡要的論述及比較。 ( 5)算法可最終轉(zhuǎn)化為凸優(yōu)化問題,因而可保證算法的全局最優(yōu)性,避免了神經(jīng)網(wǎng)絡(luò)無法解決的局部最小問題 。 ( 4)支持向量機(jī)是以統(tǒng)計學(xué)理論為基礎(chǔ)的,與傳統(tǒng)統(tǒng)計 學(xué)習(xí)理論不同。 ( 2)解決了算法復(fù)雜度與輸入向量密切相關(guān)的問題 。其分類原理是通過某種事先選擇的非線性映射將輸入向量映射到高維特征空間,然后在這個高維空間構(gòu)造最優(yōu)超平面,使兩類之間的間隔最大,同時保證訓(xùn)練樣本的分類誤差盡可能小。 支持向量機(jī) 支持向量機(jī)是 Vapnik 等人根據(jù)統(tǒng)計學(xué)習(xí)理論提出的一種新的機(jī)器學(xué)習(xí)方法,已經(jīng)在模式識別、回歸分析和特征選擇等方面得到了較好的效果。 BP 網(wǎng)絡(luò)有師學(xué)習(xí)方式 需要設(shè)定期望值和無師學(xué)習(xí)方式 只需輸入模式 之分。 ( 2) 作用函數(shù)模型 作用函數(shù)是反映下層輸入對上層節(jié)點刺激脈沖強(qiáng)度的函數(shù)又稱刺激 函 數(shù) ,一般取 為( 0,1)內(nèi)連續(xù)取值 Sigmoid 函數(shù): )1/(1)( exf ?? ( 35) ( 3) 誤差計算模型 誤差計算模型是反映神經(jīng)網(wǎng)絡(luò)期望輸出與計算輸出之間誤差大小的函數(shù): ? ??? )(2/1 O p itp iEp ( 36) tpii 節(jié)點的期望輸出值; Opii 節(jié)點計算輸出值 。 BP 神經(jīng)網(wǎng)絡(luò)模型 BP 網(wǎng)絡(luò)模型包括其輸入輸出模型、作用函數(shù)模型、誤差計算模型和自學(xué)習(xí)模型。誤差通過輸出層, 按誤差梯度下降的方式修正各層權(quán)值,向隱層、輸入層逐層反傳。輸入層各神經(jīng)元負(fù)責(zé)接收來自外界的輸入信息,并傳遞給中間層各神經(jīng)元;中間層是內(nèi)部信息處理層,負(fù)責(zé)信息變換,根據(jù)信息變化能力的需求,中間層可以設(shè)計為單隱層或者多隱層結(jié)構(gòu);最后一個隱層傳遞到輸出層各神經(jīng)元的信息,經(jīng)進(jìn)一步處理后,完成一次學(xué)習(xí)的正向傳播處理過程,由輸出層向外界輸出信息處理結(jié)果。直到誤差反向傳播算法( BP 算法)的提出,成功地解決了求解非線性連續(xù)函數(shù)的多層前饋神經(jīng) 網(wǎng)絡(luò)權(quán)重調(diào)整問題。 BP 神經(jīng)網(wǎng)絡(luò)模型拓?fù)浣Y(jié)構(gòu)包括輸入層 ( input) 、隱層( hide layer) 和輸出層 ( output layer) 。 BP 網(wǎng)絡(luò)能學(xué)習(xí)和存貯大量的輸入 輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學(xué)方程。但是,神經(jīng)網(wǎng)絡(luò)方法還 需要在以下幾方面進(jìn)行深人研究:網(wǎng)絡(luò)的模型,以保證網(wǎng)絡(luò)的快速收斂;訓(xùn)練樣本集的選擇,全面的學(xué)習(xí)樣本是高識別率的保證,合理的樣本數(shù)量可避免網(wǎng)絡(luò)的過訓(xùn)練,訓(xùn)練樣本特征的選取,保證良好的識別穩(wěn)定性。 ( 4)神經(jīng)網(wǎng)絡(luò)由于其信息的分布式的存儲方式使它具備一定的容錯能力,因此神經(jīng)網(wǎng)絡(luò)分類器對于輸人模式信息的缺損不是非常敏感,適合質(zhì)量較差圖像的識別。 ( 2)神經(jīng)網(wǎng)絡(luò)不但能在模式空間中形成復(fù)雜的判決表面 ,而且還具備自適應(yīng)的能力,即網(wǎng)絡(luò)不但具備自適應(yīng)的學(xué)習(xí)能力,還能自適應(yīng)地調(diào)整網(wǎng)絡(luò)規(guī)模的大小,適合大類別集的識別工作。因此,我們至少可以說,現(xiàn)有的神經(jīng)網(wǎng)絡(luò)方法有許多地方與統(tǒng)計方法在數(shù)學(xué)原理上是相通的。在一些情況下,統(tǒng)計方法和神經(jīng)網(wǎng)絡(luò)方法是可互相替代的,實際上神經(jīng)網(wǎng)絡(luò)的方法有時被認(rèn)為是統(tǒng)計方法的子集。這其中的原因很多,主要 的原因還在于我們對人腦的工作方式以及 ANN本身的許多問題還沒有找到完美的答案。另外,這種方法所需要的訓(xùn)練樣本規(guī)模比較大,訓(xùn)練過程也比較長。此外, ANN分類器是一種非線性的分類器,它可以提供我們很難想象到的復(fù)雜的類間分界面,這也為復(fù)雜分類問題的解決提供了一種可能的解決方式。不同于傳統(tǒng)的模式識別方法,在這種情況下,神經(jīng)網(wǎng)絡(luò)所“提取”的特征并無 明顯的物理含義,而是儲存在神經(jīng)物理中各個神經(jīng)元的連接之中,省去了由人來決定特征提取的方法與實現(xiàn)過程。 ANN可以作為單純的分類器 ( 不包含特征提取、選擇 ) ,也可以用作功能完善的分類器。 ANN中的各個神經(jīng)元 的結(jié)構(gòu)與功能較為簡單,但大量的簡單神經(jīng)元的組合卻可以非常復(fù)雜,我們從而可以通過調(diào)整神經(jīng)元間的連接系數(shù)完成分類、識別等復(fù)雜的功能。 人工神經(jīng)網(wǎng)絡(luò) 人工神經(jīng)網(wǎng)絡(luò) ( Artificial Neural Network,以下稱 ANN) 是一種模擬人腦神經(jīng)元細(xì)胞的網(wǎng)絡(luò)結(jié)構(gòu),它是由大量簡單的基本元件 — 神經(jīng)元,相互連接成的自適應(yīng)非線性動態(tài)系統(tǒng)[11]。因此,現(xiàn)在人們已注意到將兩種方法結(jié)合起 來使用,加強(qiáng)識別技術(shù)的穩(wěn)定性與泛化能力使之可處理更多類型、更加復(fù)雜的模式。 如表 31所示為統(tǒng)計方法和結(jié)構(gòu)方法特征比較: 表 31 統(tǒng)計方法和結(jié)構(gòu)方法特征比較 項目 方法 識別策略 判別方法 文字變形 變體 特征 提取 相似文 字區(qū)分 統(tǒng)計方法 向量維數(shù) 距離、 類似度 適應(yīng)性差 容易 不易區(qū)分 印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 14 結(jié)構(gòu)方法 分而治之 串行判決 適應(yīng)性好 不容易 容易區(qū)分 由上述分析可見,統(tǒng)計與結(jié)構(gòu)方法各有優(yōu)缺點。隨著漢字識別技術(shù)的發(fā)展,已經(jīng)有越來越多的統(tǒng)計特征 出現(xiàn)。也就是它的魯棒性一般不好。它們包括端點、折點、歧點和交點等。 ( 5)特征點特征 漢字信息的絕大部分集中在漢字骨架上,而漢字骨架信息又大多集中在若干特征點上。 ( 4)外圍特征 漢字的外圍特征是由漢字輪廓信息獲得的。前兩者用于預(yù)分類,后者用于單字識別。有的抗噪性能差,有的代碼復(fù)雜度高。 ( 2)利用變換特征的方法 該方法利用各種函數(shù)變換,例如 KL 變換、 Fourier 變換和 Gabor 變換等對漢字圖像特征進(jìn)行變換。這種需要將左右漢字圖像的像素點陣均存儲起來,既占用大量的內(nèi)存空間,特別是對嵌入式系統(tǒng)來說是不可容忍的,也將在尋 找最相似漢字過程中耗費大量的時間,這對實時系統(tǒng)也是致命的。不足之處在于細(xì)分能力較弱,區(qū)印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 13 分相似字的能力差一些。漢字的統(tǒng)計模式識別是將字符點陣看作一個整體,其所用的特征是從這個整體上經(jīng)過大量的統(tǒng)計而得到的。 統(tǒng)計模式識別方法 統(tǒng)計決策論發(fā)展較早,理論也較成熟。也有些學(xué)者采用抽取漢字圖像中關(guān)鍵特征點來描述漢字 ,但是特征點的抽取易受噪聲點、筆畫的粘連與斷裂等影響。結(jié)構(gòu)模式識別方法的主要優(yōu)點在于對字體變化的適應(yīng)性強(qiáng) ,區(qū)分相 似字能力強(qiáng);缺點是抗干擾能力差 ,從漢字圖像中精確的抽取基元、輪廓、特征點比較困難 ,匹配過程復(fù)雜。其思想是直接從字符的輪廓或骨架上提取的字符像素分布特征,如筆畫、圈、端點、節(jié)點、弧、突起、凹陷等多個基元組合,再用結(jié)構(gòu)方法描述基元組合所代表的結(jié)構(gòu)和關(guān)系。這就是結(jié)構(gòu)模式識別。從部件上講,部件是有特殊的筆畫組合而成,故部件也是一定的。 印刷體漢字識別方法分析 結(jié)構(gòu)模式識別方法 漢字的數(shù)量巨大,結(jié)構(gòu)復(fù)雜,但其特殊的組成結(jié)構(gòu)中蘊(yùn)藏著相當(dāng)嚴(yán)的規(guī)律。另一種方法是把識別過程和后處理過程綜合在一起,初級識別給出的結(jié)果是每一個待識漢字的前幾個候選字和每一候選字與待識字之 間的相似度。 ( 5)人工神經(jīng)元網(wǎng)絡(luò) 利用人工神經(jīng)元網(wǎng)絡(luò)的漢字識別后處理可以采取兩種方式。這時詞條庫中的每一個詞條項,還要包括印刷體漢字識別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 12 該詞的句法
點擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1