freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

印刷體漢字識別技術(shù)的研究畢業(yè)設(shè)計(存儲版)

2025-07-28 03:39上一頁面

下一頁面
  

【正文】 要建立的標準庫字符的個數(shù)是32,并且因為計算機語言只能識別0和1這二個值,所以神經(jīng)網(wǎng)絡(luò)輸出向量中最少有5個元素才能搭配出32個不同的數(shù)值。traingd39。}是包含每層用到的傳遞函數(shù)名稱的細胞數(shù)組。 %設(shè)置訓(xùn)練次數(shù) =0。 系統(tǒng)性能的進一步驗證但由于本系統(tǒng)設(shè)定的字庫容量較小僅為三十二個字,即使以上漢字都能夠一一識別也并不能完全證明本系統(tǒng)具有較高的識別率。通過對相似字標準圖像的學(xué)習訓(xùn)練之后,我們再對相似字亂序圖像進行識別。但程序的自動適應(yīng)能力有限,二值化和均值濾波參數(shù)不能很好的對文字圖像的像素值進行判別,部分漢字被處理后可能會出現(xiàn)出現(xiàn)特征丟失的情況。因此本系統(tǒng)還有著相當大的提升空間,可進行更深入的研究與改進。因此,計算機在識別文字時也可以在識別單字的基礎(chǔ)上,結(jié)合單字的上下文信息對識別結(jié)果進行校正,以單詞甚至句子作為一次識別的結(jié)果[13]。例如:Mac OS環(huán)境、Wnidows環(huán)境和UNIX環(huán)境下的中文OCR版本,滿足不同用戶的需求?;厥鬃霎厴I(yè)設(shè)計的這段時間,雖然在學(xué)習過程中遇到不少艱難險阻,卻過得很充實。在整個畢業(yè)課題的設(shè)計以及論文的撰寫過程中,她對我悉心指導(dǎo)、嚴格要求、熱情鼓勵并給予我極大的支持和具有啟發(fā)性的建議,使得我的畢業(yè)設(shè)計得以順利的完成。G=imread(39。%二值k1=1。while s(j)==m j=j+1。k1=1。amp。 P_test = [t1]。 P_test = [t2]。 P_test = [t3]。 P_test = [t4]。 P_test = [t5]。 P_test = [t6]。 P_test = [t7]。 P_test = [t8]。 P_test = [t9]。 P_test = [t10]。 P_test = [t11]。 P_test = [t12]。)。)。)。)。)。)。)。)。)。)。)。)。)。 end k1=j。d=d((k1:k2),:)。c=1 [m,n]=size(d39。,3),I)/255。clc。參考文獻[1] [D]:(碩士學(xué)位論文).西安:西北工業(yè)大學(xué),2006.[2] [D]:(博士學(xué)位論文).廣州:華南理工大學(xué),1996.[3] [M].河北:華北電力大學(xué),2008.[4] 蘇金明、王永利,MATLAB圖形圖像[M].北京:電子工業(yè)出版社,2005.[5] 呂俊哲. 圖像二值化算法研究及其實現(xiàn)[J],科技情報開發(fā)與經(jīng)濟,2004.[6] [M].北京:清華大學(xué)出版社,1992[7] 孫兆林,MATLAB6.x圖像處理[M],北京:清華大學(xué)出版社,2004.[8] 高彥宇,[J],計算機工程,2004.[9] 張中,漢字識別的綜述.語言文字及應(yīng)用,1997年第二期.[10] 鮑勝利,基于多算法集成和神經(jīng)網(wǎng)絡(luò)的漢字識別系統(tǒng)的研究.四川:四川大學(xué),2002[11] 蔣宗禮,人工神經(jīng)網(wǎng)絡(luò)導(dǎo)論.北京高等教育出版社,2001.[12] 王先旺,李 濤,冷麗琴,王海兵,張 煒,智能神經(jīng)網(wǎng)絡(luò)系統(tǒng)遠離在印刷體漢字識別中的應(yīng)用.四川大學(xué)學(xué)報,第33卷,第2期,2001.[13] 吳佑壽,丁曉青.漢字識別原理方法與實現(xiàn)[M],高等教育出版社,1992[14] 神經(jīng)網(wǎng)絡(luò)模式識別及實現(xiàn) (美)[]Abhijit ,(美)[]Robert .[15] Feature analysis of handprinted Chinese characters. Kazou Toraichi, Tadahiko Kazuhiko Yamamoto, hiromitsu yamada, 1989.[16] Feature Point Mothod of Chinese Character Recognition and Its Application, Zhang xinzhong, Yan Changde and Liu Xiuying, Chinese Information Processing amp。本次畢業(yè)設(shè)計是一次寶貴的從理論構(gòu)思投入到實際論證的設(shè)計經(jīng)歷。(3)系統(tǒng)總體性能的進一步提高,解決像報紙這種欄目多而位置排列復(fù)雜的印刷體文本材料的版面自動理解;利用自然語言理解知識進行識別后一處理;進一步提高文字的識別率和適應(yīng)性,降低系統(tǒng)的誤識率,等等?,F(xiàn)在的識別方法也開始在識別后處理上進行研究,結(jié)合語義理解的后處理技術(shù)與識別前的預(yù)處理相對應(yīng),可以對識別的結(jié)果進行后期處理,提高識別的正確率。但由于系統(tǒng)比較簡單,功能比較單一,字庫的容量只有三十二個字,實用性有限,并且也只能識別幾種標準的印刷字體。并且本系統(tǒng)的結(jié)構(gòu)雖然并不復(fù)雜,但識別率并未因此降低,經(jīng)過對第二組圖像的仿真,我們發(fā)現(xiàn)了本系統(tǒng)對相似字也能進行很好的識別,進一步證明了本系統(tǒng)卓越的識別率。運行程序后首先載入相似字標準的圖片(),然后依次得到轉(zhuǎn)灰度圖片(),均值濾波圖片(),二值化圖片(),經(jīng)行列切分后得到處理結(jié)果()及命令窗口輸出的識別結(jié)果()。通過對標準圖像識別學(xué)習訓(xùn)練,然后再對輸入亂序圖像()進行識別,運行程序后識別過程中分別進行轉(zhuǎn)灰度(),均值濾波(),二值化(),經(jīng)行列切分后得到處理結(jié)果(),最后在命令窗口輸出識別結(jié)果()。 %每100顯示1次 =。,39。tansig39。 BP神經(jīng)網(wǎng)絡(luò)的建立BP神經(jīng)網(wǎng)絡(luò)的建立要考慮索要建立標準庫的大小,先確定標準庫的大小,然后確定輸入向量中元素的最小個數(shù),即所要提取特征點的最少個數(shù)。y = sim( net, P_test);%用訓(xùn)練出來的神經(jīng)網(wǎng)絡(luò)計算數(shù)據(jù)的第P_test行;其中net是SIMULINK的模型名(神經(jīng)網(wǎng)絡(luò)的對象見參考附錄2);P_test是用來測試數(shù)據(jù)的外部輸入向量。取標準漢字,對每一漢字計算特征向量。但它的建模比較復(fù)雜,而且運算量大。 (4)支持向量機是以統(tǒng)計學(xué)理論為基礎(chǔ)的,與傳統(tǒng)統(tǒng)計學(xué)習理論不同。BP網(wǎng)絡(luò)有師學(xué)習方式需要設(shè)定期望值和無師學(xué)習方式只需輸入模式之分。輸入層各神經(jīng)元負責接收來自外界的輸入信息,并傳遞給中間層各神經(jīng)元;中間層是內(nèi)部信息處理層,負責信息變換,根據(jù)信息變化能力的需求,中間層可以設(shè)計為單隱層或者多隱層結(jié)構(gòu);最后一個隱層傳遞到輸出層各神經(jīng)元的信息,經(jīng)進一步處理后,完成一次學(xué)習的正向傳播處理過程,由輸出層向外界輸出信息處理結(jié)果。但是,神經(jīng)網(wǎng)絡(luò)方法還需要在以下幾方面進行深人研究:網(wǎng)絡(luò)的模型,以保證網(wǎng)絡(luò)的快速收斂;訓(xùn)練樣本集的選擇,全面的學(xué)習樣本是高識別率的保證,合理的樣本數(shù)量可避免網(wǎng)絡(luò)的過訓(xùn)練,訓(xùn)練樣本特征的選取,保證良好的識別穩(wěn)定性。在一些情況下,統(tǒng)計方法和神經(jīng)網(wǎng)絡(luò)方法是可互相替代的,實際上神經(jīng)網(wǎng)絡(luò)的方法有時被認為是統(tǒng)計方法的子集。不同于傳統(tǒng)的模式識別方法,在這種情況下,神經(jīng)網(wǎng)絡(luò)所“提取”的特征并無明顯的物理含義,而是儲存在神經(jīng)物理中各個神經(jīng)元的連接之中,省去了由人來決定特征提取的方法與實現(xiàn)過程。因此,現(xiàn)在人們已注意到將兩種方法結(jié)合起來使用,加強識別技術(shù)的穩(wěn)定性與泛化能力使之可處理更多類型、更加復(fù)雜的模式。它們包括端點、折點、歧點和交點等。有的抗噪性能差,有的代碼復(fù)雜度高。漢字的統(tǒng)計模式識別是將字符點陣看作一個整體,其所用的特征是從這個整體上經(jīng)過大量的統(tǒng)計而得到的。其思想是直接從字符的輪廓或骨架上提取的字符像素分布特征,如筆畫、圈、端點、節(jié)點、弧、突起、凹陷等多個基元組合,再用結(jié)構(gòu)方法描述基元組合所代表的結(jié)構(gòu)和關(guān)系。另一種方法是把識別過程和后處理過程綜合在一起,初級識別給出的結(jié)果是每一個待識漢字的前幾個候選字和每一候選字與待識字之間的相似度。該數(shù)據(jù)庫中的每一個詞條項都要包括本詞條的詞性、詞頻、連接屬性、語義信息等。在不利用待選集時,對于有可能識別出錯的地方,只能采用拒識,而拒識不提供任何未知漢字與已知漢字字符集中漢字相似度的信息,所以尋找詞條時的搜索空間只能是整個詞條庫。以下對各種常用的后處理方法做簡單的介紹。因此松弛匹配法在漢字識別中取得了很好的效果,它不僅可以用于特征點的匹配,而且還可以用于筆段、筆畫和部件的匹配。文法分析是典型的結(jié)構(gòu)識別方法,由于其側(cè)重點是在筆段形狀、位置以及筆段之間相互關(guān)系的分析上,所以它的優(yōu)點是分辨相似字的能力較強,對書寫風格的變化不敏感:缺點是對局部噪聲敏感,特征提取比較復(fù)雜。原始圖像經(jīng)過預(yù)處理后,得到一個較為理想的二值圖像,然后就可以對這個處理后的二值圖像進行識別。選擇什么樣的特征使得此單分類環(huán)節(jié)的識別效果達到最佳,選擇哪些特征來優(yōu)化組合來達到整個系統(tǒng)的識別效果達到最佳,這也是設(shè)計者需要考慮的因素。此方法試圖克服從圖形中正確抽取筆畫的困難,以提高正確判別的能力。識別系統(tǒng)只利用其中部分子空間的信息。 漢字特征提取 預(yù)處理的最終目的是為了更加方便、準確地進行漢字的特征提取,從而提高漢字識別率。細化處理結(jié)果的好壞,直接影響到識別的效果和質(zhì)量。二是圖像縮放本身的運算量較大。同理,當出現(xiàn)連續(xù)大約一個漢字高度的大累加和情況后突然出現(xiàn)一系列小累加和甚至零值時,判定為行下界。 (3)傾斜校正通過輸入設(shè)備獲得的圖像不可避免地會發(fā)生傾斜,這會給后面的行字分割、文字識別等圖像處理與分析帶來困難,因此,在漢字識別系統(tǒng)中,傾斜校正是圖像預(yù)處理的重要部分。它是指對印刷體文檔圖像進行分析,提取出文本、圖像圖形、表格等區(qū)域,并確定其邏輯關(guān)系,并將相應(yīng)的文本塊連接在一起。后處理則是利用詞義、詞頻、語法規(guī)則或語料庫等語言先驗知識對識別結(jié)果進行校正的過程。在本文中,將二值化,平滑去噪,文本行字切分都歸為預(yù)處理。從學(xué)科上劃分,漢字識別屬于模式識別和人工智能的范疇。筆劃和部首的不同排列組合,構(gòu)成了數(shù)以千計表達不同含義的結(jié)構(gòu)異常復(fù)雜的漢字字符。在加強版面分析、識別結(jié)果上下文匹配后處理和各種實用化技術(shù)的研制的同時,進行對識別方法的進一步研究,促使更實用的產(chǎn)品廣泛出現(xiàn)。此外,日本的三洋、松下、理光和富士等公司也有其研制的印刷漢字識別系統(tǒng),但因這些系統(tǒng)價格極其昂貴,沒有得到廣泛應(yīng)用。利用機器識別文字符號,可以說從1929年奧地利科學(xué)家陶舍克利用光學(xué)模板匹配識別開始。目前印刷體漢字識別技術(shù)已經(jīng)呈現(xiàn)出了廣泛的應(yīng)用前景,它主要應(yīng)用在中文信息處理、辦公室自動化、機器翻譯、人工智能等高技術(shù)領(lǐng)域。同時也是世界上使用人數(shù)最多和數(shù)量最多的文字之一。第二章對印刷體漢字的識別過程進行基本概述。本文首先在第一章就漢字識別研究的意義和背景以及對目前存在的問題作了綜述。s what printed Chinese character recognition can do. Firstly, in chapter 1,this thesis gives what is the significance of research and background of Chinese character recognition and introduce the problems we encountered now. The chapter 2,it is a basic overview of the recognition process of printed Chinese characters. In chapter 3, we discusses the principles and printed character recognition, feature extraction and analysis, the postprocessing process, Emphatically analyses the statistical pattern recognition method, structural pattern recognition method and Artificial neural network pattern recognition method. In chapter 4, giving an Matlab simulation concludes the whole article and forecast characters identification technology research directions of future development.KeyWords:Chinese characters recognition;feature extraction;Matching recognition;Artificial neural network;Matlab simulation目 錄摘要 iABSTRACT. i目錄 iii1 緒論 1 印刷體漢字識別技術(shù)的研究意義 1 印刷體漢字識別技術(shù)的研究狀況 1 印刷體漢字識別技術(shù)存在的難點 22 印刷體漢字識別的概述 4 印刷體漢字識別的原理簡介 4 印刷體漢字識別的流程簡介 43 印刷體漢字識別技術(shù)的研究 6 預(yù)處理 6 漢字特征提取 8 漢字識別算法分類 9 后處理 11 印刷體漢字識別方法分析 12 結(jié)構(gòu)模式識別方法 12 統(tǒng)計模式識別方法 12 人工神經(jīng)網(wǎng)絡(luò) 14 BP神經(jīng)網(wǎng)絡(luò) 15 支持向量機 17 本章小結(jié) 184 系統(tǒng)的Matlab仿真 19 系統(tǒng)的分析 19 系統(tǒng)的實現(xiàn) 20 特征提取 20 BP神經(jīng)網(wǎng)絡(luò)的建立 21 BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練 21 系統(tǒng)的仿真 23 系統(tǒng)性能的進一步驗證 27 仿真結(jié)果分析 31 本章小結(jié) 325 未來展望與全文總結(jié) 33 未來展望 33 全文總結(jié) 33參考文獻 35致謝 36參考附錄 37參考附錄1 37參考附錄2 4848印刷體漢字識別技術(shù)的研究
點擊復(fù)制文檔內(nèi)容
電大資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1