【正文】
............................................. 35 v 致謝 ...................................................................... 36 參考附錄 .................................................................. 37 參考附錄 1 .............................................................. 37 參考附錄 2 .............................................................. 48 印刷體漢字識別技術的研究 上海應用技術學院 電氣與電子工程學院 畢業(yè)論文 1 1 緒論 印刷體漢字識別技術的研究意義 漢字已有數千年的歷史,是中華民族文化的重要結晶,閃爍著中華人民智慧的光芒。 Matlab仿真 iii The research of printed Chinese characters recognition technology Abstract: Printed Chinese character recognition technology is a kind of automatic highspeed, information input method, bee the important functions of the puter interface, still can as office automation, the press and publishing, machine translation, etc, the ideal input has wide application prospects. The aim of Chinese character recognition is to make the Chinese input more natural and convenient so that the puter could process Chinese information more easily. In practice, large volume of letters, newspaper, magazines need to be covered into a coded representation of the input characters. That39。 匹配 識別 。 關鍵詞 : 漢字識別 。第二章 對印刷體漢字的識別過程進行基本概述 。 實 際生活中,大量的書信、報紙、雜志內容需要輸入計算機,這就是印刷體漢字識別要解決的問題。 i 學校代碼: 10259 上海應用技術學院 學士學位論文 題 目: 硬刷題漢字識別技術的研究 專 業(yè): 電氣工程及其自動化 班 級: 09103212 姓 名: 沈佳駿 學 號: 0910321220 指導教師: 陳嵐 二 O 一三年 六月六日 ii 印刷體漢字識別技術的研究 摘要 : 印刷體 漢字識別技術是一種高速、自動的信息錄入手段 ,成為未來計算機的重要職能接口,還可以作為辦公自動化、新聞出版、機器翻譯等領域的理想輸入方式,有著廣泛的應用前景。漢字識別的最終目的是使中文信息能更自然,更方便地輸入計算機,以便于進一步處理 。本文 首先在第一章 就漢字識別研究的意義 和 背景 以及對目前存在的問題 作了綜述。第三章對印刷體漢字識別作了詳細闡述,論述了印刷體漢字識別的原理和預處理、特征抽取與分析、后處理過程;分析了統計模式識別方法、 結構模式識別方法以及 人工神經網絡模式識別 方法 ;第四章用 Matlab 對系統進行了仿真;最后 在第五章進行全文總結并預測 了漢字識別技術研究今后的 發(fā)展方 向。 特征提取 。 人工神經網絡 。s what printed Chinese character recognition can do. Firstly, in chapter 1, this thesis gives what is the significance of research and background of Chinese character recognition and introduce the problems we encountered now. The chapter 2, it is a basic overview of the recognition process of printed Chinese characters. In chapter 3, we discusses the principles and printed character recognition, feature extraction and analysis, the postprocessing process, Emphatically analyses the statistical pattern recognition method, structural pattern recognition method and Artificial neural work pattern recognition method. In chapter 4, giving an Matlab simulation concludes the whole article and forecast characters identification technology research directions of future development. KeyWords: Chinese characters recognition; feature extraction; Matching recognition; Artificial neural work; Matlab simulation iv 目 錄 摘要 ...................................................................... ii ABSTRACT. ................................................................ iii 目錄 .................................................................... iiii 1 緒論 .................................................................... 1 印 刷體漢字識別技術的研究意義 ........................................ 1 印刷體漢字識別技術的研究狀況 ........................................ 1 印刷體漢字識別技術 存在的難點 ........................................ 2 2 印刷體漢字識別的概述 .................................................... 4 印刷體漢字識別的原理簡介 ............................................ 4 印刷體漢字識別的流程簡介 ............................................ 4 3 印刷體漢字識別技術的研究 ................................................ 6 預處理 .............................................................. 6 漢字特征提取 ........................................................ 8 漢字識別算法分類 .................................................... 9 后處理 ............................................................. 11 印刷體漢字識別方法分析 ............................................. 12 結構模式識別方法 ............................................... 12 統計模式識別方法 ............................................... 12 人工神經網絡 ................................................... 14 BP神經網絡 .................................................... 15 支持向量機 ..................................................... 17 本章小結 ........................................................... 18 4 系統的 Matlab 仿真 ...................................................... 19 系統的分析 ......................................................... 19 系統的實現 ......................................................... 20 特征提取 ....................................................... 20 BP神經網絡的建立 .............................................. 21 BP神經網絡的訓練 .............................................. 21 系統的仿真 ..................................................... 23 系統性能的進一步驗證 ........................................... 27 仿真結果分析 ................................................... 31 本章小結 ........................................................... 32 5 未來展望與全文總結 ..................................................... 33 未來展望 ........................................................... 33 全文總結 ............................................ 錯誤 !未定義書簽。同時也是世界上使用人數最多和數量最多的文字之一。然而,隨著人們對電子化信息需求的日益增加,如何將漢字 快速高效地輸入計算機,是信息處理的一個關鍵問題,也是關系到計算機技術能否在我國真正普及的重要前提,更是能否傳播與弘揚中華民族悠久歷史文化的關鍵因素。這種方法不適用于需要處理大量文字資料的辦公自動化