freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

印刷體漢字識(shí)別技術(shù)的研究畢業(yè)設(shè)計(jì)(更新版)

  

【正文】 結(jié)構(gòu)與功能較為簡(jiǎn)單,但大量的簡(jiǎn)單神經(jīng)元的組合卻可以非常復(fù)雜,我們從而可以通過(guò)調(diào)整神經(jīng)元間的連接系數(shù)完成分類、識(shí)別等復(fù)雜的功能。隨著漢字識(shí)別技術(shù)的發(fā)展,已經(jīng)有越來(lái)越多的統(tǒng)計(jì)特征 出現(xiàn)。 ( 4) 外圍特征 漢字的外圍特征是由漢字輪廓信息獲得的。這種需要將左右漢字圖像的像素點(diǎn)陣均存儲(chǔ)起來(lái),既占用大量的內(nèi)存空間,特別是對(duì)嵌入式系統(tǒng)來(lái)說(shuō)是不可容忍的, 也將在尋找最相似漢字過(guò)程中耗費(fèi)大量的時(shí)間,這對(duì)實(shí)時(shí)系統(tǒng)也是致命的。也有些學(xué)者采用抽取漢字圖像中關(guān)鍵特征點(diǎn)來(lái)描述漢字 ,但是特征點(diǎn)的抽取易受噪聲點(diǎn)、筆畫(huà)的粘連與斷裂等影響。從部件上講,部件是有特殊的筆畫(huà)組合而成,故部件也是一定的。這時(shí)詞條庫(kù)中的每一個(gè)詞條項(xiàng),還要包括印刷體漢字識(shí)別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 12 該詞的句法信息和語(yǔ)義信息。無(wú)論是詞還是短語(yǔ),都有其構(gòu)成規(guī)則,利用這些規(guī)則,將它們分類。這種方法實(shí)際上己把識(shí)別過(guò)程和后處理過(guò)程融為一體了。目前神經(jīng)網(wǎng)絡(luò)理論的應(yīng)用己經(jīng)滲透到各個(gè)領(lǐng)域,并在模式識(shí)別、智能控制、計(jì)算機(jī)視覺(jué)、自適應(yīng)濾波和信號(hào)處理、非線性優(yōu)化、自動(dòng)目標(biāo)識(shí)別,連續(xù)語(yǔ)音識(shí)別、聲納信號(hào)的處理、知識(shí)處理、傳感技術(shù)與機(jī)器人、生物等領(lǐng)域都 得到了日益 廣泛地應(yīng)用。矩陣中各元素的值為相應(yīng)分量之間的初始匹配概率,然后通過(guò)迭代運(yùn)算對(duì)各個(gè)權(quán)值進(jìn)行修正,并將其中趨近于零的值置為零,直至權(quán)值的變化趨于穩(wěn)定,此時(shí),可以認(rèn)為權(quán) 值矩陣中非零元素所對(duì)應(yīng)的分量之間只有對(duì)應(yīng)關(guān)系,然后根據(jù)這一對(duì)應(yīng)關(guān)系計(jì)算輸入量與該模板問(wèn)的距離,重復(fù)上述過(guò)程。 ( 1) 相關(guān)匹配 這是一種統(tǒng)計(jì)識(shí)別方法,它通過(guò)在特征空間中計(jì)算輸入特征向量與各模板向量之間印刷體漢字識(shí)別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 10 的距離進(jìn)行分類判決。選擇什么樣的特征使得此單分類環(huán)節(jié)的識(shí)別效果達(dá)到最佳,選擇哪些特征來(lái)優(yōu)化組合來(lái)達(dá)到整個(gè)系統(tǒng)的識(shí)別效果達(dá)到最佳,這都需要通過(guò)具體的實(shí)驗(yàn)來(lái)驗(yàn)證。 ② 筆段特征 法 漢字是由筆畫(huà)組成的,而筆畫(huà)又由筆段組成,筆段可近似為一定方向、長(zhǎng)度和寬度的矩形段。 ② 松弛匹配法 松弛匹配法是一種基于全局特征的匹配方法,它對(duì)輸入漢字作多邊近似,抽取邊界線段,將這些邊界線段組成臨近線 段表,然后用松弛匹配操作,完成邊與邊的匹配。在漢字圖像滿足清晰、無(wú)筆畫(huà)連聯(lián)、無(wú)斷筆等細(xì)化要求時(shí),是能夠完全將漢字的各種特征點(diǎn)位置提取處理的;若漢字圖像本身模糊不清,預(yù)處理工作也無(wú)法達(dá)到要求,這樣再好的漢字特征點(diǎn)特征提取算法也無(wú)法提取正確的漢字特征點(diǎn)特征,已經(jīng)獲得的特征點(diǎn)特征一旦應(yīng)用到漢字識(shí)別系統(tǒng)中去,將會(huì)極大地影響整個(gè)系統(tǒng)的實(shí)用性。對(duì)細(xì)化的一般要求是保持原有筆畫(huà)的連續(xù)性,不能由于細(xì)化造成筆畫(huà)斷開(kāi);細(xì)化成為單層像素線;保持文字原有特征,既不要增加,也不要丟失,保持筆畫(huà)特征,最好細(xì)化掉筆鋒:細(xì)化結(jié)果是原曲線的中心線,保留曲線的端點(diǎn),交叉部分中心線不畸變。根據(jù)輔助矩陣中各像素 0、 1 的分布,使處于矩陣中心的被 平滑的像素 X從“ 0”變成“ 1”或者從“ 1”變成“ O”。同理,當(dāng)出現(xiàn)連續(xù)一個(gè)漢字寬度的大累加和情況后突然出現(xiàn)一系列小累加和甚至零值時(shí),判定為該漢字的右邊界。 ( 4) 行字切分 漢字切分的目的是利用字與字之間 、行與行之間的空隙,將單個(gè)漢字從整個(gè)圖像中分離出來(lái)。若閾值取的過(guò)大,則保留的信息過(guò)多,其中許多雜點(diǎn)無(wú)用信息造成了對(duì)以后處理的干擾;若閾值取得過(guò)小,則丟失的信息過(guò)多,其中許多文字信息產(chǎn)生續(xù)斷或丟失,造成最終文字提取分割的信息丟失。 輸入材料 掃描輸入圖像 圖像預(yù)處理 文本的行列切割 文字的特征提取 文字的識(shí)別處理 識(shí)別結(jié)果 識(shí)別結(jié)果的改編 印刷體漢字識(shí)別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 6 3 印刷體漢字識(shí)別技術(shù)的研究 預(yù)處理 由于用數(shù)碼相機(jī)或掃描儀作為輸入設(shè)備得到的數(shù)據(jù)不可避免地存在著各種外在的干擾,圖像質(zhì)量也有偏差 ,對(duì)識(shí)別效果有一定影響。行字切分是將大幅的圖像先切割為行,再?gòu)膱D像行中分離出單個(gè)字符的過(guò)程。隨著漢字識(shí)別技術(shù)的深入研究,漢字的特征提取的算法越來(lái)越多,如何選擇特征和如何組合優(yōu)化特征已經(jīng)成了研究的重要領(lǐng)域。 漢字的以 上幾個(gè)特點(diǎn)就決定了沒(méi)有單一的一種特征就可以完成對(duì)漢字的識(shí)別,因此如何有效的選取各種特征,有效的進(jìn)行組合,使它們?cè)谄ヅ渌俣群妥R(shí)別率上都能滿足實(shí)際需求就成為整個(gè)系統(tǒng)的關(guān)鍵。目前的研究目標(biāo)一般都著眼于解決國(guó)標(biāo)一級(jí) 3755 個(gè)漢字,即使是這樣,漢字識(shí)別也屬于大類別數(shù)的模式識(shí)別問(wèn)題。 經(jīng)過(guò)科研人員這些年的辛勤努力,印刷體漢字識(shí)別技術(shù)的發(fā)展和應(yīng)用有了長(zhǎng)足進(jìn)步,從簡(jiǎn)單的單體識(shí)別發(fā)展到多種字體混排的多體識(shí)別,從中文印刷材料的識(shí)別發(fā)展到中英文混排印刷材料的雙語(yǔ)識(shí)別。隨后,日本 也 在 70 年代 開(kāi)始 對(duì)漢字識(shí)別進(jìn)行了研究。同時(shí),中國(guó)是使用漢字最久遠(yuǎn)和最廣泛的國(guó)家。而且隨著勞動(dòng)力價(jià)格的升高,利用人工方法進(jìn)行漢字輸入也將面臨經(jīng)濟(jì)效益的挑戰(zhàn)。 Matlab 仿真 The research of printed Chinese characters recognition technology Abstract: Printed Chinese character recognition technology is a kind of automatic highspeed, information input method, bee the important functions of the puter interface, still can as office automation, the press and publishing, machine translation, etc, the ideal input has wide application prospects. The aim of Chinese character recognition is to make the Chinese input more natural and convenient so that the puter could process Chinese information more easily. In practice, large volume of letters, newspaper, magazines need to be covered into a coded representation of the input characters. That39。 實(shí)際生活中, 大量的書(shū)信、報(bào)紙、雜志內(nèi)容需要輸入計(jì)算機(jī),這就是印刷體漢字識(shí)別要解決的問(wèn)題。第三章對(duì)印刷體漢字識(shí)別作了詳細(xì)闡述,論述了印刷體漢字識(shí)別的原理和預(yù)處理、特征抽取與分析、后處理過(guò)程;分析了統(tǒng)計(jì)模式識(shí)別方法、 結(jié)構(gòu)模式識(shí)別方法以及 人工神經(jīng)網(wǎng)絡(luò)模式 識(shí)別方法 ;第四章用 Matlab 對(duì)系統(tǒng)進(jìn)行了仿真;最后 在第五章進(jìn)行全文總結(jié)并預(yù)測(cè) 了漢字識(shí)別技術(shù)研究今后的 發(fā)展 方 向。同時(shí)也是世界上使用人數(shù)最多和數(shù)量最多的文字之一。目前印刷體漢字識(shí)別技術(shù)已經(jīng)呈現(xiàn)出了廣泛的應(yīng)用前景,它主要應(yīng)用在中文信息處理、辦公室自動(dòng)化、機(jī)器翻譯、人工智能等高技術(shù)領(lǐng)域。利用機(jī)器識(shí)別文字符號(hào),可以說(shuō)從 1929年 奧地利科學(xué)家 陶舍克利用光學(xué)模板匹配識(shí)別開(kāi)始。此外,日本的三洋、松下、理光和富士等公司也有其研制的印刷漢字識(shí)別系統(tǒng) ,但因這些系統(tǒng)價(jià)格極其昂貴,沒(méi)有得到廣泛應(yīng)用 。在加強(qiáng)版面分析、識(shí)別結(jié)果上下文匹配后處理和各種實(shí)用化技術(shù)的研制的同時(shí),進(jìn)行對(duì)識(shí)別方法的進(jìn)一步研究,促使更實(shí)用的產(chǎn)品廣泛出現(xiàn)。筆劃和部首的不同排列組合,構(gòu)成了 數(shù)以千印刷體漢字識(shí)別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 3 計(jì) 表達(dá)不同含義的結(jié)構(gòu)異常復(fù)雜的漢字字符。從學(xué)科上劃分 , 漢字識(shí)別屬于模式識(shí)別和人工智能的范疇。 在本文中,將二值化,平滑去噪,文本行字切分都?xì)w為預(yù)處理。文字識(shí)別,即從學(xué)習(xí)得到的特征庫(kù)中找到與待識(shí)別字符相似度最高的字符類的過(guò)程。 ( 1) 版面分析 印刷體文字識(shí)別常遇到的識(shí)別主體不是一個(gè)文字段,而是整個(gè)版面,所以版面分析是印刷體文字識(shí)別系統(tǒng)中的重要組成部分。研究一種適合各種文字圖像的二值化方法也 是預(yù)處理環(huán)節(jié)的重點(diǎn)。典型的算法是,從上到下,對(duì)二值漢字點(diǎn)陣的每行像素值進(jìn)行累加,若從某行開(kāi)始的若干累加和均大于一個(gè)試驗(yàn)常數(shù),則可認(rèn)為該行是一漢字文本行的開(kāi)始,即行上界。漢字圖像的歸一化往往會(huì)帶來(lái)兩個(gè)問(wèn)題:一是字符圖像的縮放可能會(huì)引入一些干擾 。細(xì)化處理的目的是搜索圖像的骨架,去除圖像上多余的像素,從而在不改變圖像主要特征的前提下,減少圖像的信息量??梢哉f(shuō),這些問(wèn)題依賴細(xì)化算法本身是無(wú)法克服的,需要在后續(xù)的處理中盡量消除這些畸變的干擾。但不得不提到的是,任何一個(gè)實(shí)用的。 ③非線性匹配法 非線性匹配法是由 Tsukumo 等提出的,用以解決字形的位移、筆畫(huà)的變形等現(xiàn)象。 當(dāng)然,漢字的特征多種多樣,各有各的優(yōu)點(diǎn)、短處和不同的適用范圍。 漢字識(shí)別 算法 分類 識(shí)別算法是整個(gè)識(shí)別過(guò)程的核心部分。 ( 2) 文法分析 文法分析的基本思想是將輸入的漢字看作是一個(gè)語(yǔ)句或符號(hào)串,將識(shí)別問(wèn)題轉(zhuǎn)化為判斷輸入的語(yǔ)句是否屬于某種語(yǔ)言,即句子是否符合某種語(yǔ)言的語(yǔ)法約束條件,這種方法在漢字識(shí)別中也得到了應(yīng)用。由于它是根據(jù)總體的匹配程度來(lái)決定識(shí)別結(jié)果的,所以這一點(diǎn)它類似于統(tǒng)計(jì)方法,同時(shí)它在迭代中還把基元間位置關(guān)系等結(jié)構(gòu)信息考慮在內(nèi),這一點(diǎn)又很像結(jié)構(gòu)方法。 一般而言,后處理可以在相關(guān)編程過(guò)程中由計(jì)算機(jī)自動(dòng)實(shí)現(xiàn) [6]。這是因?yàn)樵趯ふ易值纳舷挛钠ヅ潢P(guān)系時(shí),利用初級(jí)識(shí)別結(jié)果的待選集,可以大大縮小搜索范圍,避免了在整個(gè)詞條庫(kù)中查 詢?;谠~法分析的漢字識(shí)別后處理的關(guān)鍵是構(gòu)造一個(gè)完善的詞條數(shù)據(jù)庫(kù)。一種是把識(shí)別過(guò)程和后處理過(guò)程分開(kāi),網(wǎng)絡(luò)的輸入是初級(jí)識(shí)別結(jié)果的短語(yǔ)或者句子,其中包含不確定的漢字 ( 或拒識(shí)的漢字 ) ,通過(guò)網(wǎng)絡(luò)的運(yùn)行,最終確定這些字。 結(jié)構(gòu)模式識(shí)別理論在 20 世紀(jì) 70 年代初形成 ,是早期漢字識(shí)別研究的主要方法。其要點(diǎn)是提取待識(shí)別模式的的一組統(tǒng)計(jì)特征 ,然后按照一定準(zhǔn)則所確定的決策函數(shù)進(jìn)行分類判決。但這些變換如果沒(méi)有合適的處理,都多少存在缺陷。一旦確定這些筆畫(huà)特征點(diǎn),漢字筆畫(huà)以及結(jié)構(gòu)形狀就可以確定。統(tǒng)計(jì)方法具有良好的魯棒性,較好的抗干擾抗噪聲的能力,它一般按一定的距離度量匹配準(zhǔn)則,采用多維特征值累加的辦法,把局部噪聲和微小畸變淹沒(méi)在最后的累加和里,但是,可以用來(lái)區(qū)分“敏感部位”的差異也隨之消失,因此對(duì)漢字結(jié)構(gòu)的差異區(qū)分能力較弱,區(qū)分相似字的能力較差;而結(jié)構(gòu)方法對(duì)結(jié)構(gòu)特征較敏感,區(qū)分相似字的能力較強(qiáng),但是結(jié)構(gòu)特征難以抽取,不穩(wěn)定。在英文字母與數(shù)字的識(shí)別等類別數(shù)目較少的分類問(wèn)題中,常常將字符的圖像點(diǎn)陣直接作為神經(jīng)網(wǎng)絡(luò)的輸入。 人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別與傳統(tǒng)的統(tǒng)計(jì)模式識(shí)別開(kāi)始是兩個(gè)獨(dú)立發(fā)展的分支,但隨著研究的深入,人們發(fā)現(xiàn)二者之間存在緊密的聯(lián)系。 由于上述優(yōu)點(diǎn),神經(jīng)網(wǎng)絡(luò)的識(shí)別方法正在越來(lái)越多地得到關(guān)注,也因而成為近來(lái)的研究熱點(diǎn)。 BP ( Back Propagation) 神經(jīng)網(wǎng)絡(luò),即誤差反傳誤差反向傳播算法的學(xué)習(xí)過(guò)程,由信息的正向傳播和誤差的反向傳播兩個(gè)過(guò)程組成。 ( 4) 自學(xué)習(xí)模型 神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過(guò)程,即連接下層節(jié)點(diǎn)和上層節(jié)點(diǎn)之間的權(quán)重拒陣 Wij 的設(shè)定和誤差修正過(guò)程。 ( 3) 通過(guò)引用核函數(shù),將輸入空間中的非線性問(wèn)題映射到高維特征空間中在高維空間中構(gòu)造線性函數(shù)判別 。近年來(lái),人工神經(jīng)網(wǎng)絡(luò)發(fā)展迅猛,它模擬人腦的活動(dòng)方式,更符合人們的思維習(xí)慣。系統(tǒng)在識(shí)別過(guò)程中可進(jìn)行 自 學(xué)習(xí)。 . 系統(tǒng)的實(shí)現(xiàn) 此次采用 MATLAB 進(jìn)行系統(tǒng)仿真( Matlab 仿真程序見(jiàn)參考附錄 1),其中學(xué)習(xí)功能使用 sim 函數(shù)實(shí)現(xiàn),特征提取用十三點(diǎn)特征提取法。漢字圖像 預(yù)處理 漢字識(shí)別 識(shí)別結(jié)果 轉(zhuǎn)灰度圖像 均值濾波 列分割 二值化 加載特征庫(kù) 特征提取 特征匹配 行分割 印刷體漢字識(shí)別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 21 圖 十三點(diǎn)特征提取分塊 十三點(diǎn)特征所產(chǎn)生的數(shù)據(jù)形成一個(gè)矢量作為神經(jīng)網(wǎng)絡(luò)的輸入,此數(shù)據(jù)用于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和識(shí)別過(guò)程(十三點(diǎn)特征提取的程序見(jiàn)參考附錄 1)。,39。tansig39。訓(xùn)練程序及訓(xùn)練參數(shù)如下: =100。 圖 標(biāo)準(zhǔn) 圖像 圖 標(biāo)準(zhǔn)轉(zhuǎn)灰度圖像 圖 標(biāo)準(zhǔn)均值濾波圖像 圖 標(biāo)準(zhǔn)二值化圖像 印刷體漢字識(shí)別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 24 圖 標(biāo)準(zhǔn)圖像處理結(jié)果 圖 標(biāo)準(zhǔn)圖像 識(shí)別 結(jié)果 印刷體漢字識(shí)別技術(shù)的研究 上海應(yīng)用技術(shù)學(xué)院 電氣與電子工程學(xué)院 畢業(yè)論文 25 基于這個(gè)已建立的標(biāo)準(zhǔn)庫(kù),我們通過(guò) Matlab 程序仿真結(jié)果得知,此系統(tǒng) 經(jīng)過(guò)自學(xué)習(xí)后 對(duì)標(biāo)準(zhǔn)圖像中漢字的識(shí)別率是 100%,系統(tǒng)的技術(shù)指標(biāo)符合我們的預(yù)期。 然后我們對(duì)相似字標(biāo)準(zhǔn)圖像進(jìn)行識(shí)別。說(shuō)明系統(tǒng)基本實(shí)現(xiàn)預(yù)先設(shè)想的功能,能夠在學(xué)習(xí)標(biāo)準(zhǔn)圖像識(shí)別后建立標(biāo)準(zhǔn)庫(kù),并
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1