freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫體數(shù)字識別的軟件設(shè)計(jì)畢業(yè)設(shè)計(jì)論文資料-在線瀏覽

2025-08-10 05:06本頁面
  

【正文】 Artificial Neural Network ,ANN)[5],支持向量機(jī)(Support Vector Machine)[6,7],隱馬爾科夫模型(Hidden Markov Model,HMM)[8]等,而這些識別工具至今仍然是研究的熱點(diǎn)。2) 支持向量機(jī)是Vapnik 等人根據(jù)統(tǒng)計(jì)學(xué)理論提出的一種新型機(jī)器學(xué)習(xí)方法。3) 隱馬爾科夫模型是一類基于馬爾科夫隨機(jī)過程的統(tǒng)計(jì)模型[9]。從上世紀(jì)90年代開始,一些研究者已經(jīng)將隱馬爾科夫模型引入到了圖像處理、識別和分析中來。這是因?yàn)椋谝话闱闆r下,當(dāng)涉及到數(shù)字識別時,人們往往要求識別系統(tǒng)有很高的識別精度(又稱可靠性)[10],特別是有關(guān)金融的數(shù)字識別時,如支票中填寫的金額部分,更是如此??偨Y(jié)數(shù)字識別的難點(diǎn)主要在于以下幾方面:1) 阿拉伯?dāng)?shù)字的字型信息量很小,不同數(shù)字寫法字形相差又不大,使得準(zhǔn)確區(qū)分某些數(shù)字相當(dāng)困難[11]。3) 在實(shí)際應(yīng)用中,對數(shù)字的單字識別正確率的要求要比文字要苛刻得多。而且數(shù)字識別經(jīng)常涉及到財(cái)務(wù)、金融領(lǐng)域,其嚴(yán)格性更是不言而喻的。4) 由于脫機(jī)手寫數(shù)字的輸入只是簡單的一幅圖像,它不像聯(lián)機(jī)輸入那樣可以從物理輸入設(shè)備上獲得字符筆畫的順序信息[14],因此脫機(jī)手寫數(shù)字識別是一個更有挑戰(zhàn)性的問題。在過去的數(shù)十年中,研究者提出了許多識別方法,目前手寫體數(shù)字識別方法可以分為兩類:基于結(jié)構(gòu)特征的方法和基于統(tǒng)計(jì)特征的方法[15]。在我國郵電部第三研究所,以信函分揀為目的,識別書寫在信封上的郵政編碼。 德國E9的Friedhelm Schwenker采用SVRBF40對手寫體數(shù)字進(jìn)行識別,測試樣本10000個,%。然而以上提到的系統(tǒng),要么對書寫的正規(guī)程度有要求,要么其測試樣本和訓(xùn)練樣本出于同一批人之手。 手寫體數(shù)字識別系統(tǒng)概述不同的識別系統(tǒng),在具體處理一幅待識別圖像時,處理的步驟可能并不完全相同。()。由于這些噪聲的影響,如果對獲取得到的數(shù)字圖像進(jìn)行直接處理的話通常不能得到滿意的結(jié)果,因此在獲取原始數(shù)字圖像后,需要對圖像進(jìn)行預(yù)處理。經(jīng)過預(yù)處理后的圖片不僅能夠有效濾除噪聲,并且能夠?qū)⒉煌拇笮 A斜角度的字符進(jìn)行歸一化到一個固定大小,對大量數(shù)據(jù)進(jìn)行壓縮處理。預(yù)處理效果的好壞會直接影響到整個系統(tǒng)的性能。2) 特征提取階段由于原始數(shù)字圖像數(shù)據(jù)量大,冗余信息較多,一般不進(jìn)行直接識別,而是進(jìn)行提取有效特征數(shù)據(jù)、壓縮數(shù)據(jù),然后再進(jìn)行識別。特征值的提取一般包括:筆畫、拓?fù)潼c(diǎn)、結(jié)構(gòu)突變點(diǎn)、投影形狀、點(diǎn)(端點(diǎn)、連點(diǎn)、三叉點(diǎn)、四叉點(diǎn)、垂直交點(diǎn),水平交點(diǎn)等)、弧、連通區(qū)域、凸凹形狀、環(huán)、字符整體輪廓、檢查必要的基元是否存在、不可有的基元是否出現(xiàn)等特征。該環(huán)節(jié)現(xiàn)在普遍采用的是基于神經(jīng)網(wǎng)絡(luò)和模板匹配兩種模式。因此,在分類其中,我們將提取到的特征值輸入到已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中進(jìn)行分類識別。這個階段可以根據(jù)具體的應(yīng)用來設(shè)計(jì)不同的判別決策。 本文內(nèi)容安排我們主要目標(biāo)是對有噪聲、一定約束書寫條件下的脫機(jī)手寫體數(shù)字串的切割和識別算法進(jìn)行一些探討性研究,以期提高其準(zhǔn)確性,獲得更高的可靠性。本文內(nèi)容上總體安排為七章。介紹內(nèi)容有:OCR及手寫體數(shù)字識別的歷史及現(xiàn)狀;手寫體數(shù)字識別的意義和難點(diǎn);數(shù)字串識別系統(tǒng)的整體描述以及本文的研究內(nèi)容。本文采用預(yù)處理有濾波去噪,閾值分割,歸一化,細(xì)化等技術(shù),該章節(jié)對其進(jìn)行詳細(xì)分析。第三章:主要研究的是手寫體數(shù)字識別中的切分技術(shù)。第四章:主要研究的是手寫體數(shù)字識別中的特征值提取技術(shù)。比如對于關(guān)鍵點(diǎn)特征的提取,則需要使用字符的外輪廓、骨架信息。本章將詳細(xì)介紹這些相關(guān)的特征值的提取步驟。第五章:主要簡單介紹神經(jīng)網(wǎng)絡(luò)分類識別器實(shí)現(xiàn)原理。第六章:介紹了本文實(shí)現(xiàn)的系統(tǒng)的開發(fā)和運(yùn)行環(huán)境,以及系統(tǒng)的處理過程圖,并通過對NIST的圖像數(shù)據(jù)庫進(jìn)行測試,給出相關(guān)實(shí)驗(yàn)數(shù)據(jù)。2 手寫體數(shù)字識別中預(yù)處理技術(shù)預(yù)處理對于一個良好的識別系統(tǒng)不僅是一個必不可少的環(huán)節(jié),而且是至關(guān)重要的。一般手寫體數(shù)字識別而言,預(yù)處理包括很多部分,如平滑、去噪、二值化、歸一化、細(xì)化、形狀校正、去各種類印章、背景底紋等等。因此本文就省去了去除類印章、背景底紋等的這些操作。圖像傳感器的工作情況受各種因素的影響,如圖像獲取中的環(huán)境條件和傳感元器件自身的質(zhì)量。除此之外對于有些傳感元器件的自身質(zhì)量,如手機(jī)自帶的照相設(shè)備一般分辨率較低,在獲取數(shù)字圖像時會產(chǎn)生斑點(diǎn)噪聲。特別是圖像的輸入、采集的噪聲是十分關(guān)鍵的問題。噪聲去除已經(jīng)成為圖像處理極其重要的步驟,然而現(xiàn)在還沒有一個通用的濾波去噪方法對所有的圖片適用,一般的圖像預(yù)處理必須根據(jù)實(shí)際情況選擇不同濾波去噪方法進(jìn)行比較,最后得出最佳的濾波去噪方法。頻域?yàn)V波一般采用的方法是將空間圖像采用快速傅里葉變換轉(zhuǎn)換成頻域信息,然后再采用信號處理的濾波方法進(jìn)行濾波(一般采用的有阻濾波器、帶通濾波器、陷波濾波器、最佳陷波濾波器等),濾波處理后再通過傅里葉逆變換進(jìn)行逆變換成空間圖像信息,從而達(dá)到濾波效果。對于空間域?yàn)V波算法中最常用的是平滑濾波去噪法,其主要思想為在圖像空間中借助模板對圖像進(jìn)行領(lǐng)域操作,用平均運(yùn)算方法去除突然變化的點(diǎn)從而濾掉一定的噪聲。常見的平滑去噪方法有:nn中值濾波器,高斯濾波器等等。3的中值濾波器。A3A2A1A4MA0A5A6A7 33的中值濾波器模板示意圖3的中值濾波器對帶有噪聲的圖片進(jìn)行濾波后的效果。中值濾波器尤其對單級或雙極脈沖噪聲非常有效。因此,需要簡單介紹一下空間域的高斯平滑濾波器。根據(jù)高斯函數(shù)的可分離性可以得到,二維高斯濾波器能用2個一維高斯濾波器逐次卷積來實(shí)現(xiàn),一個沿水平方向,一個沿垂直方向。常見的高斯模板(33),模板上越靠近領(lǐng)域中心的位置,其權(quán)值越高,如此安排權(quán)值的意義在于用此模板進(jìn)行圖像平滑時,在對圖像細(xì)節(jié)進(jìn)行模糊的同時,可以更多的保留圖像總體的灰度分布特征。然而在保留圖像的總體特征上,高斯濾波器表現(xiàn)了很好的性能。一般的文字識別的文字圖像、進(jìn)行指紋識別的指紋圖像,大多數(shù)都需要將灰度圖像轉(zhuǎn)化成二值圖像。這是因?yàn)?,一方面類似于字符、指紋、工程圖等圖像本身就是二值的。這樣在圖像處理系統(tǒng)中,可以減少圖像信息并提高處理速度?;诨叶确植嫉亩祷幚硪话闶峭ㄟ^設(shè)定閾值,把它變?yōu)閮H用二值表示前景和背景顏色的圖像。有的應(yīng)用可以由計(jì)算機(jī)自動選取,有的則需要人工干預(yù),所以閾值T的選取視應(yīng)用范圍而有所不同。目前,眾多學(xué)者對此已經(jīng)進(jìn)行了比較詳細(xì)的研究,并提出了許多閾值選取的算法,這些算法大體上可以劃分為三類:整體閾值法,局部閾值法和動態(tài)閾值法。典型的閾值選取算法有直方圖法,熵閾值法等等,一般地,如果圖像灰度直方圖呈現(xiàn)雙峰,或者圖像中背景灰度與目標(biāo)灰度呈明顯分離狀,整體閾值法分割圖像效果良好且速度快。不同的閾值法源于N(i,j)的不同選擇。3) 動態(tài)閾值法當(dāng)閾值選擇不僅取決于該像素閾值及其周圍各像素的灰度值,而且還和像素坐標(biāo)位置相關(guān)時,稱之為動態(tài)閾值法。對文字圖像而言,由于筆畫和背景的區(qū)分比較明顯,并且動態(tài)閾值法的實(shí)現(xiàn)較為復(fù)雜、計(jì)算時間相對長,因此在文字識別中很少采用。對于以上三種二值化算法中,由于動態(tài)閾值法實(shí)現(xiàn)較為復(fù)雜而且用時較長,很難滿足文字識別中的實(shí)時性要求,因此該算法在字符識別系統(tǒng)中很少被采用。對于光照不均的圖像,采用基于直方圖的自動閾值分割和基于OTSU的二維最大類間方差閾值分割的改進(jìn)算法分割得到的二值圖像都不好。在講解本文采用的二值化算法前,需要介紹一下圖像梯度(即邊緣)的計(jì)算方法。常見的一階邊緣檢測算子有Sobel算子、Prewitt算子、Robert算子和Kirsh算子,二階邊緣檢測算子一般采用拉普拉斯算子或者高斯拉普拉斯算子?;诙A導(dǎo)數(shù)的算子可以用來檢測一個邊緣像素是在邊緣的亮的一邊還是暗的一邊。2) 一條連接二階導(dǎo)數(shù)正極值和負(fù)極值的虛構(gòu)直線將在邊緣中點(diǎn)附近穿過零點(diǎn)。本文采用的二值化算法將使用Sobel算子和高斯拉普拉斯算子,因此下面簡單介紹下Sobel算子和高斯拉普拉斯算子。f(i1,j1)f(i1,j)f(i1,j+1)f(i,j1)f(i,j)f(i,j+1)f(i+1,j1)f(i+1,j)f(i+1,j+1) 像素(i,j)領(lǐng)域像素關(guān)系 那么根據(jù)Sobel算子(i,j)處的梯度是: ()其中,因?yàn)橛?jì)算平方和、平方根需要大量的計(jì)算。拉普拉斯算子常用的模板有兩種。由于以上原因,拉普拉斯算子在分割中所起的作用包括:1) 利用它的零交叉的性質(zhì)進(jìn)行邊緣定位。對第1類作用,拉普拉斯算子與平滑過程一起利用零交叉作為找到邊緣的前兆。用一副圖像與該函數(shù)卷積模糊該圖像,圖像模糊的程度是σ值決定的。00100012101216210121000100 高斯型拉普拉斯算子55模板因?yàn)槎A導(dǎo)數(shù)是線性運(yùn)算,所以用▽2h卷積一幅圖像與首先使用上節(jié)介紹的高斯型平滑函數(shù)卷積圖像,然后計(jì)算所得結(jié)果的拉普拉斯是一樣的。圖像的平滑處理減少了噪聲的影響并且它的主要作用還是抵消由拉普拉斯算子的二階導(dǎo)數(shù)引起的逐漸增加的噪聲影響。輸出: 閾值分割后的二值數(shù)字圖像。Step2:采用基于直方圖自動閾值分割算法對產(chǎn)生的一階梯度信息圖像進(jìn)行閾值分割,得出門限T。Step4:(0,1,2)圖像。從亮背景到暗對象的過渡(沿著水平或垂直掃描線)必須以 s(x,y)中的一個‘2’號后跟一個‘1’號的形式特點(diǎn)。最后,從對象反向向背景的過渡用一個‘1’號后跟一個‘2’號的形式表示。最內(nèi)層的括號包含著對象點(diǎn),標(biāo)記為1(目標(biāo))。按照上方法對三級圖像進(jìn)行橫向掃描,然后再進(jìn)行縱向掃描,最后得出初步的二值圖像。為了濾除這種噪聲,因此需要再對Step5得到的二值圖像,進(jìn)行線濾除和點(diǎn)濾除從而得到最終的二值化圖像。由圖中b)、c)、d)圖像可見,本文采用的二值化算法對光照不均勻的字符數(shù)字圖像進(jìn)行二值化獲得了不錯的效果。 歸一化對于字符識別來說,歸一化是一個很重要的預(yù)處理因素。對于大小不一的字符圖像,處理起來很不方便,因此在通常情況下,在對字符進(jìn)行預(yù)處理的時候,我們必須將單個字符進(jìn)行歸一化處理。進(jìn)過歸一化處理后,一般的能夠?qū)⒋蟮淖址麍D像信息進(jìn)行縮小到固定大小的數(shù)字圖像,這樣在提高識別率的同時也能提高處理的效率。這些方法早已在字符識別中被采用。為了能更加容易的進(jìn)行特征提取和分類,歸一化后的圖像平面(標(biāo)準(zhǔn)平面的)x/y軸的大小是固定的(本文采用20/20)。依靠縱橫比,歸一化后的圖像位于平面的中央且有一個方向是填滿的。則歸一化后的圖形寬度與高度分別用W2和H2表示,則縱橫比定義如下: ()a) 原始圖像b) 采用根據(jù)一維直方圖自動閥值分割效果 c) 采用基于OTSU的二維最大類間方差閾值分割的改進(jìn)算法分割效果d) 采用本文的二值化算法進(jìn)行閥值分割的最終效果(由g)圖進(jìn)行線、點(diǎn)濾波后的結(jié)果)e) 采用本文的二值化算法之三級圖像(由a)圖像進(jìn)行處理) g) 采用本文的二值化算法之縱向掃面(由e)圖像進(jìn)行處理然后與f)圖結(jié)合)f) 采用本文的二值化算法之橫向掃描(由e)圖像進(jìn)行處理) 三種不同二值化算法的比較和本文二值化算法的處理步驟效果圖。在矩的歸一化中,圖像的重心()與標(biāo)準(zhǔn)平面的中心是重合的。本文采取的處理方法是,將有超出部分將其截去。這就會導(dǎo)致一個問題:歸一化后的字符的形狀可能會與原來有很大的差別。而如果保持原圖縱橫比的話,將能夠較好的保持字符形狀,: ()。 ())圖進(jìn)行歸一化處理的效果。 a) 原圖b) 歸一化后的效果 傾斜校正在預(yù)處理的中,傾斜校正也是一個很重要的一個步驟。傾斜校正的手寫體數(shù)字的圖像主要有兩種:一種是數(shù)字間完全沒有限制的,可以連筆,即整體傾斜矯正;另外一種是數(shù)字間彼此孤立的,沒有任何聯(lián)系,即單字符傾斜矯正。本文采用的傾斜算法主要采用的是文獻(xiàn)[18]的算法。本文采用的算法也是基于這一規(guī)律。旋轉(zhuǎn)中心定在圖像的幾何中心處。逆時針旋轉(zhuǎn)角度θ后到達(dá)的點(diǎn)。2) 如果旋轉(zhuǎn)角度θ 1o,轉(zhuǎn)到3)。將B0的所有像素點(diǎn)利用上面的方法分別進(jìn)行順、逆時針旋轉(zhuǎn)角度θ,得到的圖像賦值為BB2,并求出B1高度h寬度w比值和B2高度h寬度w比值。并把旋轉(zhuǎn)角度做改變:。對字符識別而言,字符圖像上的各個像素點(diǎn)對識別率的貢獻(xiàn)并不一樣,細(xì)化處理能極大的消除字符圖像中的冗余點(diǎn),使計(jì)算機(jī)在分析處理、識別時不受筆劃粗細(xì)的影響,快速的接觸到本質(zhì)內(nèi)容,減少運(yùn)算量,從而縮短識別的時間。在圖像分析中,形狀信息是十分重要的。這種處理就是所謂的細(xì)化。但是由于細(xì)化骨架有可能會造成新的畸變,增加對識別的干擾和困難,所以文字細(xì)化的基本要求如下:1) 要保持原有筆劃的連續(xù)性,不能由于細(xì)化造成筆劃斷開。3) 細(xì)化后的骨架應(yīng)盡量是原來筆劃的中心線。按照上面的要求,一副圖像的細(xì)化骨架就可以表示原始圖像中物體的結(jié)構(gòu),所以在物體識別和物體定位中,常常使用物體的細(xì)化骨架信息。細(xì)化算法的大體分類如下:1) 按細(xì)化后圖形的連續(xù)性分,有四鄰域連接算法,八鄰域連接算法。2) 按細(xì)化處理過程分,有串行、并行和串并行處理法。3) 按細(xì)化的運(yùn)算方式分為兩種,即邊緣點(diǎn)刪除和內(nèi)點(diǎn)保留。本文采用了像素領(lǐng)域分析法的細(xì)化算法[19],在速度和保留結(jié)構(gòu)信息的準(zhǔn)確性上較佳。3) 在第二次操作時,當(dāng)且僅當(dāng)條件G1,G2和G4被全部滿足時,則刪除中心像素p(即讓p=0)。條件G2為:,其中,條件G3為:條件G4為 對圖像每個像素都進(jìn)
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1