freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

手寫體數(shù)字識別的軟件設計畢業(yè)設計論文資料-在線瀏覽

2024-08-03 05:06本頁面
  

【正文】 Artificial Neural Network ,ANN)[5],支持向量機(Support Vector Machine)[6,7],隱馬爾科夫模型(Hidden Markov Model,HMM)[8]等,而這些識別工具至今仍然是研究的熱點。2) 支持向量機是Vapnik 等人根據(jù)統(tǒng)計學理論提出的一種新型機器學習方法。3) 隱馬爾科夫模型是一類基于馬爾科夫隨機過程的統(tǒng)計模型[9]。從上世紀90年代開始,一些研究者已經將隱馬爾科夫模型引入到了圖像處理、識別和分析中來。這是因為,在一般情況下,當涉及到數(shù)字識別時,人們往往要求識別系統(tǒng)有很高的識別精度(又稱可靠性)[10],特別是有關金融的數(shù)字識別時,如支票中填寫的金額部分,更是如此。總結數(shù)字識別的難點主要在于以下幾方面:1) 阿拉伯數(shù)字的字型信息量很小,不同數(shù)字寫法字形相差又不大,使得準確區(qū)分某些數(shù)字相當困難[11]。3) 在實際應用中,對數(shù)字的單字識別正確率的要求要比文字要苛刻得多。而且數(shù)字識別經常涉及到財務、金融領域,其嚴格性更是不言而喻的。4) 由于脫機手寫數(shù)字的輸入只是簡單的一幅圖像,它不像聯(lián)機輸入那樣可以從物理輸入設備上獲得字符筆畫的順序信息[14],因此脫機手寫數(shù)字識別是一個更有挑戰(zhàn)性的問題。在過去的數(shù)十年中,研究者提出了許多識別方法,目前手寫體數(shù)字識別方法可以分為兩類:基于結構特征的方法和基于統(tǒng)計特征的方法[15]。在我國郵電部第三研究所,以信函分揀為目的,識別書寫在信封上的郵政編碼。 德國E9的Friedhelm Schwenker采用SVRBF40對手寫體數(shù)字進行識別,測試樣本10000個,%。然而以上提到的系統(tǒng),要么對書寫的正規(guī)程度有要求,要么其測試樣本和訓練樣本出于同一批人之手。 手寫體數(shù)字識別系統(tǒng)概述不同的識別系統(tǒng),在具體處理一幅待識別圖像時,處理的步驟可能并不完全相同。()。由于這些噪聲的影響,如果對獲取得到的數(shù)字圖像進行直接處理的話通常不能得到滿意的結果,因此在獲取原始數(shù)字圖像后,需要對圖像進行預處理。經過預處理后的圖片不僅能夠有效濾除噪聲,并且能夠將不同的大小、傾斜角度的字符進行歸一化到一個固定大小,對大量數(shù)據(jù)進行壓縮處理。預處理效果的好壞會直接影響到整個系統(tǒng)的性能。2) 特征提取階段由于原始數(shù)字圖像數(shù)據(jù)量大,冗余信息較多,一般不進行直接識別,而是進行提取有效特征數(shù)據(jù)、壓縮數(shù)據(jù),然后再進行識別。特征值的提取一般包括:筆畫、拓撲點、結構突變點、投影形狀、點(端點、連點、三叉點、四叉點、垂直交點,水平交點等)、弧、連通區(qū)域、凸凹形狀、環(huán)、字符整體輪廓、檢查必要的基元是否存在、不可有的基元是否出現(xiàn)等特征。該環(huán)節(jié)現(xiàn)在普遍采用的是基于神經網絡和模板匹配兩種模式。因此,在分類其中,我們將提取到的特征值輸入到已經訓練好的神經網絡中進行分類識別。這個階段可以根據(jù)具體的應用來設計不同的判別決策。 本文內容安排我們主要目標是對有噪聲、一定約束書寫條件下的脫機手寫體數(shù)字串的切割和識別算法進行一些探討性研究,以期提高其準確性,獲得更高的可靠性。本文內容上總體安排為七章。介紹內容有:OCR及手寫體數(shù)字識別的歷史及現(xiàn)狀;手寫體數(shù)字識別的意義和難點;數(shù)字串識別系統(tǒng)的整體描述以及本文的研究內容。本文采用預處理有濾波去噪,閾值分割,歸一化,細化等技術,該章節(jié)對其進行詳細分析。第三章:主要研究的是手寫體數(shù)字識別中的切分技術。第四章:主要研究的是手寫體數(shù)字識別中的特征值提取技術。比如對于關鍵點特征的提取,則需要使用字符的外輪廓、骨架信息。本章將詳細介紹這些相關的特征值的提取步驟。第五章:主要簡單介紹神經網絡分類識別器實現(xiàn)原理。第六章:介紹了本文實現(xiàn)的系統(tǒng)的開發(fā)和運行環(huán)境,以及系統(tǒng)的處理過程圖,并通過對NIST的圖像數(shù)據(jù)庫進行測試,給出相關實驗數(shù)據(jù)。2 手寫體數(shù)字識別中預處理技術預處理對于一個良好的識別系統(tǒng)不僅是一個必不可少的環(huán)節(jié),而且是至關重要的。一般手寫體數(shù)字識別而言,預處理包括很多部分,如平滑、去噪、二值化、歸一化、細化、形狀校正、去各種類印章、背景底紋等等。因此本文就省去了去除類印章、背景底紋等的這些操作。圖像傳感器的工作情況受各種因素的影響,如圖像獲取中的環(huán)境條件和傳感元器件自身的質量。除此之外對于有些傳感元器件的自身質量,如手機自帶的照相設備一般分辨率較低,在獲取數(shù)字圖像時會產生斑點噪聲。特別是圖像的輸入、采集的噪聲是十分關鍵的問題。噪聲去除已經成為圖像處理極其重要的步驟,然而現(xiàn)在還沒有一個通用的濾波去噪方法對所有的圖片適用,一般的圖像預處理必須根據(jù)實際情況選擇不同濾波去噪方法進行比較,最后得出最佳的濾波去噪方法。頻域濾波一般采用的方法是將空間圖像采用快速傅里葉變換轉換成頻域信息,然后再采用信號處理的濾波方法進行濾波(一般采用的有阻濾波器、帶通濾波器、陷波濾波器、最佳陷波濾波器等),濾波處理后再通過傅里葉逆變換進行逆變換成空間圖像信息,從而達到濾波效果。對于空間域濾波算法中最常用的是平滑濾波去噪法,其主要思想為在圖像空間中借助模板對圖像進行領域操作,用平均運算方法去除突然變化的點從而濾掉一定的噪聲。常見的平滑去噪方法有:nn中值濾波器,高斯濾波器等等。3的中值濾波器。A3A2A1A4MA0A5A6A7 33的中值濾波器模板示意圖3的中值濾波器對帶有噪聲的圖片進行濾波后的效果。中值濾波器尤其對單級或雙極脈沖噪聲非常有效。因此,需要簡單介紹一下空間域的高斯平滑濾波器。根據(jù)高斯函數(shù)的可分離性可以得到,二維高斯濾波器能用2個一維高斯濾波器逐次卷積來實現(xiàn),一個沿水平方向,一個沿垂直方向。常見的高斯模板(33),模板上越靠近領域中心的位置,其權值越高,如此安排權值的意義在于用此模板進行圖像平滑時,在對圖像細節(jié)進行模糊的同時,可以更多的保留圖像總體的灰度分布特征。然而在保留圖像的總體特征上,高斯濾波器表現(xiàn)了很好的性能。一般的文字識別的文字圖像、進行指紋識別的指紋圖像,大多數(shù)都需要將灰度圖像轉化成二值圖像。這是因為,一方面類似于字符、指紋、工程圖等圖像本身就是二值的。這樣在圖像處理系統(tǒng)中,可以減少圖像信息并提高處理速度?;诨叶确植嫉亩祷幚硪话闶峭ㄟ^設定閾值,把它變?yōu)閮H用二值表示前景和背景顏色的圖像。有的應用可以由計算機自動選取,有的則需要人工干預,所以閾值T的選取視應用范圍而有所不同。目前,眾多學者對此已經進行了比較詳細的研究,并提出了許多閾值選取的算法,這些算法大體上可以劃分為三類:整體閾值法,局部閾值法和動態(tài)閾值法。典型的閾值選取算法有直方圖法,熵閾值法等等,一般地,如果圖像灰度直方圖呈現(xiàn)雙峰,或者圖像中背景灰度與目標灰度呈明顯分離狀,整體閾值法分割圖像效果良好且速度快。不同的閾值法源于N(i,j)的不同選擇。3) 動態(tài)閾值法當閾值選擇不僅取決于該像素閾值及其周圍各像素的灰度值,而且還和像素坐標位置相關時,稱之為動態(tài)閾值法。對文字圖像而言,由于筆畫和背景的區(qū)分比較明顯,并且動態(tài)閾值法的實現(xiàn)較為復雜、計算時間相對長,因此在文字識別中很少采用。對于以上三種二值化算法中,由于動態(tài)閾值法實現(xiàn)較為復雜而且用時較長,很難滿足文字識別中的實時性要求,因此該算法在字符識別系統(tǒng)中很少被采用。對于光照不均的圖像,采用基于直方圖的自動閾值分割和基于OTSU的二維最大類間方差閾值分割的改進算法分割得到的二值圖像都不好。在講解本文采用的二值化算法前,需要介紹一下圖像梯度(即邊緣)的計算方法。常見的一階邊緣檢測算子有Sobel算子、Prewitt算子、Robert算子和Kirsh算子,二階邊緣檢測算子一般采用拉普拉斯算子或者高斯拉普拉斯算子?;诙A導數(shù)的算子可以用來檢測一個邊緣像素是在邊緣的亮的一邊還是暗的一邊。2) 一條連接二階導數(shù)正極值和負極值的虛構直線將在邊緣中點附近穿過零點。本文采用的二值化算法將使用Sobel算子和高斯拉普拉斯算子,因此下面簡單介紹下Sobel算子和高斯拉普拉斯算子。f(i1,j1)f(i1,j)f(i1,j+1)f(i,j1)f(i,j)f(i,j+1)f(i+1,j1)f(i+1,j)f(i+1,j+1) 像素(i,j)領域像素關系 那么根據(jù)Sobel算子(i,j)處的梯度是: ()其中,因為計算平方和、平方根需要大量的計算。拉普拉斯算子常用的模板有兩種。由于以上原因,拉普拉斯算子在分割中所起的作用包括:1) 利用它的零交叉的性質進行邊緣定位。對第1類作用,拉普拉斯算子與平滑過程一起利用零交叉作為找到邊緣的前兆。用一副圖像與該函數(shù)卷積模糊該圖像,圖像模糊的程度是σ值決定的。00100012101216210121000100 高斯型拉普拉斯算子55模板因為二階導數(shù)是線性運算,所以用▽2h卷積一幅圖像與首先使用上節(jié)介紹的高斯型平滑函數(shù)卷積圖像,然后計算所得結果的拉普拉斯是一樣的。圖像的平滑處理減少了噪聲的影響并且它的主要作用還是抵消由拉普拉斯算子的二階導數(shù)引起的逐漸增加的噪聲影響。輸出: 閾值分割后的二值數(shù)字圖像。Step2:采用基于直方圖自動閾值分割算法對產生的一階梯度信息圖像進行閾值分割,得出門限T。Step4:(0,1,2)圖像。從亮背景到暗對象的過渡(沿著水平或垂直掃描線)必須以 s(x,y)中的一個‘2’號后跟一個‘1’號的形式特點。最后,從對象反向向背景的過渡用一個‘1’號后跟一個‘2’號的形式表示。最內層的括號包含著對象點,標記為1(目標)。按照上方法對三級圖像進行橫向掃描,然后再進行縱向掃描,最后得出初步的二值圖像。為了濾除這種噪聲,因此需要再對Step5得到的二值圖像,進行線濾除和點濾除從而得到最終的二值化圖像。由圖中b)、c)、d)圖像可見,本文采用的二值化算法對光照不均勻的字符數(shù)字圖像進行二值化獲得了不錯的效果。 歸一化對于字符識別來說,歸一化是一個很重要的預處理因素。對于大小不一的字符圖像,處理起來很不方便,因此在通常情況下,在對字符進行預處理的時候,我們必須將單個字符進行歸一化處理。進過歸一化處理后,一般的能夠將大的字符圖像信息進行縮小到固定大小的數(shù)字圖像,這樣在提高識別率的同時也能提高處理的效率。這些方法早已在字符識別中被采用。為了能更加容易的進行特征提取和分類,歸一化后的圖像平面(標準平面的)x/y軸的大小是固定的(本文采用20/20)。依靠縱橫比,歸一化后的圖像位于平面的中央且有一個方向是填滿的。則歸一化后的圖形寬度與高度分別用W2和H2表示,則縱橫比定義如下: ()a) 原始圖像b) 采用根據(jù)一維直方圖自動閥值分割效果 c) 采用基于OTSU的二維最大類間方差閾值分割的改進算法分割效果d) 采用本文的二值化算法進行閥值分割的最終效果(由g)圖進行線、點濾波后的結果)e) 采用本文的二值化算法之三級圖像(由a)圖像進行處理) g) 采用本文的二值化算法之縱向掃面(由e)圖像進行處理然后與f)圖結合)f) 采用本文的二值化算法之橫向掃描(由e)圖像進行處理) 三種不同二值化算法的比較和本文二值化算法的處理步驟效果圖。在矩的歸一化中,圖像的重心()與標準平面的中心是重合的。本文采取的處理方法是,將有超出部分將其截去。這就會導致一個問題:歸一化后的字符的形狀可能會與原來有很大的差別。而如果保持原圖縱橫比的話,將能夠較好的保持字符形狀,: ()。 ())圖進行歸一化處理的效果。 a) 原圖b) 歸一化后的效果 傾斜校正在預處理的中,傾斜校正也是一個很重要的一個步驟。傾斜校正的手寫體數(shù)字的圖像主要有兩種:一種是數(shù)字間完全沒有限制的,可以連筆,即整體傾斜矯正;另外一種是數(shù)字間彼此孤立的,沒有任何聯(lián)系,即單字符傾斜矯正。本文采用的傾斜算法主要采用的是文獻[18]的算法。本文采用的算法也是基于這一規(guī)律。旋轉中心定在圖像的幾何中心處。逆時針旋轉角度θ后到達的點。2) 如果旋轉角度θ 1o,轉到3)。將B0的所有像素點利用上面的方法分別進行順、逆時針旋轉角度θ,得到的圖像賦值為BB2,并求出B1高度h寬度w比值和B2高度h寬度w比值。并把旋轉角度做改變:。對字符識別而言,字符圖像上的各個像素點對識別率的貢獻并不一樣,細化處理能極大的消除字符圖像中的冗余點,使計算機在分析處理、識別時不受筆劃粗細的影響,快速的接觸到本質內容,減少運算量,從而縮短識別的時間。在圖像分析中,形狀信息是十分重要的。這種處理就是所謂的細化。但是由于細化骨架有可能會造成新的畸變,增加對識別的干擾和困難,所以文字細化的基本要求如下:1) 要保持原有筆劃的連續(xù)性,不能由于細化造成筆劃斷開。3) 細化后的骨架應盡量是原來筆劃的中心線。按照上面的要求,一副圖像的細化骨架就可以表示原始圖像中物體的結構,所以在物體識別和物體定位中,常常使用物體的細化骨架信息。細化算法的大體分類如下:1) 按細化后圖形的連續(xù)性分,有四鄰域連接算法,八鄰域連接算法。2) 按細化處理過程分,有串行、并行和串并行處理法。3) 按細化的運算方式分為兩種,即邊緣點刪除和內點保留。本文采用了像素領域分析法的細化算法[19],在速度和保留結構信息的準確性上較佳。3) 在第二次操作時,當且僅當條件G1,G2和G4被全部滿足時,則刪除中心像素p(即讓p=0)。條件G2為:,其中,條件G3為:條件G4為 對圖像每個像素都進
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1