freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫體數(shù)字識別的軟件設(shè)計(jì)畢業(yè)設(shè)計(jì)論文資料-文庫吧資料

2025-06-29 05:06本頁面
  

【正文】 符識別系統(tǒng)的識別率,因而字符細(xì)化已成為字符識別系統(tǒng)中極為重要的環(huán)節(jié)之一。 b) 經(jīng)過歸一化并傾斜矯正的圖像a) 原圖 歸一化并傾斜矯正效果 細(xì)化字符細(xì)化是通過一定的處理算法將字符重要的像素點(diǎn)保留下來,去除無關(guān)緊要的點(diǎn),得到字符筆劃骨架的技術(shù)。由上算法進(jìn)行逐步求解最接近的近似取得的最佳的傾斜角度,并自動矯正數(shù)字圖像。4) 求出、中最大的一個(gè),將它所對應(yīng)的位圖圖像賦值為活動位圖B0。3) 設(shè)定活動位圖為B0,求出B0的高度h0、寬度w0并求出兩者的比值。旋轉(zhuǎn)前坐標(biāo)為(x0,y0),r表示坐標(biāo)點(diǎn)離原點(diǎn)的距離,則有: 點(diǎn)順時(shí)針,逆時(shí)針旋轉(zhuǎn)示意圖那么旋轉(zhuǎn)后的坐標(biāo)(x1,y1)、(x2,y2)分別為:順時(shí)針旋轉(zhuǎn)角度θ:逆時(shí)針旋轉(zhuǎn)角度θ:以上的旋轉(zhuǎn)方法就是該算法對手寫體數(shù)字的位圖圖像進(jìn)行傾斜矯正時(shí)所要用到的,下面是傾斜矯正的具體算法:1) 先設(shè)置初始旋轉(zhuǎn)角度θ為15o,初始位圖圖像B為活動位圖。那么對任意給定的圖像中的像素點(diǎn)(x0,y0),,圖中(x1,y1)和(x2,y2)分別表示的是(x0,y0)順。在簡單描述算法之前,先做這樣的規(guī)定:圖像中某點(diǎn)旋轉(zhuǎn)方向?yàn)轫槙r(shí)針時(shí),角度為正,為逆時(shí)針時(shí),角度為負(fù)。很多傾斜矯正算法都是基于“當(dāng)圖像傾斜度最小時(shí),圖像的高寬比將達(dá)到最大”這一特點(diǎn)。由于本文在進(jìn)行傾斜矯正時(shí)針對已經(jīng)切分好的單個(gè)字符,因此本文所采用的傾斜矯正算法是單字符傾斜矯正。由于在人們書寫過程中,會有一定的傾斜(傾斜度一般在 0o~45o),如果不對字符圖形進(jìn)行矯正處理,就會影響后期的特征值提取,最終會影響系統(tǒng)的識別率。另外,在本文中,考慮到一般的由于原始圖像的大小比標(biāo)準(zhǔn)平面的大小要大,因此在進(jìn)行歸一化后,一般不會產(chǎn)生斷裂現(xiàn)象,另外加上插值擬合算法的需要一定的計(jì)算時(shí)間,因此本文不對歸一化后的圖像進(jìn)行插值擬合。 a) 原圖像1c) 原圖像1歸一化后結(jié)果b) 原圖像2 d) 原圖像2歸一化后結(jié)果 ,對于書寫長寬規(guī)范的字符,采用保持原圖縱橫比能很好的進(jìn)行歸一化()圖的歸一化結(jié)果),然而,如果在書寫過程中,字符長寬差距較大()圖的歸一化結(jié)果),就可能導(dǎo)致原有的環(huán)形被填充了,因此為了解決這種問題,本文提出的解決方法是。最為典型的是數(shù)字1,如果采用上方法進(jìn)行歸一化處理之后,將會將整個(gè)圖像填滿,這時(shí)字符圖形嚴(yán)重的變形了。設(shè)圖像的中心為P(xc,yc),則圖像重心計(jì)算如下: ()其中,設(shè)圖像的標(biāo)準(zhǔn)平面中心為Q(,),則有: ()設(shè)原圖像的長寬分別為:W1和H1,那么如果α,β表示縱橫比,通過下面公式定義: ()那么設(shè)(x,y),(,)分別表示原圖像的坐標(biāo)和歸一化后圖像的坐標(biāo),那么則有: ()。此時(shí)可能導(dǎo)致歸一化后的圖像并不總是一個(gè)方向填滿,而且有可能超出。 如果歸一化后的圖像填滿了一個(gè)方向,則Max(W2,H2)=L。設(shè)標(biāo)準(zhǔn)平面為正方形(變長用L表示)。然而,在縱橫比歸一化中,標(biāo)準(zhǔn)平面未必總能填滿。本文采用矩歸一化算法對單字符圖像進(jìn)行歸一化處理。歸一化算法有:線性歸一化、非線性歸一化和矩歸一化。歸一化處理一般的是將單字符圖像進(jìn)行歸一化到固定的大小的數(shù)字圖像,例如本文采用的歸一化后的數(shù)字圖像大小為2020。由于人們在書寫、設(shè)備使用焦距不同等原因可以導(dǎo)致獲取后的數(shù)字圖像字符的大小不一。圖a) e) f) g)d)順序顯示了本文算法在進(jìn)行閾值分割的中逐步處理的效果圖(其中e)由Step4產(chǎn)生的三級圖像,圖像中只包含有灰、白、黑三種顏色,黑色表示Step5中被標(biāo)記‘0’的像素,灰色表示被標(biāo)記為‘2’的像素,白色則表示被標(biāo)記為‘1’的像素)。,三種算法的效果比較。Step6:由上一步得出的二值圖像,往往由于閾值分割中,少數(shù)邊緣像素被劃分為背景,在經(jīng)過Step5處理后可能會產(chǎn)生直線的噪聲。沿著相同的掃描線除了那些被(2,1)和(1,2)包圍著的(0或1)的序列外,所有其它點(diǎn)都標(biāo)記為0(背景)。因此,包含對象部分的一條水平或垂直掃描線具有如下結(jié)構(gòu):(…)(2,1)(0或1)(1,2)(…)其中(…)表示1,2和0的任意組合。對象內(nèi)部的像素不是標(biāo)記為‘0’就是標(biāo)記為‘1’。 ()Step5:經(jīng)過上4步處理產(chǎn)生的三級圖像是有意義的對象,其中‘0’對應(yīng)的是背景。Step3:采用高斯型拉普拉斯算子對輸入數(shù)字圖像進(jìn)行計(jì)算,獲取各個(gè)像素的二階梯度信息▽2f。詳細(xì)步驟:Step1:采用Sobel算子()對輸入數(shù)字圖像進(jìn)行梯度計(jì)算,獲取各個(gè)像素的一階梯度信息▽f。在基于以上知識,接下來詳細(xì)介紹本文采用文獻(xiàn)[17]的閾值分割算法,其詳細(xì)步驟如下:輸入: 經(jīng)過高斯平滑濾波器濾波后的數(shù)字圖像作為閾值分割的輸入數(shù)字圖像處理。因此,使用拉普拉斯算子的目的是提供一幅用零交叉確定邊緣位置的圖像。H的拉普拉斯算子(h關(guān)于r的二階導(dǎo)數(shù))是: ()這個(gè)公式一般叫做高斯型的拉普拉斯算子??紤]函數(shù): ()這里r2 = x2 + y2,σ是標(biāo)準(zhǔn)差。2) 確定一個(gè)像素是在一條邊緣暗的一邊還是亮的一邊。111181111010141010 常用的兩種拉普拉斯模板拉普拉斯算子一般不以原始形式用于邊緣檢測是由于存在下列原因:首先作為一個(gè)二階導(dǎo)數(shù),拉普拉斯算子對噪聲具有無法接受的敏感性;其次拉普拉斯算子的幅值會產(chǎn)生雙邊緣,這是復(fù)雜的分割不希望有的結(jié)果;最后拉普拉斯算子不能檢測邊緣的方向。因此經(jīng)常使用一種方法是用絕對值對梯度進(jìn)行近似: ()這個(gè)公式在計(jì)算方面更有吸引力,而且它仍保持著同灰度級的相對變化。121000121101202101 Sobel算子常用模板Sobel算子是采用的是交叉差分計(jì)算,以來求得每個(gè)像素的梯度幅值。后面我們可以看到本文采用的基于梯度閾值分割的算法就是基于上述兩條二階導(dǎo)數(shù)性質(zhì)實(shí)現(xiàn)的。除此之外,圍繞一條邊緣,二階導(dǎo)數(shù)具有兩條附加性質(zhì)[17]:1) 對圖像中的每條邊緣二階導(dǎo)數(shù)生成兩個(gè)值(一個(gè)不希望得到的特點(diǎn))。對于基于一階導(dǎo)數(shù)的算子可以檢測圖像中的一個(gè)點(diǎn)是否是邊緣點(diǎn)(也就是判斷一個(gè)點(diǎn)是否在斜坡上)。邊緣是指與周圍圖像灰度有階躍變化的像素的集合,邊緣是灰度值不連續(xù)的結(jié)果,邊緣的檢測可以借助空間域微分算子通過卷積運(yùn)算來完成,常用的梯度算子有基于一階導(dǎo)數(shù)的邊緣檢測算子和基于二階導(dǎo)數(shù)的邊緣檢測算子。鑒于在實(shí)際中,由于數(shù)字圖像的獲取階段由于紙張不平整、反射光不均勻、光照不均勻所導(dǎo)致而得到的數(shù)字圖像其目標(biāo)圖像和背景圖像灰度整體沒有一個(gè)明顯a) 原始圖像c) 采用基于OTSU的二維最大類間方差閾值分割的改進(jìn)算法分割效果b) 采用一維直方圖自動閥值分割效果 基于灰度分布的二值化的界限,而基于梯度信息的二值化算法能很好的對光照不均的數(shù)字圖像進(jìn)行二值化,因此本文采用的是基于梯度信息(邊緣)的二值化算法,對圖像進(jìn)行二值化處理。采用整體閾值法和局部閾值法能很好的將背景和目標(biāo)進(jìn)行分割,但是如果目標(biāo)灰度和背景灰度差距較小或者光照不均勻的數(shù)字圖像,如果采用上述兩種算法都很難達(dá)到較好的效果。[16]進(jìn)行分割的結(jié)果。這種方法可以處理低質(zhì)量甚至單峰直方圖圖像。對于書寫質(zhì)量差,干擾較嚴(yán)重的字符,采用整體閾值法二值化,效果不太理想,局部閾值法有可能得到較為滿意的二值化結(jié)果。2) 局部閾值法由像素(i,j)的灰度值p(i,j)和像素周圍點(diǎn)的局部灰度特性確定閾值的方法稱為局部閾值法。1) 整體閾值法(又稱全局閾值法)僅由像素點(diǎn)(i,j)的灰度值p(i,j)確定閾值的方法稱為整體閾值選擇法。對于字符識別來說,只需要保留文字特征的二值信息即可。圖像的二值化可以根據(jù)下面的閾值來處理:假設(shè)一幅原始圖像的像素值p(i,j)的取值范圍為[0,m],那么設(shè)有其閾值為T=t,0tm,則映射成新的二值圖像的像素值p’(i,j)為: ()對于基于灰度分布的二值化就是一個(gè)帶閾值T的二值映射過程,其分割效果的關(guān)鍵在于閾值T的選取。圖像的二值化有幾種類型,其中主要的有基于灰度分布的二值化,也有基于梯度信息的二值化。另一方面,在某些情況下即使圖像本身是有灰度的,也將其轉(zhuǎn)換成二值圖像再處理。在數(shù)字圖像處理中,二值化占有非常重要的地位。 二值化二值圖像是指整幅圖像頁面內(nèi)僅有黑(像素值為0),白(像素值為1)的二值圖像。121242121 33高斯模板高斯濾波器相對簡單平滑濾波器的效率較低(需要額外乘法運(yùn)算),在離散型雜點(diǎn)的消除方面,高斯平滑的效果并不理想。因此高斯平滑濾波器與圖像簡單平滑不同的是,它在對領(lǐng)域內(nèi)像素灰度進(jìn)行平均時(shí),給與了不同位置的像素不同的權(quán)值。圖像的高斯平滑濾波器,其濾波器的模板設(shè)計(jì)是根據(jù)高斯函數(shù)的最佳逼近的二項(xiàng)式展開的系數(shù)來決定。但是本文在對圖片進(jìn)行二值化處理中,后期將采用基于梯度的二值化處理,在梯度二值化處理中需要采用拉普拉斯變換提取邊緣特征,而拉普拉斯變換對噪聲特別敏感,因此我將會采用高斯濾波器對圖像進(jìn)行濾波,然后再采用高斯拉普拉斯提取邊緣信息。 a) 含有噪聲的圖像b) 用33的中值濾波后的圖像 中值濾波中值濾波對于很多種隨機(jī)噪聲,它都有良好的去噪能力,且在相同尺寸下比起線性平滑濾波器引起的模糊較少。圖中M點(diǎn)像素的灰度等于其領(lǐng)域內(nèi)9個(gè)(A0~A7,M)像素灰度值的中間值。中值濾波是較為經(jīng)典的一個(gè)空間域?yàn)V波算法,該算法是將一個(gè)nn大小的模板從上到下從左到右在圖像上進(jìn)行移動,在對所移到的各個(gè)像素上,使用模板中所有的像素灰度值的中間值取代當(dāng)前像素的灰度值: ()中值濾波器常見的有33和55大小的模板。輸出圖像的每一個(gè)像素的取值都是根據(jù)模板對輸入像素相應(yīng)領(lǐng)域內(nèi)的像素值進(jìn)行計(jì)算得到的。但是由于頻域?yàn)V波需要頻域轉(zhuǎn)換后再采用濾波器濾波,其實(shí)現(xiàn)起來較為復(fù)雜,效率也相對較低,而空間域?yàn)V波方法速度較快、實(shí)現(xiàn)簡單、效果很好,因此現(xiàn)在很多研究者中都采用空間域?yàn)V波方法對數(shù)字圖像進(jìn)行濾波。濾波去噪的方法可以簡單分為兩類:頻域?yàn)V波和空間域?yàn)V波。如果輸入不良伴有較大的噪聲,濾波去噪后不能達(dá)到理想效果,將必然的嚴(yán)重影響處理的全過程以至最后的識別結(jié)果。噪聲對于圖像的預(yù)處理非常重要,它會影響圖像處理的輸入、采集、處理各個(gè)環(huán)節(jié)和識別結(jié)果的全過程。例如,使用CCD攝像機(jī)獲取的圖像,光照強(qiáng)度和傳感器溫度是造成圖像中產(chǎn)生大量噪聲的主要因素。 平滑去噪數(shù)字圖像的噪聲主要來源于圖像的獲取(數(shù)字化過程)。由于本文主要不是針對類似于票據(jù)識別中的這種具有各種背景底色或者印章之類的數(shù)字識別,本文主要研究的是在紙(無底紋、印章等)上寫的手寫體數(shù)字進(jìn)行識別。如果預(yù)處理處理得不夠理想,會從很大程度上降低整個(gè)系統(tǒng)的識別率。第七章:對整個(gè)論文的研究和工作進(jìn)行了總結(jié)并指出了進(jìn)一步的研究方向。初步介紹本文采用的BP神經(jīng)網(wǎng)絡(luò),并給出本文采用的學(xué)習(xí)算法和訓(xùn)練算法。另外本章中對傳統(tǒng)的細(xì)化算法提出了一種的改進(jìn)方法。由于單一的特征對數(shù)字的描述有一定的局限性,因此本文將采用多特征組合的特征向量作為字符的描述特征值來識別數(shù)字。在特征值提取模塊中,需要根據(jù)特征表達(dá)方式或者特征提取技術(shù)的不同,選用不同的預(yù)處理技術(shù)。本章將對當(dāng)前無約束手寫體數(shù)字串的切分技術(shù)進(jìn)行概述,最后詳細(xì)介紹本文采用的手寫體數(shù)字串的切分方法。同時(shí)本章針對幾種閾值分割進(jìn)行比較,分析其各自的優(yōu)缺點(diǎn)。第二章:主要是研究手寫體數(shù)字識別中的預(yù)處理技術(shù)。第一章主要是對OCR和手寫體數(shù)字識別作簡單的介紹。我們將對原始獲取的數(shù)字圖像(以及模擬一個(gè)簡單的寫字板)進(jìn)行識別。例如,在金融數(shù)字的識別中,要求錯(cuò)誤識別率相當(dāng)高,那么在判別處理時(shí)嚴(yán)格限制接收條件就可以降低識別的錯(cuò)誤率。4) 判別處理階段當(dāng)分類完成后,為了保持系統(tǒng)的識別性能,通常需要對識別結(jié)果作一次判別處理,認(rèn)為該結(jié)果是否被接收還是拒絕??紤]到神經(jīng)網(wǎng)絡(luò)能夠很好的容忍字符的形狀變換、噪聲的影響。3) 分類識別階段分類識別是數(shù)字識別的關(guān)鍵步驟之一,它是指分類器依據(jù)特征提取階段抽取的特征,就送入分類器中做最后的字符分類識別。換句話說特征提取是為了去除圖像信息中對分類沒有幫助的部分,將圖像信息集中到幾個(gè)有代表性的特征上來的過程。具體方法可以詳見第二章。預(yù)處理階段在該系統(tǒng)中是一個(gè)很重要的階段。對于字符識別的預(yù)處理過程一般包括:濾波去噪、二值化、字符切分、圖像校正、歸一化處理。 原始圖像獲取預(yù)處理特征提取分類識別判別處理識別結(jié)果 常見數(shù)字識別系統(tǒng)框架1) 預(yù)處理階段在獲取原始數(shù)字圖像過程中,由于光照、背景紋理、鏡頭分辨率、拍攝角度等原因,難免會造成圖像失真并帶有噪聲。但是就一般情況看,一個(gè)完整的OCR識別系統(tǒng)可分為:原始圖像獲取,預(yù)處理,特征抽取,分類識別和判別處理等模塊。總之,一般的系統(tǒng)對書寫
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1