freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫體數(shù)字識(shí)別的軟件設(shè)計(jì)畢業(yè)設(shè)計(jì)論文資料-文庫(kù)吧

2025-06-08 05:06 本頁(yè)面


【正文】 ,其嚴(yán)格性更是不言而喻的。因此,對(duì)手寫數(shù)字識(shí)別系統(tǒng)的要求不僅僅是單純的高正確率,更重要的是極低的誤識(shí)率。4) 由于脫機(jī)手寫數(shù)字的輸入只是簡(jiǎn)單的一幅圖像,它不像聯(lián)機(jī)輸入那樣可以從物理輸入設(shè)備上獲得字符筆畫的順序信息[14],因此脫機(jī)手寫數(shù)字識(shí)別是一個(gè)更有挑戰(zhàn)性的問(wèn)題。 國(guó)內(nèi)外研究現(xiàn)狀手寫體數(shù)字識(shí)別在學(xué)科上屬于模式識(shí)別和人工智能的范疇。在過(guò)去的數(shù)十年中,研究者提出了許多識(shí)別方法,目前手寫體數(shù)字識(shí)別方法可以分為兩類:基于結(jié)構(gòu)特征的方法和基于統(tǒng)計(jì)特征的方法[15]。通過(guò)幾十年來(lái)各國(guó)研究學(xué)者得對(duì)數(shù)字識(shí)別的研究,國(guó)內(nèi)外在手寫識(shí)別上也取得了一定的成就。在我國(guó)郵電部第三研究所,以信函分揀為目的,識(shí)別書寫在信封上的郵政編碼。其它用傳統(tǒng)方法進(jìn)行識(shí)別研究的有中國(guó)科學(xué)院自動(dòng)化研究所,該所對(duì)手寫體數(shù)字識(shí)別的研究歷史幾乎有20年了,在他們新近的報(bào)告中,利用以有限狀態(tài)自動(dòng)機(jī)為主的識(shí)別途徑識(shí)別1100個(gè)手寫體數(shù)字,%,拒識(shí)4%,%,上海交通大學(xué)基于壓縮字結(jié)構(gòu)特征的手寫體數(shù)字識(shí)別算法選取了12600個(gè)樣本組成訓(xùn)練集,6000個(gè)樣本組成測(cè)試集,用BP網(wǎng)絡(luò)進(jìn)行分類,%,%,%。 德國(guó)E9的Friedhelm Schwenker采用SVRBF40對(duì)手寫體數(shù)字進(jìn)行識(shí)別,測(cè)試樣本10000個(gè),%。清華大學(xué)采用SVM對(duì)金融票據(jù)中的手寫體數(shù)字進(jìn)行識(shí)別,測(cè)試樣本20000個(gè),識(shí)別率約為92%。然而以上提到的系統(tǒng),要么對(duì)書寫的正規(guī)程度有要求,要么其測(cè)試樣本和訓(xùn)練樣本出于同一批人之手。總之,一般的系統(tǒng)對(duì)書寫人員限制較多,或者對(duì)書寫的正規(guī)程度有要求,或者對(duì)書寫位置有要求,或者對(duì)所用筆、紙有要求,例如對(duì)稅務(wù)報(bào)表的識(shí)別就要求用規(guī)定的字型書寫數(shù)字,并且對(duì)書寫的位置有要求,而真正的無(wú)限制手寫體數(shù)字的識(shí)別的研究還有待進(jìn)一步提高。 手寫體數(shù)字識(shí)別系統(tǒng)概述不同的識(shí)別系統(tǒng),在具體處理一幅待識(shí)別圖像時(shí),處理的步驟可能并不完全相同。但是就一般情況看,一個(gè)完整的OCR識(shí)別系統(tǒng)可分為:原始圖像獲取,預(yù)處理,特征抽取,分類識(shí)別和判別處理等模塊。()。 原始圖像獲取預(yù)處理特征提取分類識(shí)別判別處理識(shí)別結(jié)果 常見(jiàn)數(shù)字識(shí)別系統(tǒng)框架1) 預(yù)處理階段在獲取原始數(shù)字圖像過(guò)程中,由于光照、背景紋理、鏡頭分辨率、拍攝角度等原因,難免會(huì)造成圖像失真并帶有噪聲。由于這些噪聲的影響,如果對(duì)獲取得到的數(shù)字圖像進(jìn)行直接處理的話通常不能得到滿意的結(jié)果,因此在獲取原始數(shù)字圖像后,需要對(duì)圖像進(jìn)行預(yù)處理。對(duì)于字符識(shí)別的預(yù)處理過(guò)程一般包括:濾波去噪、二值化、字符切分、圖像校正、歸一化處理。經(jīng)過(guò)預(yù)處理后的圖片不僅能夠有效濾除噪聲,并且能夠?qū)⒉煌拇笮?、傾斜角度的字符進(jìn)行歸一化到一個(gè)固定大小,對(duì)大量數(shù)據(jù)進(jìn)行壓縮處理。預(yù)處理階段在該系統(tǒng)中是一個(gè)很重要的階段。預(yù)處理效果的好壞會(huì)直接影響到整個(gè)系統(tǒng)的性能。具體方法可以詳見(jiàn)第二章。2) 特征提取階段由于原始數(shù)字圖像數(shù)據(jù)量大,冗余信息較多,一般不進(jìn)行直接識(shí)別,而是進(jìn)行提取有效特征數(shù)據(jù)、壓縮數(shù)據(jù),然后再進(jìn)行識(shí)別。換句話說(shuō)特征提取是為了去除圖像信息中對(duì)分類沒(méi)有幫助的部分,將圖像信息集中到幾個(gè)有代表性的特征上來(lái)的過(guò)程。特征值的提取一般包括:筆畫、拓?fù)潼c(diǎn)、結(jié)構(gòu)突變點(diǎn)、投影形狀、點(diǎn)(端點(diǎn)、連點(diǎn)、三叉點(diǎn)、四叉點(diǎn)、垂直交點(diǎn),水平交點(diǎn)等)、弧、連通區(qū)域、凸凹形狀、環(huán)、字符整體輪廓、檢查必要的基元是否存在、不可有的基元是否出現(xiàn)等特征。3) 分類識(shí)別階段分類識(shí)別是數(shù)字識(shí)別的關(guān)鍵步驟之一,它是指分類器依據(jù)特征提取階段抽取的特征,就送入分類器中做最后的字符分類識(shí)別。該環(huán)節(jié)現(xiàn)在普遍采用的是基于神經(jīng)網(wǎng)絡(luò)和模板匹配兩種模式。考慮到神經(jīng)網(wǎng)絡(luò)能夠很好的容忍字符的形狀變換、噪聲的影響。因此,在分類其中,我們將提取到的特征值輸入到已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中進(jìn)行分類識(shí)別。4) 判別處理階段當(dāng)分類完成后,為了保持系統(tǒng)的識(shí)別性能,通常需要對(duì)識(shí)別結(jié)果作一次判別處理,認(rèn)為該結(jié)果是否被接收還是拒絕。這個(gè)階段可以根據(jù)具體的應(yīng)用來(lái)設(shè)計(jì)不同的判別決策。例如,在金融數(shù)字的識(shí)別中,要求錯(cuò)誤識(shí)別率相當(dāng)高,那么在判別處理時(shí)嚴(yán)格限制接收條件就可以降低識(shí)別的錯(cuò)誤率。 本文內(nèi)容安排我們主要目標(biāo)是對(duì)有噪聲、一定約束書寫條件下的脫機(jī)手寫體數(shù)字串的切割和識(shí)別算法進(jìn)行一些探討性研究,以期提高其準(zhǔn)確性,獲得更高的可靠性。我們將對(duì)原始獲取的數(shù)字圖像(以及模擬一個(gè)簡(jiǎn)單的寫字板)進(jìn)行識(shí)別。本文內(nèi)容上總體安排為七章。第一章主要是對(duì)OCR和手寫體數(shù)字識(shí)別作簡(jiǎn)單的介紹。介紹內(nèi)容有:OCR及手寫體數(shù)字識(shí)別的歷史及現(xiàn)狀;手寫體數(shù)字識(shí)別的意義和難點(diǎn);數(shù)字串識(shí)別系統(tǒng)的整體描述以及本文的研究?jī)?nèi)容。第二章:主要是研究手寫體數(shù)字識(shí)別中的預(yù)處理技術(shù)。本文采用預(yù)處理有濾波去噪,閾值分割,歸一化,細(xì)化等技術(shù),該章節(jié)對(duì)其進(jìn)行詳細(xì)分析。同時(shí)本章針對(duì)幾種閾值分割進(jìn)行比較,分析其各自的優(yōu)缺點(diǎn)。第三章:主要研究的是手寫體數(shù)字識(shí)別中的切分技術(shù)。本章將對(duì)當(dāng)前無(wú)約束手寫體數(shù)字串的切分技術(shù)進(jìn)行概述,最后詳細(xì)介紹本文采用的手寫體數(shù)字串的切分方法。第四章:主要研究的是手寫體數(shù)字識(shí)別中的特征值提取技術(shù)。在特征值提取模塊中,需要根據(jù)特征表達(dá)方式或者特征提取技術(shù)的不同,選用不同的預(yù)處理技術(shù)。比如對(duì)于關(guān)鍵點(diǎn)特征的提取,則需要使用字符的外輪廓、骨架信息。由于單一的特征對(duì)數(shù)字的描述有一定的局限性,因此本文將采用多特征組合的特征向量作為字符的描述特征值來(lái)識(shí)別數(shù)字。本章將詳細(xì)介紹這些相關(guān)的特征值的提取步驟。另外本章中對(duì)傳統(tǒng)的細(xì)化算法提出了一種的改進(jìn)方法。第五章:主要簡(jiǎn)單介紹神經(jīng)網(wǎng)絡(luò)分類識(shí)別器實(shí)現(xiàn)原理。初步介紹本文采用的BP神經(jīng)網(wǎng)絡(luò),并給出本文采用的學(xué)習(xí)算法和訓(xùn)練算法。第六章:介紹了本文實(shí)現(xiàn)的系統(tǒng)的開(kāi)發(fā)和運(yùn)行環(huán)境,以及系統(tǒng)的處理過(guò)程圖,并通過(guò)對(duì)NIST的圖像數(shù)據(jù)庫(kù)進(jìn)行測(cè)試,給出相關(guān)實(shí)驗(yàn)數(shù)據(jù)。第七章:對(duì)整個(gè)論文的研究和工作進(jìn)行了總結(jié)并指出了進(jìn)一步的研究方向。2 手寫體數(shù)字識(shí)別中預(yù)處理技術(shù)預(yù)處理對(duì)于一個(gè)良好的識(shí)別系統(tǒng)不僅是一個(gè)必不可少的環(huán)節(jié),而且是至關(guān)重要的。如果預(yù)處理處理得不夠理想,會(huì)從很大程度上降低整個(gè)系統(tǒng)的識(shí)別率。一般手寫體數(shù)字識(shí)別而言,預(yù)處理包括很多部分,如平滑、去噪、二值化、歸一化、細(xì)化、形狀校正、去各種類印章、背景底紋等等。由于本文主要不是針對(duì)類似于票據(jù)識(shí)別中的這種具有各種背景底色或者印章之類的數(shù)字識(shí)別,本文主要研究的是在紙(無(wú)底紋、印章等)上寫的手寫體數(shù)字進(jìn)行識(shí)別。因此本文就省去了去除類印章、背景底紋等的這些操作。 平滑去噪數(shù)字圖像的噪聲主要來(lái)源于圖像的獲?。〝?shù)字化過(guò)程)。圖像傳感器的工作情況受各種因素的影響,如圖像獲取中的環(huán)境條件和傳感元器件自身的質(zhì)量。例如,使用CCD攝像機(jī)獲取的圖像,光照強(qiáng)度和傳感器溫度是造成圖像中產(chǎn)生大量噪聲的主要因素。除此之外對(duì)于有些傳感元器件的自身質(zhì)量,如手機(jī)自帶的照相設(shè)備一般分辨率較低,在獲取數(shù)字圖像時(shí)會(huì)產(chǎn)生斑點(diǎn)噪聲。噪聲對(duì)于圖像的預(yù)處理非常重要,它會(huì)影響圖像處理的輸入、采集、處理各個(gè)環(huán)節(jié)和識(shí)別結(jié)果的全過(guò)程。特別是圖像的輸入、采集的噪聲是十分關(guān)鍵的問(wèn)題。如果輸入不良伴有較大的噪聲,濾波去噪后不能達(dá)到理想效果,將必然的嚴(yán)重影響處理的全過(guò)程以至最后的識(shí)別結(jié)果。噪聲去除已經(jīng)成為圖像處理極其重要的步驟,然而現(xiàn)在還沒(méi)有一個(gè)通用的濾波去噪方法對(duì)所有的圖片適用,一般的圖像預(yù)處理必須根據(jù)實(shí)際情況選擇不同濾波去噪方法進(jìn)行比較,最后得出最佳的濾波去噪方法。濾波去噪的方法可以簡(jiǎn)單分為兩類:頻域?yàn)V波和空間域?yàn)V波。頻域?yàn)V波一般采用的方法是將空間圖像采用快速傅里葉變換轉(zhuǎn)換成頻域信息,然后再采用信號(hào)處理的濾波方法進(jìn)行濾波(一般采用的有阻濾波器、帶通濾波器、陷波濾波器、最佳陷波濾波器等),濾波處理后再通過(guò)傅里葉逆變換進(jìn)行逆變換成空間圖像信息,從而達(dá)到濾波效果。但是由于頻域?yàn)V波需要頻域轉(zhuǎn)換后再采用濾波器濾波,其實(shí)現(xiàn)起來(lái)較為復(fù)雜,效率也相對(duì)較低,而空間域?yàn)V波方法速度較快、實(shí)現(xiàn)簡(jiǎn)單、效果很好,因此現(xiàn)在很多研究者中都采用空間域?yàn)V波方法對(duì)數(shù)字圖像進(jìn)行濾波。對(duì)于空間域?yàn)V波算法中最常用的是平滑濾波去噪法,其主要思想為在圖像空間中借助模板對(duì)圖像進(jìn)行領(lǐng)域操作,用平均運(yùn)算方法去除突然變化的點(diǎn)從而濾掉一定的噪聲。輸出圖像的每一個(gè)像素的取值都是根據(jù)模板對(duì)輸入像素相應(yīng)領(lǐng)域內(nèi)的像素值進(jìn)行計(jì)算得到的。常見(jiàn)的平滑去噪方法有:nn中值濾波器,高斯濾波器等等。中值濾波是較為經(jīng)典的一個(gè)空間域?yàn)V波算法,該算法是將一個(gè)nn大小的模板從上到下從左到右在圖像上進(jìn)行移動(dòng),在對(duì)所移到的各個(gè)像素上,使用模板中所有的像素灰度值的中間值取代當(dāng)前像素的灰度值: ()中值濾波器常見(jiàn)的有33和55大小的模板。3的中值濾波器。圖中M點(diǎn)像素的灰度等于其領(lǐng)域內(nèi)9個(gè)(A0~A7,M)像素灰度值的中間值。A3A2A1A4MA0A5A6A7 33的中值濾波器模板示意圖3的中值濾波器對(duì)帶有噪聲的圖片進(jìn)行濾波后的效果。 a) 含有噪聲的圖像b) 用33的中值濾波后的圖像 中值濾波中值濾波對(duì)于很多種隨機(jī)噪聲,它都有良好的去噪能力,且在相同尺寸下比起線性平滑濾波器引起的模糊較少。中值濾波器尤其對(duì)單級(jí)或雙極脈沖噪聲非常有效。但是本文在對(duì)圖片進(jìn)行二值化處理中,后期將采用基于梯度的二值化處理,在梯度二值化處理中需要采用拉普拉斯變換提取邊緣特征,而拉普拉斯變換對(duì)噪聲特別敏感,因此我將會(huì)采用高斯濾波器對(duì)圖像進(jìn)行濾波,然后再采用高斯拉普拉斯提取邊緣信息。因此,需要簡(jiǎn)單介紹一下空間域的高斯平滑濾波器。圖像的高斯平滑濾波器,其濾波器的模板設(shè)計(jì)是根據(jù)高斯函數(shù)的最佳逼近的二項(xiàng)式展開(kāi)的系數(shù)來(lái)決定。根據(jù)高斯函數(shù)的可分離性可以得到,二維高斯濾波器能用2個(gè)一維高斯濾波器逐次卷積來(lái)實(shí)現(xiàn),一個(gè)沿水平方向,一個(gè)沿垂直方向。因此高斯平滑濾波器與圖像簡(jiǎn)單平滑不同的是,它在對(duì)領(lǐng)域內(nèi)像素灰度進(jìn)行平均時(shí),給與了不同位置的像素不同的權(quán)值。常見(jiàn)的高斯模板(33),模板上越靠近領(lǐng)域中心的位置,其權(quán)值越高,如此安排權(quán)值的意義在于用此模板進(jìn)行圖像平滑時(shí),在對(duì)圖像細(xì)節(jié)進(jìn)行模糊的同時(shí),可以更多的保留圖像總體的灰度分布特征。121242121 33高斯模板高斯濾波器相對(duì)簡(jiǎn)單平滑濾波器的效率較低(需要額外乘法運(yùn)算),在離散型雜點(diǎn)的消除方面,高斯平滑的效果并不理想。然而在保留圖像的總體特征上,高斯濾波器表現(xiàn)了很好的性能。 二值化二值圖像是指整幅圖像頁(yè)面內(nèi)僅有黑(像素值為0),白(像素值為1)的二值圖像。一般的文字識(shí)別的文字圖像、進(jìn)行指紋識(shí)別的指紋圖像,大多數(shù)都需要將灰度圖像轉(zhuǎn)化成二值圖像。在數(shù)字圖像處理中,二值化占有非常重要的地位。這是因?yàn)?,一方面類似于字符、指紋、工程圖等圖像本身就是二值的。另一方面,在某些情況下即使圖像本身是有灰度的,也將其轉(zhuǎn)換成二值圖像再處理。這樣在圖像處理系統(tǒng)中,可以減少圖像信息并提高處理速度。圖像的二值化有幾種類型,其中主要的有基于灰度分布的二值化,也有基于梯度信息的二值化?;诨叶确植嫉亩祷幚硪话闶峭ㄟ^(guò)設(shè)定閾值,把它變?yōu)閮H用二值表示前景和背景顏色的圖像。圖像的二值化可以根據(jù)下面的閾值來(lái)處理:假設(shè)一幅原始圖像的像素值p(i,j)的取值范圍為[0,m],那么設(shè)有其閾值為T=t,0tm,則映射成新的二值圖像的像素值p’(i,j)為: ()對(duì)于基于灰度分布的二值化就是一個(gè)帶閾值T的二值映射過(guò)程,其分割效果的關(guān)鍵在于閾值T的選取。有的應(yīng)用可以由計(jì)算機(jī)自動(dòng)選取,有的則需要人工干預(yù),所以閾值T的選取視應(yīng)用范圍而有所不同。對(duì)于字符識(shí)別來(lái)說(shuō),只需要保留文字特征的二值信息即可。目前,眾多學(xué)者對(duì)此已經(jīng)進(jìn)行了比較詳細(xì)的研究,并提出了許多閾值選取的算法,這些算法大體上可以劃分為三類:整體閾值法,局部閾值法和動(dòng)態(tài)閾值法。1) 整體閾值法(又稱全局閾值法)僅由像素點(diǎn)(i,j)的灰度值p(i,j)確定閾值的方法稱為整體閾值選擇法。典型的閾值選取算法有直方圖法,熵閾值法等等,一般地,如果圖像灰度直方圖呈現(xiàn)雙峰,或者圖像中背景灰度與目標(biāo)灰度呈明顯分離狀,整體閾值法分割圖像效果良好且速度快。2) 局部閾值法由像素(i,j)的灰度值p(i,j)和像素周圍點(diǎn)的局部灰度特性確定閾值的方法稱為局部閾值法。不同的閾值法源于N(i,j)的不同選擇。對(duì)于書寫質(zhì)量差,干擾較嚴(yán)重的字符,采用整體閾值法二值化,效果不太理想,局部閾值法有可能得到較為滿意的二值化結(jié)果。3) 動(dòng)態(tài)閾值法當(dāng)閾值選擇不僅取決于該像素閾值及其周圍各像素的灰度值,而且還和像素坐標(biāo)位置相關(guān)時(shí),稱之為動(dòng)態(tài)閾值法。這種方法可以處理低質(zhì)量甚至單峰直方圖圖像。對(duì)文字圖像而言,由于筆畫和背景的區(qū)分比較明顯,并且動(dòng)態(tài)閾值法的實(shí)現(xiàn)較為復(fù)雜、計(jì)算時(shí)間相對(duì)長(zhǎng),因此在文字識(shí)別中很少采用。[16]進(jìn)行分割的結(jié)果。對(duì)于以上三種二值化算法中,由于動(dòng)態(tài)閾值法實(shí)現(xiàn)較為復(fù)雜而且用時(shí)較長(zhǎng),很難滿足文字識(shí)別中的實(shí)時(shí)性要求,因此該算法在字符識(shí)別系統(tǒng)中很少被采用。,采用整體閾值法和局部閾值法能很好的將背景和目標(biāo)進(jìn)行分割,但是如果目標(biāo)灰度和背景灰度差距較小或者光照不均勻的數(shù)字圖像,如果采用上述兩種算法都很難達(dá)到較好的效果。,對(duì)于光照不均的圖像,采用基于直方圖的自動(dòng)閾值分割和基于OTSU的二維最大類間方差閾值分割的改進(jìn)算法分割得到的二值圖像都不好。鑒于在實(shí)際中,由于數(shù)字圖像的獲取階段由于紙張不平整、反射光不均勻、光照不均勻所導(dǎo)致而得到的數(shù)字圖像其目標(biāo)圖像和背景圖像灰度整體沒(méi)有一個(gè)明顯a) 原始圖像c) 采用基于OTSU的二維最大類間方差閾值分割的改進(jìn)算法分割效果b) 采用一維直方圖自動(dòng)閥值分割效果 基于灰度分布的二值化的界限,而基于梯度信息的二值化算法能很好的對(duì)光照不均的數(shù)字圖像進(jìn)行二值化,因此本文采用的是基于梯度信息(邊緣)的二值化算法,對(duì)圖像進(jìn)行二值化處理。在講解本文采用的二值化算法前,需要介紹一下圖像梯度(即邊緣)的計(jì)算方法。邊緣是指與周圍
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1