freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫體數(shù)字識(shí)別的軟件設(shè)計(jì)畢業(yè)設(shè)計(jì)論文資料(文件)

2025-07-11 05:06 上一頁面

下一頁面
 

【正文】 ()。 a) 原圖像1c) 原圖像1歸一化后結(jié)果b) 原圖像2 d) 原圖像2歸一化后結(jié)果 ,對(duì)于書寫長寬規(guī)范的字符,采用保持原圖縱橫比能很好的進(jìn)行歸一化()圖的歸一化結(jié)果),然而,如果在書寫過程中,字符長寬差距較大()圖的歸一化結(jié)果),就可能導(dǎo)致原有的環(huán)形被填充了,因此為了解決這種問題,本文提出的解決方法是。由于在人們書寫過程中,會(huì)有一定的傾斜(傾斜度一般在 0o~45o),如果不對(duì)字符圖形進(jìn)行矯正處理,就會(huì)影響后期的特征值提取,最終會(huì)影響系統(tǒng)的識(shí)別率。很多傾斜矯正算法都是基于“當(dāng)圖像傾斜度最小時(shí),圖像的高寬比將達(dá)到最大”這一特點(diǎn)。那么對(duì)任意給定的圖像中的像素點(diǎn)(x0,y0),,圖中(x1,y1)和(x2,y2)分別表示的是(x0,y0)順。3) 設(shè)定活動(dòng)位圖為B0,求出B0的高度h0、寬度w0并求出兩者的比值。由上算法進(jìn)行逐步求解最接近的近似取得的最佳的傾斜角度,并自動(dòng)矯正數(shù)字圖像。字符圖像細(xì)化結(jié)果的好壞將直接影響到字符特征提取的準(zhǔn)確與否(尤其是一些結(jié)構(gòu)特征的提?。?,最終影響到整個(gè)字符識(shí)別系統(tǒng)的識(shí)別率,因而字符細(xì)化已成為字符識(shí)別系統(tǒng)中極為重要的環(huán)節(jié)之一。經(jīng)過細(xì)化的文字圖像既保留了原文字絕大部分特征,又利于特征提取,而且圖像字符點(diǎn)陣比原圖像的要少,降低了處理工作量。4) 要保持原有的拓?fù)?、幾何特征,特別是一些明顯的拐角不應(yīng)被平滑掉。四鄰域連接算法是在水平垂直四個(gè)方向的連接,八鄰域連接則是在四鄰域的基礎(chǔ)上加上正反45o對(duì)角線方向,總共八個(gè)方向。傳統(tǒng)的基于邊緣點(diǎn)刪除的細(xì)化算法,在細(xì)化過程中只對(duì)邊緣點(diǎn)的可刪除進(jìn)行判斷并做相應(yīng)的處理,由于受跟蹤順序及所考察領(lǐng)域的影響,容易產(chǎn)生骨架的非對(duì)稱性;基于內(nèi)點(diǎn)保留的細(xì)化算法,容易使所得的骨架大于一個(gè)像素。條件G1為:,其中,其中,為圍繞p點(diǎn)的8領(lǐng)域的映射值。前者回避了數(shù)字串切分的這個(gè)復(fù)雜的問題,將兩個(gè)步驟簡化為一個(gè)步驟,有它的優(yōu)越性,但是不切分直接識(shí)別的這種技術(shù)到目前為止還僅限于理論研究角度。然而它只適用于數(shù)字之間存在較大的空隙的情況,而對(duì)于存在數(shù)字字符交叉或粘連的情況就顯得無能為力了。目前屬于曲線的切分的算法有:滴水算法、多磨具切分算法、基于動(dòng)態(tài)規(guī)劃切分算法等。該類方法克服了切分的盲目性,但是由于引入了識(shí)別處理,計(jì)算量增大,很難滿足實(shí)時(shí)性的要求。一般而言,垂直投影曲線中的大波谷都出現(xiàn)在沒有筆畫或未連筆的地方,而對(duì)于手寫體數(shù)字串而言,沒有筆畫或未連筆的地方一般都是兩個(gè)數(shù)字之間的正確切分區(qū)域。其中按照起始點(diǎn)位置和下一步尋址策略可將滴水方法分為四種:從頂部左側(cè)向下、從頂部右側(cè)向左下、從低部左側(cè)向右上、從底部右側(cè)向左上。也就是說數(shù)字串切分過程就是尋找最佳路徑問題。 滑動(dòng)窗口法滑動(dòng)窗口的切分方法是Martin,。 多模具切分法多模具切分方法屬于較新的研究成果,是由北京郵電大學(xué)的張洪剛等人于2003年提出的。3) 模具類型3:針對(duì)9的上弧線下斜線型。因此本文采用的手寫數(shù)字串切分方法主要還是上節(jié)所提到的基于投影的直線切分法。首先對(duì)切成行的字符串進(jìn)行垂直投影,然后根據(jù)波谷特性將字符串進(jìn)行切分。特征提取的目標(biāo)是找到某種變換,將n維或nn維的模式類別空間轉(zhuǎn)換到維數(shù)更小的特征空間,并同時(shí)保留識(shí)別所需要的大部分信息。具體來說,特征的可辨性是指屬于不同類別的樣本,特征應(yīng)該有相對(duì)差別較大的值,這樣不同類別的樣本才能區(qū)分的開;特征的可靠性是指對(duì)與屬于同一類別的樣本,而其應(yīng)具有穩(wěn)定性,這樣同一類別的樣本才可以判別為同一類別而不至于誤判;特征的獨(dú)立性是指選擇出來的不同特征之間應(yīng)該互不相關(guān),這樣才能減少信息的冗余性;特征的數(shù)量要少是指特征量越少越容易滿足前面的三個(gè)原則,處理速度也會(huì)相應(yīng)提高。在樣本數(shù)目不是很多的情況下,用很多特征進(jìn)行分類器設(shè)計(jì),無論從計(jì)算復(fù)雜程度還是分類器性能來看都是不合適的,因此研究如何把高維特征空間壓縮到低維特征空間,以便有效的設(shè)計(jì)分類器就成為一個(gè)重要的問題,這也是模式識(shí)別中的一個(gè)關(guān)鍵問題。就數(shù)字識(shí)別來說,在實(shí)際過程中,如何選擇若干種特征提取的方法取決于識(shí)別的用途。特征提取的選擇取決于這些預(yù)處理的結(jié)果。當(dāng)然也可以先經(jīng)過選擇,去掉那些明顯沒有分類信息的特征,再進(jìn)行映射,以降低維數(shù)。結(jié)構(gòu)特征和統(tǒng)計(jì)特征各有優(yōu)點(diǎn):結(jié)構(gòu)特征對(duì)細(xì)節(jié)變化比較敏感,對(duì)噪聲干擾較大的圖像,識(shí)別率不高。所選取的特征是否是穩(wěn)定,是否代表一類字符的特點(diǎn),是系統(tǒng)識(shí)別率的高低關(guān)鍵。目前研究比較成熟,效果較好的是基于筆劃和基于筆段分析的手寫體字符識(shí)別。雖然字符的筆劃特征受字體、字形大小等影響較小,是識(shí)別字符的良好特征,但可惜筆劃特征對(duì)實(shí)際的書寫文本來說比較難穩(wěn)定的提取。單純建立在圖像處理方法上的筆段分析只能十分機(jī)械的按圖像就事論事,結(jié)果提取到的筆段難免與人的判別不完全一致。2) 統(tǒng)計(jì)特征提取方法從統(tǒng)計(jì)模式識(shí)別的觀點(diǎn)來看,字符識(shí)別實(shí)際上是一個(gè)模式分類問題,人對(duì)自然物體的識(shí)別,是建立在對(duì)該物體進(jìn)行學(xué)習(xí)、特征分析的基礎(chǔ)上的,計(jì)算機(jī)模式識(shí)別的過程與人的識(shí)別過程有著相似的地方。此過程實(shí)際上就是傳統(tǒng)的統(tǒng)計(jì)模式識(shí)別進(jìn)行物體識(shí)別時(shí)所采用的一般方法,具體來說就是特征提取和分類函數(shù)的設(shè)計(jì)的問題,而特征提取是問題難點(diǎn)和關(guān)鍵所在。由此可見,對(duì)手寫體數(shù)字圖像進(jìn)行特征值的提取,特征值的選擇不僅能濃縮信息、降低維數(shù)、提高處理效率的同時(shí),其對(duì)系統(tǒng)的識(shí)別性能也有很重要的影響。與統(tǒng)計(jì)方法相比,結(jié)構(gòu)分析不注重特征的絕對(duì)位置,只考慮特征的相對(duì)關(guān)系,因而對(duì)書寫風(fēng)格的變化不敏感,其缺點(diǎn)在于特征提取的算法都相對(duì)復(fù)雜。拐點(diǎn)是筆劃書寫方向上有顯著變化的點(diǎn)。然而上述方法對(duì)某些三叉點(diǎn)和四叉點(diǎn)的檢測并不是很準(zhǔn)確,該像素連接著上、下、左三個(gè)方向的“骨架”,如果去除該像素的話,原細(xì)化圖像將產(chǎn)生斷開現(xiàn)象,因此該像素點(diǎn)是不可缺少的。Step2:從上到下從左到右依次掃描,如果該點(diǎn)不是三叉點(diǎn)的話,不做任何處理,否則的話,則檢測該像素點(diǎn)鄰域的8個(gè)點(diǎn)中是否有四叉點(diǎn),如果有四叉點(diǎn),則該點(diǎn)標(biāo)記為非特殊點(diǎn)。而對(duì)于拐點(diǎn),文獻(xiàn)[20]提出了一種確定拐點(diǎn)的方法,就圖像骨架取相鄰7點(diǎn),以中心為考察點(diǎn),分別用反正切公式計(jì)算前四點(diǎn)和后四點(diǎn)的近似直線的角度,考察這兩個(gè)直線的夾角θ是否大于所設(shè)定的閾值T來判定中間點(diǎn)是否為拐點(diǎn)。該方法的基本思想是:先按一定順序掃描細(xì)化圖像中的每一個(gè)點(diǎn),若某點(diǎn)的鏈碼方向從水平(垂直)方向變換為垂直(水平)方向,則認(rèn)為該點(diǎn)位拐點(diǎn)。該算法由于涉及字符拓?fù)浣Y(jié)構(gòu)方面的信息,所以對(duì)字符旋轉(zhuǎn)縮放和變形有較強(qiáng)的容忍度。 投影特征,將一個(gè)字符點(diǎn)陣劃分為四個(gè)象限區(qū)域,共有十二個(gè)邊線。傳統(tǒng)的全局特征主要包括:全局變換特征、不變矩特征、全局筆劃方向特征等。 重心矩特征由于不同字符的筆劃不同,其像素點(diǎn)的分布不同,所造成不同字符的四個(gè)象限中四個(gè)不同區(qū)域的重心位置與字符重心位置的距離不同(由于在圖像預(yù)處理中,圖像的重心已經(jīng)和中心對(duì)齊了)。 粗網(wǎng)格特征粗網(wǎng)格特征是一組注重字符圖像的整體的分布特征,此種特征對(duì)噪聲具有極強(qiáng)的抑制能力。本文對(duì)原始圖像進(jìn)行歸一化處理后的圖像是2020的點(diǎn)陣,將之劃分為大小55的小區(qū)域,共計(jì)16個(gè),因此得出一個(gè)十六維的粗網(wǎng)格特征。 水平、垂直投影特征投影密度常用來描述字符筆劃的寬度,同時(shí)它也可以反映字符一定程度上的筆劃結(jié)構(gòu)信息。因此本文采用水平、垂直投影特征作為特征值。本文提出將提取的數(shù)字圖像中環(huán)個(gè)數(shù)和凸凹區(qū)域的個(gè)數(shù)作為描述字符的特性的一個(gè)特征值,由于神經(jīng)網(wǎng)絡(luò)具有一定的抽象能力,即使由于少數(shù)字符因斷筆等造成環(huán)凸凹不準(zhǔn)確,但其能更具其他特征值進(jìn)行整體分析,具有一定的容忍能力,因此有效的解決斷筆可能導(dǎo)致環(huán)凸凹特性不準(zhǔn)確的問題。Step2:提取環(huán)凸凹特性。上述連通區(qū)域的檢測,可以采用深度優(yōu)先算法進(jìn)行遍歷完成(具體深度優(yōu)先算法的實(shí)現(xiàn)可以參考相關(guān)資料,本文不做詳細(xì)描述)。A0 A1A2A7(i,j)A3A6A5A4 八個(gè)相鄰單元位置示意圖~(i,j)水平邊緣強(qiáng)度H,垂直邊緣強(qiáng)度V,右對(duì)角線邊緣強(qiáng)度R和左對(duì)角線邊緣強(qiáng)度L: () () () ()為了方便計(jì)算機(jī)處理,在上四式對(duì)4個(gè)方向的邊緣強(qiáng)度(水平、垂直、左對(duì)角、右對(duì)角)可以定義4組(8個(gè))卷積模板運(yùn)算。因此這樣將2020的矩陣壓縮到44的矩陣,這樣的矩陣一共4個(gè),累計(jì)444=64個(gè)特征值。ANN是一種按照人腦的組織和活動(dòng)原來而構(gòu)造的一種數(shù)據(jù)驅(qū)動(dòng)型非線性映射模型,它具有強(qiáng)大的并行處理、自適應(yīng)自組織、聯(lián)想記憶、容錯(cuò)魯棒以及逼近任意非線性等特性,在預(yù)測評(píng)估、模式識(shí)別、信號(hào)處理、組合優(yōu)化及知識(shí)工程等領(lǐng)域具有廣泛的應(yīng)用。它是由簡單信息處理單元(人工神經(jīng)元)互聯(lián)組成的網(wǎng)絡(luò),能接受處理信息,網(wǎng)絡(luò)的信息處理由處理單元間的互相作用來實(shí)現(xiàn),它是通過把問題表達(dá)成處理單元間的連接權(quán)來處理。處理單元的輸出信號(hào)可以使任一種所要求的數(shù)學(xué)模型。訓(xùn)練首先要提供訓(xùn)練集合,它由輸入樣本和與之相應(yīng)的代表正確分類的輸出組成,調(diào)整權(quán)值系統(tǒng),訓(xùn)練集合的每一矢量是否有特定的期望輸出,這是一種有監(jiān)督的學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)應(yīng)用與模式識(shí)別問題包括兩個(gè)階段。每一個(gè)處理單元的都有一個(gè)單輸出到所期望的連接。其中,80%~90%的人工神經(jīng)網(wǎng)絡(luò)模型采用前饋反向傳播網(wǎng)絡(luò)(BackPropagation Network,簡稱BP網(wǎng)絡(luò))。但是,由于Minsky和Papert指出單層系統(tǒng)的局限性,并表達(dá)了對(duì)多層系統(tǒng)的悲觀看法,在20世紀(jì)70年代,對(duì)ANN的研究興趣減弱。對(duì)于本文的數(shù)字圖像大小為2020的圖像來說,將會(huì)產(chǎn)生一個(gè)2020的矩陣。 全局Kirsh邊緣方向特征本文使用的全局Kirsh邊緣方向特征是基于邊緣強(qiáng)度(又稱梯度)的提取,通過分區(qū)密度統(tǒng)計(jì)來得到一組特征向量。環(huán)的識(shí)別很簡單,如果字符的四連通區(qū)域都是8并且周圍是被0包圍的話,那么認(rèn)為該區(qū)域是一個(gè)環(huán)。該方法的步驟如下:Step1:計(jì)算賦值背景。 字符3的水平和垂直投影 環(huán)凸凹特征環(huán)凸凹特征夠準(zhǔn)確描述字符的大體輪廓信息,例如對(duì)與數(shù)字1,無論何種寫法,其不會(huì)包含環(huán)形,而對(duì)于數(shù)字0,6,8,9則應(yīng)該存在環(huán)形。該圖顯示了字符3的水平投影和垂直投影,通過該投影我們可以看出對(duì)于數(shù)字3的水平投影有其特有的波形形狀。也就是說,這個(gè)相對(duì)值對(duì)與數(shù)字圖片局部筆劃的形變或弧的噪聲點(diǎn)帶來的影響不敏感。由于10個(gè)字符的筆劃具有比較固定的總體分布狀況,從特征選擇的質(zhì)量來講,不同數(shù)字的特征向量在特征空間中的分布是比較分散的,即特征空間中不同類的類間距離是比較大的。那么下面定義重心矩如下: ()其中i=1,2;j=1,2。統(tǒng)計(jì)特征對(duì)微小的畸變不敏感,但區(qū)分相似的能力較差。 投影特征示意圖之所以選用投影特征作為手寫體數(shù)字識(shí)別的特征,主要是因?yàn)橥队疤卣饔?jì)算簡單,能夠反應(yīng)字符的內(nèi)部結(jié)構(gòu)和筆劃的分布情況,唯一性好,可區(qū)別性好,是比較有代表性的特征,不同數(shù)字之間的12個(gè)投影特征的各個(gè)分量差異比較明顯,可以考慮作為分類的細(xì)特征。但是,當(dāng)書寫風(fēng)格引起統(tǒng)一字符的之心位置不同時(shí),該方法提取的特征準(zhǔn)確性差。 數(shù)字8細(xì)化圖像上檢測到的特殊點(diǎn)的示意圖 穿越密度特征穿越密度(次數(shù))特征已被廣泛的應(yīng)用于字符識(shí)別的研究中。但是,由于上述方法在閾值的選擇上需要依靠經(jīng)驗(yàn)設(shè)定,對(duì)于不同大小規(guī)范化的樣本,都需要重新確定一次閾值。上面敘述的是一個(gè)通俗易懂的方法,其可以做進(jìn)一步優(yōu)化。然而從直觀上看,該灰色像素的三叉點(diǎn)應(yīng)該不能計(jì)算在內(nèi)(否則的話字符圖像8就多了一個(gè)三叉點(diǎn)),應(yīng)該屬于“重復(fù)”檢測。如果d=3,則p為三叉點(diǎn)。 結(jié)構(gòu)點(diǎn)特征目前,在手寫體字符識(shí)別的特征提取中,結(jié)構(gòu)點(diǎn)特征占了很重要的一部分。 手寫體數(shù)字識(shí)別中的結(jié)構(gòu)特征提取采用結(jié)構(gòu)特征對(duì)字符進(jìn)行結(jié)構(gòu)分析以達(dá)到識(shí)別目的是一種非常直觀的方法。然而,對(duì)于特征的選擇和提取,卻沒有可遵循的理論來指導(dǎo),我們很難比較一個(gè)物體中哪些特征是實(shí)質(zhì)性,哪些特征是代表性的,哪些特征可能是不重要或與識(shí)別無關(guān)緊要的,這些都需要大量的實(shí)驗(yàn)和理論指導(dǎo)。人在進(jìn)行物體識(shí)別時(shí),是利用大腦中通過學(xué)形成的記憶庫,對(duì)識(shí)別的物體進(jìn)行一種黑箱式的映像,從記憶庫中找出相匹配的類別。所以,書寫畸變對(duì)結(jié)構(gòu)特征分析法有著不可忽視的影響。采用結(jié)構(gòu)特征提取方法的難點(diǎn)在于筆劃或筆段等基元的準(zhǔn)確提取。人認(rèn)字就是抓住了這些本質(zhì)不變的特征,因此能適應(yīng)不同的書寫風(fēng)格的文字。1) 結(jié)構(gòu)特征提取方法采用結(jié)構(gòu)特征提取字符進(jìn)行結(jié)構(gòu)分析從而達(dá)到識(shí)別的目的,是一種非常直觀的方法,其思想與人認(rèn)字的原理有點(diǎn)相像,但又有所不同。所以,統(tǒng)計(jì)特征和結(jié)構(gòu)特征相互之間具有一定的互補(bǔ)性。去除無用的冗余信息、提高識(shí)別系統(tǒng)性能。有時(shí)這兩者并不是截然分開的。這些有利于縮小特征提取選擇的難度和提高識(shí)別率。一個(gè)解決的辦法是尋找不同的數(shù)據(jù)的共同特征,或稱不變量。更重要的是,訓(xùn)練分類器和判別一個(gè)分類器的好壞所需要的數(shù)量也會(huì)隨著所用的特征量的數(shù)目呈指數(shù)增長。而且,對(duì)給定的訓(xùn)練樣本進(jìn)行特征提取可以獲得更精確的分類函數(shù)的描述,以構(gòu)造更可靠的分類規(guī)則。首先對(duì)字符串進(jìn)行水平投影,然后分別根據(jù)波谷將字符串進(jìn)行切分。5) 模具類型5:針對(duì)8的上下雙弧線型。其中他們共總結(jié)了五類模具切分曲線():1) 模具類型1:針對(duì)7的斜線類型。在其理想狀態(tài)下,數(shù)字串的每一個(gè)字符都可能落在窗口之中,這就避免了切分過程,直接完成數(shù)字串的識(shí)別。它是一個(gè)多步?jīng)Q策過程,通過把第一個(gè)N步過程轉(zhuǎn)化為N個(gè)單步過程的方法使其復(fù)雜度按對(duì)數(shù)級(jí)降低。 動(dòng)態(tài)規(guī)劃算法手寫字串的切分過程中,其實(shí)就是在一個(gè)圖中找出一條路徑,最合理的將圖中的字符分離的過程。所以,該方法一般適合于進(jìn)行一些簡單的粗切分工作,也可以解決印刷體數(shù)字、車牌照或書寫比較工整、字符間間距明顯的切分問題,而精確的、復(fù)雜問題的切分就需要結(jié)合其它方法來解決了。投影是字符
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1