freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫(xiě)體數(shù)字識(shí)別的軟件設(shè)計(jì)畢業(yè)設(shè)計(jì)論文資料(已改無(wú)錯(cuò)字)

2023-07-24 05:06:42 本頁(yè)面
  

【正文】 。由于細(xì)化骨架具有良好的結(jié)構(gòu)描述特性,所以近幾十年來(lái),許多學(xué)者已經(jīng)提出了很多相關(guān)的細(xì)化算法,并將其用在不同的字符識(shí)別中。細(xì)化算法的大體分類如下:1) 按細(xì)化后圖形的連續(xù)性分,有四鄰域連接算法,八鄰域連接算法。四鄰域連接算法是在水平垂直四個(gè)方向的連接,八鄰域連接則是在四鄰域的基礎(chǔ)上加上正反45o對(duì)角線方向,總共八個(gè)方向。2) 按細(xì)化處理過(guò)程分,有串行、并行和串并行處理法。用MN(一般采用33或者55)的窗口對(duì)某一像素進(jìn)行檢測(cè)時(shí),如該點(diǎn)是可刪除點(diǎn),立即刪除,則為串行細(xì)化處理,它的刪除要影響到后續(xù)點(diǎn)的檢測(cè);如對(duì)邊緣點(diǎn)全部檢測(cè)完畢后,再同時(shí)更新所有可刪除點(diǎn)的值,則為并行細(xì)化處理;串行、并行處理混合處理則屬于串并行處理。3) 按細(xì)化的運(yùn)算方式分為兩種,即邊緣點(diǎn)刪除和內(nèi)點(diǎn)保留。傳統(tǒng)的基于邊緣點(diǎn)刪除的細(xì)化算法,在細(xì)化過(guò)程中只對(duì)邊緣點(diǎn)的可刪除進(jìn)行判斷并做相應(yīng)的處理,由于受跟蹤順序及所考察領(lǐng)域的影響,容易產(chǎn)生骨架的非對(duì)稱性;基于內(nèi)點(diǎn)保留的細(xì)化算法,容易使所得的骨架大于一個(gè)像素。本文采用了像素領(lǐng)域分析法的細(xì)化算法[19],在速度和保留結(jié)構(gòu)信息的準(zhǔn)確性上較佳。其算法如下:1) 對(duì)圖像以每33大小劃分子網(wǎng)格,對(duì)每個(gè)子網(wǎng)格進(jìn)行兩次操作,其中每個(gè)33子網(wǎng)格滿足如下矩陣形式: 2) 在第一次操作時(shí),當(dāng)且僅當(dāng)條件G1,G2和G3被全部滿足時(shí),則刪除中心像素p(即讓p = 0)。3) 在第二次操作時(shí),當(dāng)且僅當(dāng)條件G1,G2和G4被全部滿足時(shí),則刪除中心像素p(即讓p=0)。條件G1為:,其中,其中,為圍繞p點(diǎn)的8領(lǐng)域的映射值。條件G2為:,其中,條件G3為:條件G4為 對(duì)圖像每個(gè)像素都進(jìn)一次上述運(yùn)算,視為完成一次細(xì)化運(yùn)算,然后重復(fù)迭代這個(gè)細(xì)化運(yùn)算,直到圖像不再變化為止,這時(shí)得到的圖像中字符筆畫(huà)均為單像素點(diǎn),并良好保留了字符的結(jié)構(gòu)信息。,其中左邊為原始二值圖像,右邊為最終細(xì)化圖像。 b) 細(xì)化后圖像a) 原始圖像 數(shù)字8和3的細(xì)化效果3 手寫(xiě)體數(shù)字識(shí)別中串切分技術(shù) 切分方法概述對(duì)于連續(xù)的手寫(xiě)數(shù)字串識(shí)別有兩種途徑:一是不切分直接識(shí)別,二是先切分后識(shí)別。前者回避了數(shù)字串切分的這個(gè)復(fù)雜的問(wèn)題,將兩個(gè)步驟簡(jiǎn)化為一個(gè)步驟,有它的優(yōu)越性,但是不切分直接識(shí)別的這種技術(shù)到目前為止還僅限于理論研究角度。而對(duì)于手寫(xiě)體數(shù)字串的切分的算法已經(jīng)有各種算法,這些算法各有各自的特點(diǎn),所以根據(jù)切分性質(zhì)分,大致可以歸納為兩類:直線切分和曲線切分。直線切分顧名思義就是利用直線進(jìn)行字符的切分。由于直線只需要在一維空間中尋找,所以直線切分的算法簡(jiǎn)單、直觀。然而它只適用于數(shù)字之間存在較大的空隙的情況,而對(duì)于存在數(shù)字字符交叉或粘連的情況就顯得無(wú)能為力了。直線切分可以大致歸納為兩種方法:根據(jù)水平和垂直投影的直線切分和根據(jù)上下邊緣特征的直線切分。曲線切分是利用曲線進(jìn)行字符間的切分,這類切分因?yàn)榍蟹志€是曲線,可以補(bǔ)充直線切分的不足,很適合書(shū)寫(xiě)較為復(fù)雜的字符間的切分。但是由于該類是在二維空間里搜索,所以算法相對(duì)較為復(fù)雜,計(jì)算量也特別大。目前屬于曲線的切分的算法有:滴水算法、多磨具切分算法、基于動(dòng)態(tài)規(guī)劃切分算法等。基于以上的方法確定的切分線,有時(shí)因?yàn)閿喙P等原因會(huì)產(chǎn)生“過(guò)分割”現(xiàn)象。于是后來(lái)有學(xué)者提出了基于識(shí)別的切分方法?;谧R(shí)別的切分方法是,在切分的時(shí)候引入識(shí)別處理,并使用識(shí)別結(jié)果作為評(píng)價(jià)當(dāng)前切分結(jié)果的正確與否,如此反復(fù)切分識(shí)別最后提出最合理的切分線。該類方法克服了切分的盲目性,但是由于引入了識(shí)別處理,計(jì)算量增大,很難滿足實(shí)時(shí)性的要求。 手寫(xiě)數(shù)字串常用方法簡(jiǎn)介 投影法的直線切分投影法是一種很自然的方法,有點(diǎn)像灰度直方圖,常常和二值化一起使用。投影是字符切分方法中最簡(jiǎn)單、最直觀、高效的方法。其大致思想是:先對(duì)圖像做垂直(水平)方向的投影,獲取其垂直投影向量所對(duì)應(yīng)的投影曲線,再選取曲線中大波谷作為切分區(qū)域。一般而言,垂直投影曲線中的大波谷都出現(xiàn)在沒(méi)有筆畫(huà)或未連筆的地方,而對(duì)于手寫(xiě)體數(shù)字串而言,沒(méi)有筆畫(huà)或未連筆的地方一般都是兩個(gè)數(shù)字之間的正確切分區(qū)域。然而當(dāng)數(shù)字串中出現(xiàn)粘連、或者連筆的情況時(shí),這種方法就無(wú)法正確切分了。所以,該方法一般適合于進(jìn)行一些簡(jiǎn)單的粗切分工作,也可以解決印刷體數(shù)字、車牌照或書(shū)寫(xiě)比較工整、字符間間距明顯的切分問(wèn)題,而精確的、復(fù)雜問(wèn)題的切分就需要結(jié)合其它方法來(lái)解決了。 滴水算法滴水算法就是模仿一滴水珠依靠重力的作用,沿筆劃的輪廓自然下降,最終形成切分軌跡,該算法思想ShiiteCongedo于1995年首先提出,其涉及到三個(gè)關(guān)鍵問(wèn)題:1) 起始點(diǎn)的確定,2) 下一步尋址策略,3) 穿越盲區(qū)的方法。其中按照起始點(diǎn)位置和下一步尋址策略可將滴水方法分為四種:從頂部左側(cè)向下、從頂部右側(cè)向左下、從低部左側(cè)向右上、從底部右側(cè)向左上。滴水算法能夠較好的分割一些連寫(xiě)和粘連的數(shù)字串,但是如果數(shù)字串存在開(kāi)口的情況下,就可能導(dǎo)致切割不準(zhǔn)確。 動(dòng)態(tài)規(guī)劃算法手寫(xiě)字串的切分過(guò)程中,其實(shí)就是在一個(gè)圖中找出一條路徑,最合理的將圖中的字符分離的過(guò)程。這條分離字符的路徑實(shí)際上就是我們要尋找的切分線。也就是說(shuō)數(shù)字串切分過(guò)程就是尋找最佳路徑問(wèn)題。在最佳路徑的方法中,動(dòng)態(tài)規(guī)劃算法是一個(gè)很有效的方法。它是一個(gè)多步?jīng)Q策過(guò)程,通過(guò)把第一個(gè)N步過(guò)程轉(zhuǎn)化為N個(gè)單步過(guò)程的方法使其復(fù)雜度按對(duì)數(shù)級(jí)降低。有學(xué)者提出了采用基于識(shí)別的動(dòng)態(tài)規(guī)劃算法進(jìn)行切分處理,該方法可以較好的切分字符串。 滑動(dòng)窗口法滑動(dòng)窗口的切分方法是Martin,。在該方法中他大膽的嘗試了使用一個(gè)可以移動(dòng)的窗口,從數(shù)字串的左側(cè)向右側(cè)不斷滑動(dòng),每完成一次滑動(dòng)之后就緊接著使用神經(jīng)網(wǎng)絡(luò)方法對(duì)位于窗口中的字符進(jìn)行相應(yīng)的識(shí)別。在其理想狀態(tài)下,數(shù)字串的每一個(gè)字符都可能落在窗口之中,這就避免了切分過(guò)程,直接完成數(shù)字串的識(shí)別。但事實(shí)上,該方法不僅運(yùn)算量特別大,而且當(dāng)書(shū)寫(xiě)的字符大小不一時(shí),將產(chǎn)生較差的效果。 多模具切分法多模具切分方法屬于較新的研究成果,是由北京郵電大學(xué)的張洪剛等人于2003年提出的。該算法通過(guò)總結(jié)手寫(xiě)體數(shù)字串中字符之間的連接特點(diǎn),歸納出一套切分的曲線類型,并根據(jù)這些曲線類型設(shè)計(jì)出多種切分模具,這個(gè)方法具有思路簡(jiǎn)捷、與具體應(yīng)用密切結(jié)合、搜索策略簡(jiǎn)單、盲目性小、最優(yōu)解的獲得的受噪聲影響等優(yōu)點(diǎn)。其中他們共總結(jié)了五類模具切分曲線():1) 模具類型1:針對(duì)7的斜線類型。2) 模具類型2:針對(duì)0的弧線類型。3) 模具類型3:針對(duì)9的上弧線下斜線型。4) 模具類型4:針對(duì)6的上斜線下弧線類型。5) 模具類型5:針對(duì)8的上下雙弧線型。 多模具切分方法的切分模具 本文手寫(xiě)數(shù)字串切分方法介紹首先由于本文將不對(duì)連寫(xiě)或粘連的手寫(xiě)體數(shù)字串進(jìn)行識(shí)別,其次又因?yàn)樵谌藗兊臄?shù)字過(guò)程中,一般的是都是按照行進(jìn)行書(shū)寫(xiě)(垂直方向不一定對(duì)齊)。因此本文采用的手寫(xiě)數(shù)字串切分方法主要還是上節(jié)所提到的基于投影的直線切分法。本文的手寫(xiě)數(shù)字串的切分的主要分為兩個(gè)步驟:Step1:將字符串切分成各行。首先對(duì)字符串進(jìn)行水平投影,然后分別根據(jù)波谷將字符串進(jìn)行切分。Step2:將切分好的各行字符串切分成單字符。首先對(duì)切成行的字符串進(jìn)行垂直投影,然后根據(jù)波谷特性將字符串進(jìn)行切分。通過(guò)上述方法,可以簡(jiǎn)單并且準(zhǔn)確高效處理對(duì)于按照行書(shū)寫(xiě)、沒(méi)有連寫(xiě)或者粘連、沒(méi)有斷筆的數(shù)字串切分。 b) 橫向切割線a) 二值化后待切割原圖c) 縱向切割的切割線 采用投影直線算法切割效果圖 4 手寫(xiě)體數(shù)字識(shí)別中特征值提取技術(shù) 特征提取概述模式識(shí)別使用特征來(lái)區(qū)分不同的種類,因此,特征提取是一個(gè)模式識(shí)別系統(tǒng)的關(guān)鍵部分。特征提取的目標(biāo)是找到某種變換,將n維或nn維的模式類別空間轉(zhuǎn)換到維數(shù)更小的特征空間,并同時(shí)保留識(shí)別所需要的大部分信息。通過(guò)特征提取,模式分類可以在維數(shù)低得多的空間上進(jìn)行,從而降低了計(jì)算的復(fù)雜度。而且,對(duì)給定的訓(xùn)練樣本進(jìn)行特征提取可以獲得更精確的分類函數(shù)的描述,以構(gòu)造更可靠的分類規(guī)則。模式特征對(duì)于分類是十分重要的,數(shù)字識(shí)別的關(guān)鍵在于能否找出有效的特征,選取的特征是否具有可辨性、可靠性、獨(dú)立性和特征數(shù)量少。具體來(lái)說(shuō),特征的可辨性是指屬于不同類別的樣本,特征應(yīng)該有相對(duì)差別較大的值,這樣不同類別的樣本才能區(qū)分的開(kāi);特征的可靠性是指對(duì)與屬于同一類別的樣本,而其應(yīng)具有穩(wěn)定性,這樣同一類別的樣本才可以判別為同一類別而不至于誤判;特征的獨(dú)立性是指選擇出來(lái)的不同特征之間應(yīng)該互不相關(guān),這樣才能減少信息的冗余性;特征的數(shù)量要少是指特征量越少越容易滿足前面的三個(gè)原則,處理速度也會(huì)相應(yīng)提高。模式識(shí)別系統(tǒng)的復(fù)雜度會(huì)隨著特征量的增加而迅速增大。更重要的是,訓(xùn)練分類器和判別一個(gè)分類器的好壞所需要的數(shù)量也會(huì)隨著所用的特征量的數(shù)目呈指數(shù)增長(zhǎng)。在一個(gè)完善的模式識(shí)別系統(tǒng)中,特征提取與選擇技術(shù)通常介于對(duì)象特征數(shù)據(jù)采集和分類識(shí)別兩個(gè)環(huán)節(jié)中間,所抽取與選擇特征的優(yōu)劣,嚴(yán)重的影響著分類器的設(shè)計(jì)和性能。在樣本數(shù)目不是很多的情況下,用很多特征進(jìn)行分類器設(shè)計(jì),無(wú)論從計(jì)算復(fù)雜程度還是分類器性能來(lái)看都是不合適的,因此研究如何把高維特征空間壓縮到低維特征空間,以便有效的設(shè)計(jì)分類器就成為一個(gè)重要的問(wèn)題,這也是模式識(shí)別中的一個(gè)關(guān)鍵問(wèn)題。特征提取方法的選擇是影響識(shí)別率的一個(gè)至關(guān)重要的因素,必須指出的是,對(duì)于不同的識(shí)別問(wèn)題和不同樣本數(shù)據(jù),使用不同的特征提取方法的適應(yīng)性差別是很大的,也就是說(shuō),一種特征提取方法對(duì)一個(gè)問(wèn)題和數(shù)據(jù)很奏效對(duì)另一個(gè)問(wèn)題或數(shù)據(jù)可能失效。一個(gè)解決的辦法是尋找不同的數(shù)據(jù)的共同特征,或稱不變量。另一方面,對(duì)于一個(gè)有限的訓(xùn)練數(shù)據(jù)集,如果使用的是統(tǒng)計(jì)分類器,特征集必須保持在一個(gè)合理小的數(shù)量?jī)?nèi)。就數(shù)字識(shí)別來(lái)說(shuō),在實(shí)際過(guò)程中,如何選擇若干種特征提取的方法取決于識(shí)別的用途。我們必須考慮到待識(shí)別的數(shù)字是否有固定的方向和大小,是印刷體還是手寫(xiě)體,是否存在不同的書(shū)寫(xiě)風(fēng)格,是否有缺損,程度如何。這些有利于縮小特征提取選擇的難度和提高識(shí)別率。此外,雖然特征提取是一個(gè)好的字符識(shí)別系統(tǒng)的重要組成部分,但是對(duì)于一個(gè)識(shí)別系統(tǒng),為了達(dá)到較佳的結(jié)果,其它的步驟,如二值化,歸一化等也需要優(yōu)化處理,并且這些處理不是前后互相獨(dú)立的。特征提取的選擇取決于這些預(yù)處理的結(jié)果。雖然,在一定意義上特征提取和特征選擇都是要達(dá)到降維的目的,只是所實(shí)現(xiàn)的途徑不同,特征提取是通過(guò)某種變換的方法組合原始高維特征,獲得一組低維的新特征,而特征選擇是根據(jù)專家的經(jīng)驗(yàn)知識(shí)或根據(jù)某種評(píng)價(jià)準(zhǔn)則來(lái)挑選出那些對(duì)分類最優(yōu)影響力的特征,并生成新的特征。有時(shí)這兩者并不是截然分開(kāi)的。例如可以先將原始特征空間映射到維數(shù)較低的空間,在這個(gè)空間中再進(jìn)行選擇以進(jìn)一步降低維數(shù)。當(dāng)然也可以先經(jīng)過(guò)選擇,去掉那些明顯沒(méi)有分類信息的特征,再進(jìn)行映射,以降低維數(shù)。同樣對(duì)于手寫(xiě)體字符的識(shí)別,特征提取可以降低字符信息量。去除無(wú)用的冗余信息、提高識(shí)別系統(tǒng)性能。手寫(xiě)體字符的識(shí)別,常用的特征有結(jié)構(gòu)特征和統(tǒng)計(jì)特征。結(jié)構(gòu)特征和統(tǒng)計(jì)特征各有優(yōu)點(diǎn):結(jié)構(gòu)特征對(duì)細(xì)節(jié)變化比較敏感,對(duì)噪聲干擾較大的圖像,識(shí)別率不高。統(tǒng)計(jì)特征對(duì)噪聲不敏感,具有較好的穩(wěn)定性,但對(duì)圖像細(xì)節(jié)上的細(xì)微差異不敏感,在待識(shí)別字符形狀較相似時(shí)易發(fā)生錯(cuò)誤。所以,統(tǒng)計(jì)特征和結(jié)構(gòu)特征相互之間具有一定的互補(bǔ)性。 手寫(xiě)體字符特征提取方法概述特征提取是整個(gè)字符識(shí)別系統(tǒng)的關(guān)鍵,識(shí)別算法是根據(jù)選取特征的種類來(lái)進(jìn)行選擇的。所選取的特征是否是穩(wěn)定,是否代表一類字符的特點(diǎn),是系統(tǒng)識(shí)別率的高低關(guān)鍵。由上節(jié)可知手寫(xiě)體字符特征提取的方法可分為結(jié)構(gòu)特征和統(tǒng)計(jì)特征兩種,下面就分別簡(jiǎn)單介紹這兩種特征提取方法的特點(diǎn)與一般方法。1) 結(jié)構(gòu)特征提取方法采用結(jié)構(gòu)特征提取字符進(jìn)行結(jié)構(gòu)分析從而達(dá)到識(shí)別的目的,是一種非常直觀的方法,其思想與人認(rèn)字的原理有點(diǎn)相像,但又有所不同。其基本思想是:字符可以逐級(jí)分解成部件、筆劃乃至筆段,識(shí)別時(shí)可以自底向上,由像素得到筆段,由筆段結(jié)合成筆劃,由筆劃構(gòu)成部件,由部件組成字符,逐級(jí)分析字符圖像的結(jié)構(gòu),根據(jù)各元素的屬性、數(shù)量及其互相關(guān)系,便可以判定待識(shí)字符。目前研究比較成熟,效果較好的是基于筆劃和基于筆段分析的手寫(xiě)體字符識(shí)別。對(duì)不同的字符手寫(xiě)樣本,盡管人書(shū)寫(xiě)風(fēng)格千變?nèi)f化,然而筆劃與筆劃之間的位置關(guān)系,以筆劃為基元的字符的整體拓?fù)浣Y(jié)構(gòu)是不變的。人認(rèn)字就是抓住了這些本質(zhì)不變的特征,因此能適應(yīng)不同的書(shū)寫(xiě)風(fēng)格的文字。所以,基于筆劃來(lái)自動(dòng)識(shí)別字符一直是手寫(xiě)體字符識(shí)別研究的一類主要研究方法。雖然字符的筆劃特征受字體、字形大小等影響較小,是識(shí)別字符的良好特征,但可惜筆劃特征對(duì)實(shí)際的書(shū)寫(xiě)文本來(lái)說(shuō)比較難穩(wěn)定的提取。通常,用基于筆劃段作為特征能較好的解決這一困難。采用結(jié)構(gòu)特征提取方法的難點(diǎn)在于筆劃或筆段等基元的準(zhǔn)確提取。雖然提取筆劃或筆段的方法已有多種,但他們都是基于圖像處理的方法,截然不同于人根據(jù)知識(shí)和經(jīng)驗(yàn)而做出的視覺(jué)處理。單純建立在圖像處理方法上的筆段分析只能十分機(jī)械的按圖像就事論事,結(jié)果提取到的筆段難免與人的判別不完全一致。這種情況在存在連筆、斷筆、模糊等場(chǎng)合尤為不可避免。所以,書(shū)寫(xiě)畸變對(duì)結(jié)構(gòu)特征分析法有著不可忽視的影響。因此,尋求穩(wěn)定可靠的筆段提取方法仍然是當(dāng)前有待進(jìn)一步研究的課題。2) 統(tǒng)計(jì)特征提取方法從統(tǒng)計(jì)模式識(shí)別的觀點(diǎn)來(lái)看,字符識(shí)別實(shí)際上是一個(gè)模式分類問(wèn)題,人對(duì)自然物體的識(shí)別,是建立在對(duì)該物體進(jìn)行學(xué)習(xí)、特征分析的基礎(chǔ)上的,計(jì)算機(jī)模式識(shí)別的過(guò)程與人的識(shí)別過(guò)程有著相似的地方。實(shí)際上就是一種通過(guò)學(xué)習(xí)或者其它方法,形成一個(gè)記憶知識(shí)庫(kù),進(jìn)行模式識(shí)別時(shí),清晰地表達(dá)出一種從物體到記憶知識(shí)庫(kù)的映像,從而得到識(shí)別的結(jié)果。人在進(jìn)行物體識(shí)別時(shí),是利用大腦中通過(guò)學(xué)形成的記憶庫(kù),對(duì)識(shí)別的物體進(jìn)行一種黑箱式的映像,從記憶庫(kù)中找出相匹配的類別。計(jì)算機(jī)要把人類識(shí)別物體時(shí)的這種黑箱式的映像表達(dá)出來(lái),一般式有兩個(gè)步驟完成的:第一步,以適當(dāng)?shù)奶卣鱽?lái)描述物體,第二步,計(jì)算機(jī)執(zhí)行某種運(yùn)算完成的映像。此過(guò)程實(shí)際上就是傳統(tǒng)的統(tǒng)計(jì)模式識(shí)別進(jìn)行物體識(shí)別時(shí)所采用的一般方法,具體來(lái)說(shuō)就是特征提取和分類函數(shù)的設(shè)計(jì)的問(wèn)題,而特征提取是問(wèn)題難點(diǎn)和關(guān)鍵所在。因此如果特征已知,就可以利用現(xiàn)有的數(shù)學(xué)理論來(lái)指導(dǎo)設(shè)計(jì)映像函數(shù)。然而,對(duì)于特征的選擇和提取,卻沒(méi)有可遵循的
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1