freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫體數(shù)字識別的軟件設(shè)計畢業(yè)設(shè)計論文資料-wenkub.com

2025-06-20 05:06 本頁面
   

【正文】 第一個階段為訓(xùn)練階段:該階段把輸入模式映射到相應(yīng)的分類器所需知識由權(quán)值體現(xiàn),最初權(quán)值是未知的,通過訓(xùn)練尋找有用的權(quán)值。每一個處理單元傳送相同的信號——處理單元輸出信號。人工神經(jīng)網(wǎng)絡(luò)源于人腦神經(jīng)系統(tǒng)的一類模型,是模擬人工智能的一條重要途徑,具有模擬人的部分形象思維的能力。直到80年代中期Rumelhart等重新闡述了反傳訓(xùn)練方法,使得在ANN領(lǐng)域的理論和應(yīng)用研究開始在世界范圍內(nèi)重新興起。為了減少數(shù)據(jù),本文對該4組矩陣數(shù)據(jù)進行壓縮,采取的壓縮方法是:將2020的矩陣分割成16個55的正方形,然后將55的圖形進行累加求和。Kirsh邊緣算子:Kirsh定義了一個非線性邊緣測量算子: ()其中,并且,上式中G(i,j)為像素(i,j)的邊緣強度(或梯度),Ak(k=0,1,2,…,7)為像素(i,j)的八個相鄰單元。凹凸區(qū)域同理,當(dāng)所有的字符的四連通區(qū)域中都是=5,并且連通區(qū)域的個數(shù)大于閥值T(本文中T取2),則認(rèn)為該區(qū)域是一個凹區(qū)域。所謂背景賦值,既是從字符圖像的所有背景點出發(fā),向右、右下、下、左下、左、左上、上、右八個方向發(fā)出八條射線,判斷射線是否與字符相交,有幾條射線相交,則將該背景點的值賦值為幾。然而環(huán)形和凸凹特征是受到書寫方法( 數(shù)字2的兩種不同寫法,左邊的數(shù)字2不包含環(huán)形,右邊的數(shù)字2的寫法包含環(huán)形)和斷筆等影響,因此雖然環(huán)凸凹特征能有效的區(qū)分某些數(shù)字之間的區(qū)別,但是由于其對書寫方法有一定要求而且要求必須沒有斷筆現(xiàn)象,因此如果直接采用此方法來進行識別數(shù)字,會影響識別率。而如果字符含有少量噪聲的話,該波形形狀基本不發(fā)生任何改變。因此,以粗網(wǎng)格特征進行數(shù)字識別,具有較好的抗噪聲能力。,本文采用的粗網(wǎng)格特征提取的方法是:把數(shù)字點陣分成幾個局部小區(qū)域,并把每個小區(qū)域上的點陣密度作為描述特征,即統(tǒng)計每個小區(qū)域中圖像的像素的個數(shù)作為特征數(shù)據(jù)。這樣就可以得到四個重心矩特征:,他們分別反映了四個象限中的像素偏離重心位置的整體特征。接下來將詳細(xì)描述本文采用的5種統(tǒng)計特征值的提取方法。 手寫體數(shù)字識別中的統(tǒng)計特征提取統(tǒng)計特征分為全局統(tǒng)計特征和局部統(tǒng)計特征,全局統(tǒng)計特征是需要在整幅圖像上獲取的特征信息。本文采用的是整體貫穿法,該方法就是間隔一定距離從垂直和水平方向上進行整體穿越,由于本文通過歸一化處理后的圖像的大小是2020的,因此本文采用方法是間隔5個像素進行從水平和垂直方向進行穿越,從而得到4行、4列上(共8個)的穿越次數(shù)統(tǒng)計,將之作為特征向量。穿線法是取得筆劃密度的一個通用算法,其基本思想是用一組或幾組與水平成0度、30度、45度或者60度等的平行線,貫穿字符,提取字符與平行線的交點信息作為識別的依據(jù)。因此本文采用文獻[8]提出的一種簡單的檢測拐點的方法。采用本文的改進算法之后,對類似于這種特殊的三叉點不會再被檢測為特殊點,有效的提高該特征向量的準(zhǔn)確性。 數(shù)字8細(xì)化圖像因此,該方法詳細(xì)步驟如下:Step1:,并將每個像素點是否為端點、三叉點、四叉點并標(biāo)記到對應(yīng)的新位圖中。如果d=4,則p為四叉點。結(jié)構(gòu)點特征是指字符筆劃中的端點、交點及拐點,交叉點是多個筆劃相交的交點,交點又有三叉點和四叉點之分。字符由各個子部件構(gòu)成,逐級分析字符圖像的結(jié)構(gòu),根據(jù)元素的屬性、數(shù)量及其相互關(guān)系,便可判定待識字符。經(jīng)過人們在這方面的大量研究工作,提出了一些統(tǒng)計特征提取方法。計算機要把人類識別物體時的這種黑箱式的映像表達(dá)出來,一般式有兩個步驟完成的:第一步,以適當(dāng)?shù)奶卣鱽砻枋鑫矬w,第二步,計算機執(zhí)行某種運算完成的映像。因此,尋求穩(wěn)定可靠的筆段提取方法仍然是當(dāng)前有待進一步研究的課題。雖然提取筆劃或筆段的方法已有多種,但他們都是基于圖像處理的方法,截然不同于人根據(jù)知識和經(jīng)驗而做出的視覺處理。所以,基于筆劃來自動識別字符一直是手寫體字符識別研究的一類主要研究方法。其基本思想是:字符可以逐級分解成部件、筆劃乃至筆段,識別時可以自底向上,由像素得到筆段,由筆段結(jié)合成筆劃,由筆劃構(gòu)成部件,由部件組成字符,逐級分析字符圖像的結(jié)構(gòu),根據(jù)各元素的屬性、數(shù)量及其互相關(guān)系,便可以判定待識字符。 手寫體字符特征提取方法概述特征提取是整個字符識別系統(tǒng)的關(guān)鍵,識別算法是根據(jù)選取特征的種類來進行選擇的。手寫體字符的識別,常用的特征有結(jié)構(gòu)特征和統(tǒng)計特征。例如可以先將原始特征空間映射到維數(shù)較低的空間,在這個空間中再進行選擇以進一步降低維數(shù)。此外,雖然特征提取是一個好的字符識別系統(tǒng)的重要組成部分,但是對于一個識別系統(tǒng),為了達(dá)到較佳的結(jié)果,其它的步驟,如二值化,歸一化等也需要優(yōu)化處理,并且這些處理不是前后互相獨立的。另一方面,對于一個有限的訓(xùn)練數(shù)據(jù)集,如果使用的是統(tǒng)計分類器,特征集必須保持在一個合理小的數(shù)量內(nèi)。在一個完善的模式識別系統(tǒng)中,特征提取與選擇技術(shù)通常介于對象特征數(shù)據(jù)采集和分類識別兩個環(huán)節(jié)中間,所抽取與選擇特征的優(yōu)劣,嚴(yán)重的影響著分類器的設(shè)計和性能。模式特征對于分類是十分重要的,數(shù)字識別的關(guān)鍵在于能否找出有效的特征,選取的特征是否具有可辨性、可靠性、獨立性和特征數(shù)量少。 b) 橫向切割線a) 二值化后待切割原圖c) 縱向切割的切割線 采用投影直線算法切割效果圖 4 手寫體數(shù)字識別中特征值提取技術(shù) 特征提取概述模式識別使用特征來區(qū)分不同的種類,因此,特征提取是一個模式識別系統(tǒng)的關(guān)鍵部分。Step2:將切分好的各行字符串切分成單字符。 多模具切分方法的切分模具 本文手寫數(shù)字串切分方法介紹首先由于本文將不對連寫或粘連的手寫體數(shù)字串進行識別,其次又因為在人們的數(shù)字過程中,一般的是都是按照行進行書寫(垂直方向不一定對齊)。2) 模具類型2:針對0的弧線類型。但事實上,該方法不僅運算量特別大,而且當(dāng)書寫的字符大小不一時,將產(chǎn)生較差的效果。有學(xué)者提出了采用基于識別的動態(tài)規(guī)劃算法進行切分處理,該方法可以較好的切分字符串。這條分離字符的路徑實際上就是我們要尋找的切分線。 滴水算法滴水算法就是模仿一滴水珠依靠重力的作用,沿筆劃的輪廓自然下降,最終形成切分軌跡,該算法思想ShiiteCongedo于1995年首先提出,其涉及到三個關(guān)鍵問題:1) 起始點的確定,2) 下一步尋址策略,3) 穿越盲區(qū)的方法。其大致思想是:先對圖像做垂直(水平)方向的投影,獲取其垂直投影向量所對應(yīng)的投影曲線,再選取曲線中大波谷作為切分區(qū)域?;谧R別的切分方法是,在切分的時候引入識別處理,并使用識別結(jié)果作為評價當(dāng)前切分結(jié)果的正確與否,如此反復(fù)切分識別最后提出最合理的切分線。但是由于該類是在二維空間里搜索,所以算法相對較為復(fù)雜,計算量也特別大。由于直線只需要在一維空間中尋找,所以直線切分的算法簡單、直觀。 b) 細(xì)化后圖像a) 原始圖像 數(shù)字8和3的細(xì)化效果3 手寫體數(shù)字識別中串切分技術(shù) 切分方法概述對于連續(xù)的手寫數(shù)字串識別有兩種途徑:一是不切分直接識別,二是先切分后識別。3) 在第二次操作時,當(dāng)且僅當(dāng)條件G1,G2和G4被全部滿足時,則刪除中心像素p(即讓p=0)。3) 按細(xì)化的運算方式分為兩種,即邊緣點刪除和內(nèi)點保留。細(xì)化算法的大體分類如下:1) 按細(xì)化后圖形的連續(xù)性分,有四鄰域連接算法,八鄰域連接算法。3) 細(xì)化后的骨架應(yīng)盡量是原來筆劃的中心線。這種處理就是所謂的細(xì)化。對字符識別而言,字符圖像上的各個像素點對識別率的貢獻并不一樣,細(xì)化處理能極大的消除字符圖像中的冗余點,使計算機在分析處理、識別時不受筆劃粗細(xì)的影響,快速的接觸到本質(zhì)內(nèi)容,減少運算量,從而縮短識別的時間。并把旋轉(zhuǎn)角度做改變:。2) 如果旋轉(zhuǎn)角度θ 1o,轉(zhuǎn)到3)。旋轉(zhuǎn)中心定在圖像的幾何中心處。本文采用的傾斜算法主要采用的是文獻[18]的算法。 a) 原圖b) 歸一化后的效果 傾斜校正在預(yù)處理的中,傾斜校正也是一個很重要的一個步驟。而如果保持原圖縱橫比的話,將能夠較好的保持字符形狀,: ()。本文采取的處理方法是,將有超出部分將其截去。則歸一化后的圖形寬度與高度分別用W2和H2表示,則縱橫比定義如下: ()a) 原始圖像b) 采用根據(jù)一維直方圖自動閥值分割效果 c) 采用基于OTSU的二維最大類間方差閾值分割的改進算法分割效果d) 采用本文的二值化算法進行閥值分割的最終效果(由g)圖進行線、點濾波后的結(jié)果)e) 采用本文的二值化算法之三級圖像(由a)圖像進行處理) g) 采用本文的二值化算法之縱向掃面(由e)圖像進行處理然后與f)圖結(jié)合)f) 采用本文的二值化算法之橫向掃描(由e)圖像進行處理) 三種不同二值化算法的比較和本文二值化算法的處理步驟效果圖。為了能更加容易的進行特征提取和分類,歸一化后的圖像平面(標(biāo)準(zhǔn)平面的)x/y軸的大小是固定的(本文采用20/20)。進過歸一化處理后,一般的能夠?qū)⒋蟮淖址麍D像信息進行縮小到固定大小的數(shù)字圖像,這樣在提高識別率的同時也能提高處理的效率。 歸一化對于字符識別來說,歸一化是一個很重要的預(yù)處理因素。為了濾除這種噪聲,因此需要再對Step5得到的二值圖像,進行線濾除和點濾除從而得到最終的二值化圖像。最內(nèi)層的括號包含著對象點,標(biāo)記為1(目標(biāo))。從亮背景到暗對象的過渡(沿著水平或垂直掃描線)必須以 s(x,y)中的一個‘2’號后跟一個‘1’號的形式特點。Step2:采用基于直方圖自動閾值分割算法對產(chǎn)生的一階梯度信息圖像進行閾值分割,得出門限T。圖像的平滑處理減少了噪聲的影響并且它的主要作用還是抵消由拉普拉斯算子的二階導(dǎo)數(shù)引起的逐漸增加的噪聲影響。用一副圖像與該函數(shù)卷積模糊該圖像,圖像模糊的程度是σ值決定的。由于以上原因,拉普拉斯算子在分割中所起的作用包括:1) 利用它的零交叉的性質(zhì)進行邊緣定位。f(i1,j1)f(i1,j)f(i1,j+1)f(i,j1)f(i,j)f(i,j+1)f(i+1,j1)f(i+1,j)f(i+1,j+1) 像素(i,j)領(lǐng)域像素關(guān)系 那么根據(jù)Sobel算子(i,j)處的梯度是: ()其中,因為計算平方和、平方根需要大量的計算。2) 一條連接二階導(dǎo)數(shù)正極值和負(fù)極值的虛構(gòu)直線將在邊緣中點附近穿過零點。常見的一階邊緣檢測算子有Sobel算子、Prewitt算子、Robert算子和Kirsh算子,二階邊緣檢測算子一般采用拉普拉斯算子或者高斯拉普拉斯算子。對于光照不均的圖像,采用基于直方圖的自動閾值分割和基于OTSU的二維最大類間方差閾值分割的改進算法分割得到的二值圖像都不好。對文字圖像而言,由于筆畫和背景的區(qū)分比較明顯,并且動態(tài)閾值法的實現(xiàn)較為復(fù)雜、計算時間相對長,因此在文字識別中很少采用。不同的閾值法源于N(i,j)的不同選擇。目前,眾多學(xué)者對此已經(jīng)進行了比較詳細(xì)的研究,并提出了許多閾值選取的算法,這些算法大體上可以劃分為三類:整體閾值法,局部閾值法和動態(tài)閾值法?;诨叶确植嫉亩祷幚硪话闶峭ㄟ^設(shè)定閾值,把它變?yōu)閮H用二值表示前景和背景顏色的圖像。這是因為,一方面類似于字符、指紋、工程圖等圖像本身就是二值的。然而在保留圖像的總體特征上,高斯濾波器表現(xiàn)了很好的性能。根據(jù)高斯函數(shù)的可分離性可以得到,二維高斯濾波器能用2個一維高斯濾波器逐次卷積來實現(xiàn),一個沿水平方向,一個沿垂直方向。中值濾波器尤其對單級或雙極脈沖噪聲非常有效。3的中值濾波器。對于空間域濾波算法中最常用的是平滑濾波去噪法,其主要思想為在圖像空間中借助模板對圖像進行領(lǐng)域操作,用平均運算方法去除突然變化的點從而濾掉一定的噪聲。噪聲去除已經(jīng)成為圖像處理極其重要的步驟,然而現(xiàn)在還沒有一個通用的濾波去噪方法對所有的圖片適用,一般的圖像預(yù)處理必須根據(jù)實際情況選擇不同濾波去噪方法進行比較,最后得出最佳的濾波去噪方法。除此之外對于有些傳感元器件的自身質(zhì)量,如手機自帶的照相設(shè)備一般分辨率較低,在獲取數(shù)字圖像時會產(chǎn)生斑點噪聲。因此本文就省去了去除類印章、背景底紋等的這些操作。2 手寫體數(shù)字識別中預(yù)處理技術(shù)預(yù)處理對于一個良好的識別系統(tǒng)不僅是一個必不可少的環(huán)節(jié),而且是至關(guān)重要的。第五章:主要簡單介紹神經(jīng)網(wǎng)絡(luò)分類識別器實現(xiàn)原理。比如對于關(guān)鍵點特征的提取,則需要使用字符的外輪廓、骨架信息。第三章:主要研究的是手寫體數(shù)字識別中的切分技術(shù)。介紹內(nèi)容有:OCR及手寫體數(shù)字識別的歷史及現(xiàn)狀;手寫體數(shù)字識別的意義和難點;數(shù)字串識別系統(tǒng)的整體描述以及本文的研究內(nèi)容。 本文內(nèi)容安排我們主要目標(biāo)是對有噪聲、一定約束書寫條件下的脫機手寫體數(shù)字串的切割和識別算法進行一些探討性研究,以期提高其準(zhǔn)確性,獲得更高的可靠性。因此,在分類其中,我們將提取到的特征值輸入到已經(jīng)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中進行分類識別。特征值的提取一般包括:筆畫、拓?fù)潼c、結(jié)構(gòu)突變點、投影形狀、點(端點、連點、三叉點、四叉點、垂直交點,水平交點等)、弧、連通區(qū)域、凸凹形狀、環(huán)、字符整體輪廓、檢查必要的基元是否存在、不可有的基元是否出現(xiàn)等特征。預(yù)處理效果的好壞會直接影響到整個系統(tǒng)的性能。由于這些噪聲的影響,如果對獲取得到的數(shù)字圖像進行直接處理的話通常不能得到滿意的結(jié)果,因此在獲取原始數(shù)字圖像后,需要對圖像進行預(yù)處理。 手寫體數(shù)字識別系統(tǒng)概述不同的識別系統(tǒng),在具體處理一幅待識別圖像時,處理的步驟可能并不完全相同。 德國E9的Friedhelm Schwenker采用SVRBF40對手寫體數(shù)字進行識別,測試樣本10000個,%。在過去的數(shù)十年中,研究者提出了許多識別方法,目前手寫體數(shù)字識別方法可以分為兩類
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1