freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫體數(shù)字識別的軟件設(shè)計畢業(yè)設(shè)計論文資料-資料下載頁

2025-06-23 05:06本頁面
  

【正文】 理論來指導(dǎo),我們很難比較一個物體中哪些特征是實質(zhì)性,哪些特征是代表性的,哪些特征可能是不重要或與識別無關(guān)緊要的,這些都需要大量的實驗和理論指導(dǎo)。經(jīng)過人們在這方面的大量研究工作,提出了一些統(tǒng)計特征提取方法。由此可見,對手寫體數(shù)字圖像進行特征值的提取,特征值的選擇不僅能濃縮信息、降低維數(shù)、提高處理效率的同時,其對系統(tǒng)的識別性能也有很重要的影響。,我們將詳細描述本文所采用的8種特征值(3個結(jié)構(gòu)特征、5個統(tǒng)計特征,共120個特征向量)的提取方法。 手寫體數(shù)字識別中的結(jié)構(gòu)特征提取采用結(jié)構(gòu)特征對字符進行結(jié)構(gòu)分析以達到識別目的是一種非常直觀的方法。字符由各個子部件構(gòu)成,逐級分析字符圖像的結(jié)構(gòu),根據(jù)元素的屬性、數(shù)量及其相互關(guān)系,便可判定待識字符。與統(tǒng)計方法相比,結(jié)構(gòu)分析不注重特征的絕對位置,只考慮特征的相對關(guān)系,因而對書寫風(fēng)格的變化不敏感,其缺點在于特征提取的算法都相對復(fù)雜。下面將介紹本文采用的3種結(jié)構(gòu)特征向量的提取方法。 結(jié)構(gòu)點特征目前,在手寫體字符識別的特征提取中,結(jié)構(gòu)點特征占了很重要的一部分。結(jié)構(gòu)點特征是指字符筆劃中的端點、交點及拐點,交叉點是多個筆劃相交的交點,交點又有三叉點和四叉點之分。拐點是筆劃書寫方向上有顯著變化的點。對結(jié)構(gòu)點特征的檢測方法有多種,比較傳統(tǒng)檢測端點、三叉點與四叉點的方法如下:假設(shè)當(dāng)前點位p,則其八個鄰域的點位置如下所示:令: ()判別條件如下:如果d=1,則p為端點。如果d=3,則p為三叉點。如果d=4,則p為四叉點。然而上述方法對某些三叉點和四叉點的檢測并不是很準確,該像素連接著上、下、左三個方向的“骨架”,如果去除該像素的話,原細化圖像將產(chǎn)生斷開現(xiàn)象,因此該像素點是不可缺少的。,那么該點像素為三叉點,并且該像素的左邊的一個像素為四叉點。然而從直觀上看,該灰色像素的三叉點應(yīng)該不能計算在內(nèi)(否則的話字符圖像8就多了一個三叉點),應(yīng)該屬于“重復(fù)”檢測。 數(shù)字8細化圖像因此,該方法詳細步驟如下:Step1:,并將每個像素點是否為端點、三叉點、四叉點并標記到對應(yīng)的新位圖中。Step2:從上到下從左到右依次掃描,如果該點不是三叉點的話,不做任何處理,否則的話,則檢測該像素點鄰域的8個點中是否有四叉點,如果有四叉點,則該點標記為非特殊點。Step3:統(tǒng)計端點、三叉點、四叉點的個數(shù)。上面敘述的是一個通俗易懂的方法,其可以做進一步優(yōu)化。采用本文的改進算法之后,對類似于這種特殊的三叉點不會再被檢測為特殊點,有效的提高該特征向量的準確性。而對于拐點,文獻[20]提出了一種確定拐點的方法,就圖像骨架取相鄰7點,以中心為考察點,分別用反正切公式計算前四點和后四點的近似直線的角度,考察這兩個直線的夾角θ是否大于所設(shè)定的閾值T來判定中間點是否為拐點。作者提出的角度公式如下: ()其中,和分別表示第n個像素的坐標值。但是,由于上述方法在閾值的選擇上需要依靠經(jīng)驗設(shè)定,對于不同大小規(guī)范化的樣本,都需要重新確定一次閾值。因此本文采用文獻[8]提出的一種簡單的檢測拐點的方法。該方法的基本思想是:先按一定順序掃描細化圖像中的每一個點,若某點的鏈碼方向從水平(垂直)方向變換為垂直(水平)方向,則認為該點位拐點。 左邊為像素掃描順序,右邊為鏈碼方向編碼、拐點和交叉點的示意圖。 數(shù)字8細化圖像上檢測到的特殊點的示意圖 穿越密度特征穿越密度(次數(shù))特征已被廣泛的應(yīng)用于字符識別的研究中。穿線法是取得筆劃密度的一個通用算法,其基本思想是用一組或幾組與水平成0度、30度、45度或者60度等的平行線,貫穿字符,提取字符與平行線的交點信息作為識別的依據(jù)。該算法由于涉及字符拓撲結(jié)構(gòu)方面的信息,所以對字符旋轉(zhuǎn)縮放和變形有較強的容忍度。文獻[21]提出的一種徑向貫穿字符的穿線法,該方法以字符重心為坐標原點,分別從坐標原點以0、490、13180、1390、45度方向引出8條線穿越字符,以各個方向穿越字符的次數(shù)組成向量作為該字符的徑向筆劃密度特征。但是,當(dāng)書寫風(fēng)格引起統(tǒng)一字符的之心位置不同時,該方法提取的特征準確性差。本文采用的是整體貫穿法,該方法就是間隔一定距離從垂直和水平方向上進行整體穿越,由于本文通過歸一化處理后的圖像的大小是2020的,因此本文采用方法是間隔5個像素進行從水平和垂直方向進行穿越,從而得到4行、4列上(共8個)的穿越次數(shù)統(tǒng)計,將之作為特征向量。 投影特征,將一個字符點陣劃分為四個象限區(qū)域,共有十二個邊線。將一個字符點陣中的每一個黑點向最近的四條邊線沿水平和垂直方向進行投影,用十二條邊線上的投影長度作為投影特征,一共有十二個特征。 投影特征示意圖之所以選用投影特征作為手寫體數(shù)字識別的特征,主要是因為投影特征計算簡單,能夠反應(yīng)字符的內(nèi)部結(jié)構(gòu)和筆劃的分布情況,唯一性好,可區(qū)別性好,是比較有代表性的特征,不同數(shù)字之間的12個投影特征的各個分量差異比較明顯,可以考慮作為分類的細特征。 手寫體數(shù)字識別中的統(tǒng)計特征提取統(tǒng)計特征分為全局統(tǒng)計特征和局部統(tǒng)計特征,全局統(tǒng)計特征是需要在整幅圖像上獲取的特征信息。傳統(tǒng)的全局特征主要包括:全局變換特征、不變矩特征、全局筆劃方向特征等。常用的局部統(tǒng)計特征有:局部筆劃方向特征、Gabor特征等。統(tǒng)計特征對微小的畸變不敏感,但區(qū)分相似的能力較差。接下來將詳細描述本文采用的5種統(tǒng)計特征值的提取方法。 重心矩特征由于不同字符的筆劃不同,其像素點的分布不同,所造成不同字符的四個象限中四個不同區(qū)域的重心位置與字符重心位置的距離不同(由于在圖像預(yù)處理中,圖像的重心已經(jīng)和中心對齊了)。也就是說令(,)表示字符的重心,那么可以近似的有: ()其中L為圖像的標準平面的邊長。那么下面定義重心矩如下: ()其中i=1,2;j=1,2。這樣就可以得到四個重心矩特征:,他們分別反映了四個象限中的像素偏離重心位置的整體特征。 粗網(wǎng)格特征粗網(wǎng)格特征是一組注重字符圖像的整體的分布特征,此種特征對噪聲具有極強的抑制能力。一般來說,雖然手寫體數(shù)字的書寫風(fēng)格千變?nèi)f化,但是數(shù)字筆劃的分布是有一定的規(guī)律的。由于10個字符的筆劃具有比較固定的總體分布狀況,從特征選擇的質(zhì)量來講,不同數(shù)字的特征向量在特征空間中的分布是比較分散的,即特征空間中不同類的類間距離是比較大的。,本文采用的粗網(wǎng)格特征提取的方法是:把數(shù)字點陣分成幾個局部小區(qū)域,并把每個小區(qū)域上的點陣密度作為描述特征,即統(tǒng)計每個小區(qū)域中圖像的像素的個數(shù)作為特征數(shù)據(jù)。本文對原始圖像進行歸一化處理后的圖像是2020的點陣,將之劃分為大小55的小區(qū)域,共計16個,因此得出一個十六維的粗網(wǎng)格特征。 粗網(wǎng)格特征提取示意圖由于粗網(wǎng)格特征反映的是圖像局部特征,而圖像局部的形變或噪聲對應(yīng)數(shù)字點陣就是局部元素“0”和“1”的值互換,所以如果圖像帶有局部的形變或噪聲,與沒有形變和噪聲的原圖像相比,像素的變化不大。也就是說,這個相對值對與數(shù)字圖片局部筆劃的形變或弧的噪聲點帶來的影響不敏感。因此,以粗網(wǎng)格特征進行數(shù)字識別,具有較好的抗噪聲能力。 水平、垂直投影特征投影密度常用來描述字符筆劃的寬度,同時它也可以反映字符一定程度上的筆劃結(jié)構(gòu)信息。由于投影的能夠很好的反映字符圖像的高寬,以及字符的筆劃密度。,該圖顯示了字符3的水平投影和垂直投影,通過該投影我們可以看出對于數(shù)字3的水平投影有其特有的波形形狀。而如果字符含有少量噪聲的話,該波形形狀基本不發(fā)生任何改變。因此本文采用水平、垂直投影特征作為特征值。本文提取水平、垂直投影特征的詳細算法是:首先分別掃描生成水平投影和垂直投影,然后每間隔4個像素提取一個特征值(該值是該4個中的最大值),因此這樣就可以提取52 =10個特征值。 字符3的水平和垂直投影 環(huán)凸凹特征環(huán)凸凹特征夠準確描述字符的大體輪廓信息,例如對與數(shù)字1,無論何種寫法,其不會包含環(huán)形,而對于數(shù)字0,6,8,9則應(yīng)該存在環(huán)形。然而環(huán)形和凸凹特征是受到書寫方法( 數(shù)字2的兩種不同寫法,左邊的數(shù)字2不包含環(huán)形,右邊的數(shù)字2的寫法包含環(huán)形)和斷筆等影響,因此雖然環(huán)凸凹特征能有效的區(qū)分某些數(shù)字之間的區(qū)別,但是由于其對書寫方法有一定要求而且要求必須沒有斷筆現(xiàn)象,因此如果直接采用此方法來進行識別數(shù)字,會影響識別率。本文提出將提取的數(shù)字圖像中環(huán)個數(shù)和凸凹區(qū)域的個數(shù)作為描述字符的特性的一個特征值,由于神經(jīng)網(wǎng)絡(luò)具有一定的抽象能力,即使由于少數(shù)字符因斷筆等造成環(huán)凸凹不準確,但其能更具其他特征值進行整體分析,具有一定的容忍能力,因此有效的解決斷筆可能導(dǎo)致環(huán)凸凹特性不準確的問題。 數(shù)字2的兩種不同書寫方法本文使用的環(huán)凸凹區(qū)域檢測的方法采用的是龔才春等人提出一種通過計算字符圖像賦值背景,從中提取凹凸特性的簡單快速方法[22]。該方法的步驟如下:Step1:計算賦值背景。所謂背景賦值,既是從字符圖像的所有背景點出發(fā),向右、右下、下、左下、左、左上、上、右八個方向發(fā)出八條射線,判斷射線是否與字符相交,有幾條射線相交,則將該背景點的值賦值為幾。Step2:提取環(huán)凸凹特性。這里提取字符的凸凹特性主要描述為更具賦值背景來尋找字符圖像的環(huán)和凹凸區(qū)域。環(huán)的識別很簡單,如果字符的四連通區(qū)域都是8并且周圍是被0包圍的話,那么認為該區(qū)域是一個環(huán)。凹凸區(qū)域同理,當(dāng)所有的字符的四連通區(qū)域中都是=5,并且連通區(qū)域的個數(shù)大于閥值T(本文中T取2),則認為該區(qū)域是一個凹區(qū)域。上述連通區(qū)域的檢測,可以采用深度優(yōu)先算法進行遍歷完成(具體深度優(yōu)先算法的實現(xiàn)可以參考相關(guān)資料,本文不做詳細描述)。通過上面的算法,就很容易的將字符圖形的環(huán)的個數(shù),凹凸區(qū)域的個數(shù)進行檢測并統(tǒng)計出來,將之作為環(huán)凹凸特征值。 全局Kirsh邊緣方向特征本文使用的全局Kirsh邊緣方向特征是基于邊緣強度(又稱梯度)的提取,通過分區(qū)密度統(tǒng)計來得到一組特征向量。Kirsh邊緣算子:Kirsh定義了一個非線性邊緣測量算子: ()其中,并且,上式中G(i,j)為像素(i,j)的邊緣強度(或梯度),Ak(k=0,1,2,…,7)為像素(i,j)的八個相鄰單元。A0 A1A2A7(i,j)A3A6A5A4 八個相鄰單元位置示意圖~(i,j)水平邊緣強度H,垂直邊緣強度V,右對角線邊緣強度R和左對角線邊緣強度L: () () () ()為了方便計算機處理,在上四式對4個方向的邊緣強度(水平、垂直、左對角、右對角)可以定義4組(8個)卷積模板運算。 a) 水平方向b) 垂直方向d) 左對角方向c) 右對角方向 Kirsch算子模板采用上述模板,分別對一個規(guī)范化的輸入圖像(二值化圖像),通過上面4組方向算子計算出4幅邊緣(或稱梯度)矩陣。對于本文的數(shù)字圖像大小為2020的圖像來說,將會產(chǎn)生一個2020的矩陣。為了減少數(shù)據(jù),本文對該4組矩陣數(shù)據(jù)進行壓縮,采取的壓縮方法是:將2020的矩陣分割成16個55的正方形,然后將55的圖形進行累加求和。因此這樣將2020的矩陣壓縮到44的矩陣,這樣的矩陣一共4個,累計444=64個特征值。5 人工神經(jīng)網(wǎng)絡(luò)分類器 人工神經(jīng)網(wǎng)絡(luò)概述人工神經(jīng)(Artificial Neural Network,ANN),自從20世紀50年代Rosenblatt首次將單層感知器應(yīng)用于模式分類學(xué)習(xí)以來,已經(jīng)有了幾十年的研究歷史。但是,由于Minsky和Papert指出單層系統(tǒng)的局限性,并表達了對多層系統(tǒng)的悲觀看法,在20世紀70年代,對ANN的研究興趣減弱。直到80年代中期Rumelhart等重新闡述了反傳訓(xùn)練方法,使得在ANN領(lǐng)域的理論和應(yīng)用研究開始在世界范圍內(nèi)重新興起。ANN是一種按照人腦的組織和活動原來而構(gòu)造的一種數(shù)據(jù)驅(qū)動型非線性映射模型,它具有強大的并行處理、自適應(yīng)自組織、聯(lián)想記憶、容錯魯棒以及逼近任意非線性等特性,在預(yù)測評估、模式識別、信號處理、組合優(yōu)化及知識工程等領(lǐng)域具有廣泛的應(yīng)用。近年來,已有多種ANN模型被提出并得以深入研究。其中,80%~90%的人工神經(jīng)網(wǎng)絡(luò)模型采用前饋反向傳播網(wǎng)絡(luò)(BackPropagation Network,簡稱BP網(wǎng)絡(luò))。人工神經(jīng)網(wǎng)絡(luò)源于人腦神經(jīng)系統(tǒng)的一類模型,是模擬人工智能的一條重要途徑,具有模擬人的部分形象思維的能力。它是由簡單信息處理單元(人工神經(jīng)元)互聯(lián)組成的網(wǎng)絡(luò),能接受處理信息,網(wǎng)絡(luò)的信息處理由處理單元間的互相作用來實現(xiàn),它是通過把問題表達成處理單元間的連接權(quán)來處理。一般情況下,人工神經(jīng)網(wǎng)絡(luò)是作為信息處理單元來模仿大腦,執(zhí)行特定的任務(wù)或完成感興趣的功能,它是一種并行的分布式信息處理結(jié)構(gòu),通過成為連接的單向信號通路將一些處理單元(具有局部存儲并能執(zhí)行局部信息處理能力)互聯(lián)而組成。每一個處理單元的都有一個單輸出到所期望的連接。每一個處理單元傳送相同的信號——處理單元輸出信號。處理單元的輸出信號可以使任一種所要求的數(shù)學(xué)模型。在每一個處理單元中所執(zhí)行的信息處理在它必須完成是局部的限制下可以被任意定義,即它必須只依賴于處理單元所接受的輸入激勵信號的當(dāng)前值和處理單元本身存儲記憶的值。神經(jīng)網(wǎng)絡(luò)應(yīng)用與模式識別問題包括兩個階段。第一個階段為訓(xùn)練階段:該階段把輸入模式映射到相應(yīng)的分類器所需知識由權(quán)值體現(xiàn),最初權(quán)值是未知的,通過訓(xùn)練尋找有用的權(quán)值。訓(xùn)練首先要提供訓(xùn)練集合,它由輸入樣本和與之相應(yīng)的代表正確分類的輸出組成,調(diào)整權(quán)值系統(tǒng),訓(xùn)練集合的每一矢量是否有特定的期望輸出,這是一種有監(jiān)督的學(xué)習(xí)。第
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1