freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

研究生畢業(yè)論文基于結(jié)構(gòu)特征的自由手寫數(shù)字識(shí)別-資料下載頁(yè)

2025-08-14 19:13本頁(yè)面

【導(dǎo)讀】包含60000個(gè)訓(xùn)練樣本,以及10000個(gè)測(cè)試樣本,來自于250人。細(xì)化等處理,最終形成與樣本文件同樣大小的文件,其中每個(gè)樣本都已經(jīng)進(jìn)行了預(yù)處理,隨后便準(zhǔn)確的提取樣本的。征在各類別間的差異性,形成識(shí)別規(guī)則,計(jì)算隸屬度,最終現(xiàn)成一套完整的識(shí)別系統(tǒng),完成對(duì)字符的識(shí)別。準(zhǔn)確率達(dá)91%以上,效果理想。課題來源及本人主要工作.....

  

【正文】 第三章 系統(tǒng)分析 17 本點(diǎn)陣,每次穿越如果經(jīng)過數(shù)據(jù)點(diǎn)數(shù)大于 1 則穿越次數(shù)加 1 ;同樣對(duì)于縱向穿越 ,則為用 縱向直線做這種穿越。統(tǒng)計(jì)該樣本的橫向穿越次數(shù),縱向穿越次數(shù)。 顯然這個(gè)特征對(duì)于樣本的識(shí)別也是十分有效的,從樣本點(diǎn)陣的形象圖中可以猜測(cè)出樣本“ 0” 和樣本 ―8‖ 的 穿越次數(shù)應(yīng)當(dāng)較大,而樣本 “ 1” 的穿越次數(shù)應(yīng)當(dāng)是最小的,當(dāng)然這只是統(tǒng)計(jì)結(jié)果,由于手寫數(shù)字書寫的自由性,也會(huì)出現(xiàn)個(gè)跟樣本的偏差,不過多項(xiàng)特征可以配合使用更好地對(duì)樣本進(jìn)行識(shí)別。 橫向穿越 統(tǒng)計(jì)方式如下: 270[ ] ( , )jn u m i p i j?? ? 1 [ ] 10 [ ] 1[ ] { n u m in u m inu m i ??? 2708 [ ]if n u m i?? ? () 橫向穿越統(tǒng)計(jì)方式如下: 270[ ] ( , )in u m j p i j?? ? 1 [ ] 10 [ ] 1[ ] { n u m in u m inum j ??? 2709 [ ]jf n u m j?? ? () 特征六 交叉點(diǎn)個(gè)數(shù) 數(shù)字在手寫時(shí),筆劃會(huì)存在交叉,比如在數(shù)字“ 4” 中就有可能存在筆劃的交叉,當(dāng)然在其它數(shù)字中也有可能出現(xiàn)交叉,由于手寫的自由性,理論上應(yīng)當(dāng)出現(xiàn)筆劃交叉的可能在實(shí)際書寫中并不存在,而本應(yīng)不出現(xiàn)交叉的樣本也有能由于書寫的不規(guī)范而出現(xiàn)交叉,這些不規(guī)范性的出南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 系統(tǒng)分析 18 現(xiàn)基本不會(huì)對(duì)人眼對(duì)數(shù)字的識(shí)別帶來太大麻煩,但對(duì)于計(jì)算機(jī)對(duì)數(shù)字的識(shí)別則會(huì)帶來不準(zhǔn)確性,這樣呢就要求對(duì)特征的提取過程中盡量使特征更加精確 ,且盡量提取更多的特征以備后期識(shí)別算法的確定。筆劃特征在數(shù)字識(shí)別中被廣泛的使用,為更深入的進(jìn)行識(shí)別打下基礎(chǔ),這也是符合人對(duì)事物的認(rèn)識(shí)規(guī)律的。 在對(duì)交叉點(diǎn)的提取上由于考慮的書寫不規(guī)范性以及前期的細(xì)化處理 ,系統(tǒng)定義交叉點(diǎn)為八鄰域點(diǎn)中數(shù)據(jù)點(diǎn)大于 3 個(gè)的點(diǎn): 這里要用到圖 的八鄰域特性,令點(diǎn)陣寬度為 W ; 高度為 H ;點(diǎn) p(i , j) 是否為交叉點(diǎn)引入 Cr(i , j) 為交叉點(diǎn)時(shí)取直為 1,否則取值為 0;八個(gè)領(lǐng)域點(diǎn)分別為: P0 = 1。 p1 = 1 – W。 p2 = W。 p3 = 1 – W。 P4 = 1。 p5 = W 1。 p6 = W。 p7 = 1 + W。 那么交叉點(diǎn)個(gè)數(shù)統(tǒng)計(jì)為: 70701303( , ) {kkkkPPCr i j ??????? 2 7 2 7001 0 ( , )ijf Cr i j??? ?? () 特征七 端點(diǎn)情況 對(duì)于手寫數(shù)字,端點(diǎn)也就一個(gè)獨(dú)立筆劃的進(jìn)入點(diǎn),一般來 說,端點(diǎn)標(biāo)明一個(gè)線段的起點(diǎn)或終點(diǎn),對(duì)于整個(gè)數(shù)字,可以有多個(gè)這樣的端點(diǎn),每個(gè)端點(diǎn)有它自己的坐標(biāo),標(biāo)明該端點(diǎn)在點(diǎn)陣中的位置,端點(diǎn)在系統(tǒng)中定義為八鄰域中只有一個(gè)數(shù)據(jù)點(diǎn)的點(diǎn),因此,那唯一的相鄰數(shù)據(jù)點(diǎn)也標(biāo)明了該端點(diǎn)的出方向,也就標(biāo)明由端點(diǎn)引入的線段的走向,由于在下面識(shí)線段時(shí)還要用點(diǎn)端點(diǎn)信息,P3 P2 P1 P4 P P0 P5 P5 P7 南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 系統(tǒng)分析 19 而往往一個(gè)線段以一個(gè)端點(diǎn)為起點(diǎn),再以另外一個(gè)端點(diǎn)為中點(diǎn),這樣還需要給端點(diǎn)一個(gè)標(biāo)識(shí),標(biāo)明該端點(diǎn)有沒有在線段的提取中搜索過,這樣避免線段因?yàn)槠鹗嫉膬蓚€(gè)端點(diǎn)而被重復(fù)統(tǒng)計(jì)。 根據(jù)上述對(duì)端點(diǎn)的描述,做以下定義: Dp(i , j) 用 做對(duì)數(shù)據(jù)點(diǎn) p(i , j) 八鄰域中數(shù)據(jù)點(diǎn)的個(gè)數(shù)統(tǒng)計(jì) , 端點(diǎn)數(shù)統(tǒng)計(jì)為特征 f11 70( , ) ( , )kkD p i j P i j?? ? 1 ( , ) 10( , ) { D p i jD p i j ?? 其 它 2 7 2 7001 1 ( , )ijf D p i j??? ?? 對(duì)于樣本,除了端點(diǎn)的個(gè)數(shù)信息 f11,還要記錄下各端點(diǎn)的情況: 數(shù)組 end_P[4] 記錄端點(diǎn)信息, end_P[0] 是否被訪問過 置為 0 end_P[1] end_P[2] 端點(diǎn)在點(diǎn)陣中的坐標(biāo) 分別 為 i , j end_P[3] 端點(diǎn)方向,為唯一八鄰接數(shù)據(jù)點(diǎn)的方向 k 特征八 線段情況 線段在本系統(tǒng)中可以認(rèn)為是組成數(shù)字的各種筆劃,這里只取兩種筆劃,就是橫和豎, 因?yàn)檫@兩種筆劃更加容易判別,而且因手寫的自由性所引入的偏差也較小,而 弧 這種筆劃就不容易判別,到底彎曲的什么程度才算是弧,比如說數(shù)字“ 2” ,如圖 3. 3 中 本應(yīng) 存在的弧, 但 因?yàn)槭謱懖灰?guī)范的原因而不能被判別出來, 數(shù)字在點(diǎn)陣中顯示為 “橫 —折 —橫”的筆劃走向,而無(wú)法判別出其中有弧。而底端的橫則比較明顯,在不同書寫方式中,底端的橫出現(xiàn) 也比較穩(wěn)定,那么這些隨自由書寫而出現(xiàn)頻率較為穩(wěn)定的筆劃特征就是我們要提取的目標(biāo)。這里要提取的橫 或 豎,仍然要做一些近似,因?yàn)?,雖然理論上看來,每種數(shù)字在規(guī)范書寫時(shí)橫、豎都應(yīng)當(dāng)是“橫平豎直”的,且長(zhǎng)度上也一定,然而真正把點(diǎn)陣輸出出來發(fā)現(xiàn),橫、豎都很有可能為斜的,那么細(xì)化后,就會(huì)出圖 中的“打折” 現(xiàn)象,而且很多人手寫數(shù)字都有把數(shù)字寫的比較傾斜南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 系統(tǒng)分析 20 的習(xí)慣,比如數(shù)字“ 1”,本來應(yīng)當(dāng)是一個(gè)標(biāo)準(zhǔn)的豎直線,然而由于人們手寫的習(xí)慣,數(shù)字“ 1”就呈現(xiàn)一個(gè)斜直線的樣子(圖 ) 。 圖 數(shù)字“ 1” 圖 數(shù)字“ 2” 在輸出的點(diǎn)陣中我們看到,直正“橫平豎直” 的筆劃并不多,而我們也不想放棄這一重要特征,那么就需要對(duì)我們要提取的這兩種筆劃進(jìn)行一下規(guī)定 和近似。 1) 所有提取線段必須以端點(diǎn)為起點(diǎn); 2) 線段必須為連續(xù)滿足某一提取條件的點(diǎn)集,點(diǎn)集中點(diǎn)的個(gè)數(shù)不少于一設(shè)定值; 3) 線段具有方向性; 4) 對(duì)于起點(diǎn)、終點(diǎn)都為端點(diǎn)的線段不得重復(fù)計(jì)數(shù); 現(xiàn)對(duì)上述規(guī)則 做進(jìn)一步解釋: 1) 只所以規(guī)定所提取線段必須以端點(diǎn)為起點(diǎn)是由數(shù)字本身的特點(diǎn)所決定的,不以端點(diǎn)為起點(diǎn)卻滿足提取規(guī)則的連續(xù)點(diǎn)集往往是由于書寫的不規(guī)范引入的,例如 圖 中數(shù)字“ 2” 中間的“折”,本身近似于 圖 中數(shù)字“ 1” 的斜直線, 后者符合提取規(guī)則,為一個(gè)由上向下的豎,而前者并不是從端點(diǎn)進(jìn)入,是由于書寫不規(guī)范出現(xiàn)的,不應(yīng)當(dāng)被提取。 2) 由于所提取線段為近似的結(jié)果,所以必須規(guī)定嚴(yán)格的提取條件: 由端點(diǎn)開始進(jìn)行八鄰域生長(zhǎng),且始終沿一個(gè)方向生長(zhǎng),當(dāng)生長(zhǎng)條件不再滿足時(shí)結(jié)束生長(zhǎng),且生長(zhǎng)過程中不再回退到前面生長(zhǎng)過 的點(diǎn),如果本次生長(zhǎng)所搜索到的點(diǎn)數(shù)高于某一設(shè)定值,就認(rèn)為本次生長(zhǎng)有效,找到一個(gè)線段,由于點(diǎn)陣為 28 28 的,系統(tǒng)統(tǒng)一設(shè)定為 10。 3) 點(diǎn)集的生長(zhǎng)必須具有方向性且始終按同一方向生長(zhǎng),以免將弧 或環(huán)判定為所提取線段, 系南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 系統(tǒng)分析 21 統(tǒng)定義了四種方向: 由左向右的橫 ( 0) 由右向左的橫 ( 1) 由上向下的豎 ( 2) 由下向上的豎 ( 3) 圖 線段的方向示意圖 每次生長(zhǎng)從端點(diǎn)出發(fā)依次嘗試從方向 0 ~ 4 四種方向進(jìn)行生長(zhǎng),一種生長(zhǎng)方式生長(zhǎng)成功確定一線段則放棄對(duì)其它方向的嘗試,如果一種方向生長(zhǎng)失敗,才嘗試從下一方向進(jìn)行新的生長(zhǎng)嘗試。這樣從一端點(diǎn)出發(fā),最多確定一條線段。 對(duì)于每種方向都以 P0 為主方向,由于前述的“打折”情況的存在,可以有 一次選擇另一輔助方向的機(jī)會(huì),一旦選擇好輔助方向, P1 或 P2 則本次生長(zhǎng)就只能沿著 P0 或所選擇的輔助方向進(jìn)行,而不能再變動(dòng)輔助方向,這樣是為了避免把 “弧”做為線段提取出來,例如 數(shù)字“ 2”上邊的弧頂,如果在點(diǎn)陣?yán)锍尸F(xiàn)一種弧的形式,那么在本規(guī)則下是不會(huì)被提取為線段的,很多情況下由于書寫的原因,這些“弧”常以線段的方式出現(xiàn),那么也就被提取出來,這是合理的,符合手寫數(shù)字的自由性。 4)線段的重復(fù)計(jì)數(shù),如圖 數(shù)字“ 1”中有上下兩個(gè)端點(diǎn),上端點(diǎn)出發(fā)可生長(zhǎng)出由上向下的豎,而由下端點(diǎn)則可生長(zhǎng)出下往上的豎,顯然, 如果對(duì)樣本中線段數(shù)量進(jìn)行計(jì)數(shù),那么這兩個(gè)線段本應(yīng)是同一線段。所以為了避免這種重復(fù)計(jì)數(shù)的出現(xiàn)對(duì)端點(diǎn)標(biāo)識(shí)P0 P1 P2 P2 P0 P1 P0 P1 P2 P2 P0 P1 南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 系統(tǒng)分析 22 在提取線段過程中是否已被訪問過,如果該端點(diǎn)已經(jīng)在前面由其它端點(diǎn)發(fā)起的搜索過程中訪問過,那么不再以該端點(diǎn)發(fā)起新的提取過程,保證了線段數(shù)量這一特征的準(zhǔn)確性。 線段的提取過程如下: 由 端 點(diǎn) 進(jìn) 入沿 方 向 0 開 始生 長(zhǎng)主 方 向 數(shù) 據(jù) 點(diǎn)納 入 生 長(zhǎng) 點(diǎn) 集主 方 向 上有 數(shù) 據(jù) 點(diǎn)輔 助 方 向上 有 數(shù) 據(jù)點(diǎn)輔 助 方 向 上 數(shù)據(jù) 點(diǎn) 納 入 生 長(zhǎng)點(diǎn) 集確 定 輔 助 方 向生 長(zhǎng) 結(jié) 束是否是否統(tǒng) 計(jì) 生 長(zhǎng) 點(diǎn) 集中 的 點(diǎn) 數(shù)該 點(diǎn) 為 另一 端 點(diǎn)置 該 端 點(diǎn) 為 已訪 問是該 點(diǎn) 為 另一 端 點(diǎn)是點(diǎn) 數(shù) 大 于設(shè) 定 值依 次 沿 方 向1 ~ 3 重 復(fù) 方 向 0的 生 長(zhǎng) 過 程得 到 線 段 , 提取 線 段 相 關(guān) 信息點(diǎn) 數(shù) 大 于設(shè) 定 值是是否 圖 線段提取的 SDL 圖 通個(gè)上述過程,可以得到每個(gè)線段的相關(guān)信息:線段的起點(diǎn)、終點(diǎn)、點(diǎn)數(shù)、方向,保存下來以備識(shí)別之用 。 對(duì)線段的提取過程中,便得到了線段個(gè)數(shù)這一可統(tǒng)計(jì)特征: f12 線段個(gè)數(shù) 南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 系統(tǒng)分析 23 閉合區(qū)域 書寫一個(gè)數(shù)字的過程中,另外一個(gè)重要的特征是閉合環(huán),在系統(tǒng)中做為閉合區(qū)域處理。理論上數(shù)字“ 0”“ 4”“ 6”“ 9”分別有一個(gè)閉合區(qū)域,數(shù)字“ 8”有兩個(gè)閉合區(qū)域,而其它數(shù)字不應(yīng)當(dāng)出現(xiàn)閉合區(qū)域,而實(shí)際上,由于手寫的習(xí)慣,這種閉合區(qū)域的出現(xiàn)也就不再那么絕對(duì),然而這并不能阻止它成為數(shù)字識(shí)別中經(jīng)常被利用的特征,在本系統(tǒng)中,該特征被準(zhǔn)確提取,并在識(shí)別過程中起到很大作用。 由于手寫數(shù)字中出現(xiàn)的閉合區(qū)域,形狀上會(huì)有很大的區(qū)別,而 這種形狀上的區(qū)別完全是由于手寫的自由性引入的 。 在很多識(shí)別算法中都用到了閉合區(qū)域的形狀特性來區(qū)分不同的數(shù)字,比如圖 中的數(shù)字“ 0” 與數(shù)字“ 4”, 認(rèn)為數(shù)字“ 0”中的閉合區(qū)域更接近于圓,而數(shù)字“ 4”中的閉合區(qū)域則更接近于三角形,那么數(shù)字“ 0” 中閉合區(qū)域的離散度會(huì)大于數(shù)字“ 4”中閉合區(qū)域的離散度。這樣也不無(wú)道理,然而這只是理論上的猜想,實(shí)際的樣本中來看,樣本“ 4”由于書寫習(xí)慣,出現(xiàn)閉合區(qū)域的機(jī)率才 7%左右,而該閉合區(qū)域的書寫現(xiàn)狀也是因人而異,所以在本系統(tǒng)中 對(duì)于所有閉合的區(qū)域 同樣處理,而不再區(qū)別圓、橢圓、三角 形等不同現(xiàn)狀的閉合區(qū)域。 圖 閉合區(qū)域?qū)Ρ葓D 南京郵電大學(xué)碩士研究生學(xué)位論文 第三章 系統(tǒng)分析 24 圖 多余的閉合區(qū)域 另外在手寫過程中還有可能由于書寫不規(guī)則而出現(xiàn)多余的閉合區(qū)域,如圖 中的數(shù)字“ 2” 和數(shù)字“ 3”,都是因書寫習(xí)慣導(dǎo)致的,這些閉合區(qū)域的出現(xiàn)在很大程度上影響了特征提取的準(zhǔn)確度,由于后邊的識(shí)別階段也是很大程度上利用了該特征,那么就應(yīng)當(dāng)盡量去除這些多余的閉合區(qū)域,系統(tǒng)中規(guī)定,閉合區(qū)域所包含點(diǎn)的個(gè)數(shù)小于某一設(shè)定值時(shí)便認(rèn)定該 閉合區(qū)域?yàn)槎嘤嗟?,該值取得太小就不能保證去除所以多余區(qū)域,比如圖 中的數(shù)字“ 2”,
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1