freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

手寫數(shù)字特征提取與分析(已改無(wú)錯(cuò)字)

2023-07-24 08:26:36 本頁(yè)面
  

【正文】 符來(lái)說(shuō),比率特征并非總是大于 (3)字符有效高度 Hamx 定義為: Hmax=max(H(k)) [39] K 屬于[O,N1],H(k) 為第 k 列的字符高度。12 (4)寬高比定義為 W/H} 左右邊緣線的一階有限差分別為: LDif(k)=Lp(k)一 Lp(k1) [310] RDif(k)=Rp(k)一 Rp(k1) [311] 由此,定義了如下特征 字符輪廓線最大值和最小值所在的位置 Lmax={k|k=max(Lp(k)) } [312] Rmax={k|k=max(Rp(k)) } [313] Lmax={k|k=min(Lp(k)) } [314] Rmax={k|k =min(Rp(k)) } [315] 字符左右邊緣線的正負(fù)峰 Lpeak+=max{LDif(k)} [316] Rpeak+=max{RDif(k)} [317] Lpeak=min{LDif(k)} [318] Rpeak=min{RDif(k)} [319] Lpeak=|Lpeak+|+|Lpeak | [320] Rpeak=|Rpeak+|+|Rpeak | [321] 這樣共有 14 個(gè)特征,分別是字符有效寬度、字符比率、字符有效高度、字符高寬比、字符輪廓線左側(cè)最大值、字符輪廓線左側(cè)最小值、字符輪廓線右側(cè)最大值、字符輪廓線右側(cè)最小值、字符邊緣線左側(cè)正峰值、字符邊緣線左側(cè)負(fù)峰值、字符邊緣線右側(cè)正峰值、字符邊緣線右側(cè)負(fù)峰值、字符邊緣線左側(cè)正負(fù)峰值絕對(duì)值之和、字符邊緣線右側(cè)正負(fù)峰值絕對(duì)值之和 。]12[ 投影特征如圖 所示,將一個(gè)字符點(diǎn)陣劃分成四個(gè)象限區(qū)域,共有十二個(gè)邊線。將一個(gè)字符點(diǎn)陣中的每一個(gè)黑點(diǎn)向最近的四條邊線沿水平和垂直方向投影,用十二條邊線上的投影長(zhǎng)度作為投影特征,一共有十二個(gè)特征。13圖 投影特征 投影算法的基本描述如下: 對(duì)于字符點(diǎn)陣中的每一個(gè)點(diǎn),投影到離它最近的四條邊線上,具體投影方法如圖 所示, 圖 水平、豎直方向上的投影當(dāng)一點(diǎn)被投影到某一個(gè)邊線上時(shí),激活該邊線上的某一個(gè) bit 或者某些 bit,這些被激活的 bit取值為“1,其他沒(méi)有被激活的取值為“0 ,當(dāng)一個(gè)字符所有的點(diǎn)都投影完時(shí),計(jì)算某一個(gè)邊線上“1”的個(gè)數(shù),即為字符在這一個(gè)邊線上的投影數(shù)值。之所以選用投影特征作為手寫體數(shù)字識(shí)別的特征,一方面是因?yàn)橥队疤卣饔?jì)算簡(jiǎn)單,能夠反映字符的內(nèi)部結(jié)構(gòu)和筆劃的分布情況,唯一性,可區(qū)別性好,是比較有代表性的特征,不同14數(shù)字之間的 12 個(gè)投影特征的各個(gè)分量差異比較明顯,可以考慮作為分類的細(xì)特征。另一方面,神經(jīng)生理學(xué)認(rèn)為,在哺乳動(dòng)物視覺(jué)系統(tǒng)內(nèi)存在著類似的投影邊線,人們?cè)谶M(jìn)行識(shí)別時(shí)在不同的水平上引用到這些線索,因此引入字符的投影特征也是符合人腦的感知模型。 重心及重心矩特征 由于不同字符的筆劃不同,其象素點(diǎn)的分布不同,所以造成不同字符的重心位置不同,與其有關(guān)的一些離散量包含了字符幾何特征的信息。令 fIm。表示點(diǎn)陣中第 m 行,第 n 列象素。定義: [322]?????10n10n,mNMNmnff [323]????10n10n,NMNmnff 其中 m =1,2,... M1, n = 1,2,... N1.(m, n)就定義為整個(gè)字符的重心位置。定義重心矩如下: [324])(2)1(2)(, nLNjjnMiimji ????? 其中 i=1,2。 j=1,2.這樣可以得到四個(gè)重心矩特征:中的象素偏離重心位置的整體特征。L。j(i=1,2。 j=1,2),它們分別反映了四個(gè)象限本文中的重心及重心矩特征計(jì)算了點(diǎn)陣的重心位置,以及四個(gè)象限重心矩,共五個(gè)特征,包括一個(gè)二維特征,四個(gè)一維特征。 首個(gè)黑點(diǎn)位置特征按上文中定義的八個(gè)方向,沿逆時(shí)針?lè)较颍?0 度方向一45 度方向一90 度方向一135度方向一 180 度方向一 135 度方向一90 度方向一45 度方向,統(tǒng)計(jì)各個(gè)方向上由外至內(nèi)首個(gè)黑點(diǎn)出現(xiàn)的位置,共計(jì) 8 個(gè)二維特征。15 粗網(wǎng)格特征 粗網(wǎng)格特征是一組注重字符圖像整體的分布特征,此種特征對(duì)噪聲具有極強(qiáng)的抑制能能力。一般來(lái)說(shuō),雖然手寫數(shù)字的書寫風(fēng)格千變?nèi)f化,但是數(shù)字筆劃的分布是有一定的規(guī)律的。由于10 個(gè)字符的筆劃具有比較固定的總體分布狀況,從特征選擇的質(zhì)量來(lái)講,不同數(shù)字的特征向量在特征空間中的分布是比較分散的,即特征空間中不同類的類間距離是比較大的。本文進(jìn)行的粗網(wǎng)格特征提取,其提取方法的主要思想是,把數(shù)字點(diǎn)陣分成幾個(gè)局部小區(qū)域,并把每個(gè)小區(qū)域上的點(diǎn)陣密度作為描述特征,即統(tǒng)計(jì)每個(gè)小區(qū)域中圖像象素所占的百分比作為特征數(shù)據(jù)。針對(duì) 16X16 的點(diǎn)陣,我將之劃分成大小為 4X4 的小區(qū)域,共計(jì) 16 個(gè),因此,共得出一個(gè)十六維的粗網(wǎng)格特征。由于粗網(wǎng)格特征反映的是圖像的局部統(tǒng)計(jì)特征,是個(gè)百分比相對(duì)值,而圖像局部的形變或噪聲對(duì)應(yīng)數(shù)字點(diǎn)陣就是局部元素的“0”和“1的值互換,所以如果圖像帶有局部的形變或噪聲,與沒(méi)有形變和噪聲的原圖像相比,這個(gè)相對(duì)值對(duì)于數(shù)字圖片局部筆劃的形變或孤立噪聲點(diǎn)帶來(lái)的影響不敏感。因此,以粗網(wǎng)格為特征進(jìn)行數(shù)字識(shí)別。同時(shí),根據(jù)文獻(xiàn)的實(shí)驗(yàn)結(jié)果,以粗網(wǎng)格作為特征提取進(jìn)行數(shù)字識(shí)別,有很好的識(shí)別率 。]13[ 特征提取方法特征提取是整個(gè)字符識(shí)別系統(tǒng)的關(guān)鍵,識(shí)別算法是根據(jù)選取特征的種類來(lái)進(jìn)行選擇的所選取的特征是否穩(wěn)定,是否代表一類字符的特點(diǎn),是系統(tǒng)識(shí)別率的高低的關(guān)鍵。手寫體字符特征提取的方法可分為結(jié)構(gòu)特征和統(tǒng)計(jì)特征兩種。下面分別簡(jiǎn)述這兩種特征提取方法的特點(diǎn)與一般方法 。]14[ 結(jié)構(gòu)特征提取方法采用結(jié)構(gòu)特征提取對(duì)字符進(jìn)行結(jié)構(gòu)分析從而達(dá)到識(shí)別的目的,是一種非常直觀的方法,其思想與人認(rèn)字的原理有點(diǎn)相象,但又有所不同。其基本思想是:字符可以逐級(jí)分解成部件、筆劃乃至筆段,識(shí)別時(shí)可以自底向上,由象素得到筆段,由筆段結(jié)合成筆劃,由筆劃構(gòu)成部件,由部件組成字符,逐級(jí)分析字符圖象的結(jié)構(gòu),根據(jù)各元素的屬性、數(shù)量及其相互關(guān)系,便可以判定待識(shí)字符。目前研究較成熟,效果比較好的是基于筆劃和基于筆段分析的手寫體字符識(shí)別 。]15[16對(duì)不同的字符手寫樣本,盡管人書寫風(fēng)格千變?nèi)f化,然而,筆劃與筆劃之間的位置關(guān)系、以筆劃為基元的字符的整體拓?fù)浣Y(jié)構(gòu)是不變的,人認(rèn)字就是抓住了這些本質(zhì)不變的特征,因此能適應(yīng)不同的書寫風(fēng)格的文字。所以,基于筆劃來(lái)自動(dòng)識(shí)別字符一直是手寫體字符識(shí)別研究的一類主要研究方法.雖然字符的筆劃特征受字體、字形大小等影響較小,是識(shí)別字符的良好特征,但可惜筆劃特征對(duì)實(shí)際的書寫文本來(lái)說(shuō)較難穩(wěn)定的提取。通常,用基于筆劃段作為特征能較好的解決這一困難。采用結(jié)構(gòu)特征提取方法的難點(diǎn)在于筆劃或筆段等基元的準(zhǔn)確提取。雖然提取筆劃或筆段的方法己有多種研究,但它們都是基于圖象處理的方法,截然不同于人根據(jù)知識(shí)和經(jīng)驗(yàn)而作出的視覺(jué)處理。單純建立在圖象處理方法上的筆段機(jī)器分析只能十分機(jī)械地按圖象就事論事,結(jié)果提取到的筆段難免與人的判別不完全一致。這種情況在存在連筆、斷筆、模糊等的場(chǎng)合尤為不可避免。所以,書寫畸變對(duì)結(jié)構(gòu)特征分析法有十分重要的影響。因此,尋求穩(wěn)定可靠的筆段提取方法仍然是當(dāng)前有待進(jìn)一步研究的課題。 統(tǒng)計(jì)特征提取方法從統(tǒng)計(jì)模式識(shí)別的觀點(diǎn)來(lái)看,字符識(shí)別實(shí)際上是一個(gè)模式分類問(wèn)題,人對(duì)自然物體的識(shí)別,是建立在對(duì)該物體進(jìn)行學(xué)習(xí)、特征分析的基礎(chǔ)上的,計(jì)算機(jī)模式識(shí)別的過(guò)程與人的識(shí)別過(guò)程有著相識(shí)的地方。實(shí)際上就是一種通過(guò)學(xué)習(xí)或者其它方法,形成一個(gè)記憶知識(shí)庫(kù),進(jìn)行模式識(shí)別時(shí),清晰地表達(dá)出一種從物體到記憶知識(shí)庫(kù)的映像,從而得到識(shí)別結(jié)果。人在進(jìn)行物體識(shí)別時(shí),是利用大腦中通過(guò)學(xué)習(xí)形成的記憶庫(kù),對(duì)識(shí)別的物體進(jìn)行一種黑箱式的映像,從記憶庫(kù)中找出相匹配的類別。計(jì)算機(jī)要把人類識(shí)別物體時(shí)的這種黑箱式的映像表達(dá)出來(lái),一般是由兩個(gè)步驟來(lái)完成的:第一步,以適當(dāng)?shù)奶卣鱽?lái)描述物體,即由 xi→f(xi) 的映像。第二步,計(jì)算機(jī)執(zhí)行某種運(yùn)算完成由 f (xi)→c(x)=X 的映像。此過(guò)程實(shí)際上就是傳統(tǒng)的統(tǒng)計(jì)模式識(shí)別進(jìn)行物體識(shí)別時(shí)所采用的一般方法,具體來(lái)說(shuō)就是特征提取和分類函數(shù)的設(shè)計(jì)的問(wèn)題。而特征提取是問(wèn)題難點(diǎn)和的關(guān)鍵所在。因?yàn)槿绻卣骷褐?,就可以利用現(xiàn)有的數(shù)學(xué)理論來(lái)指導(dǎo)設(shè)計(jì)映像函數(shù) R(xi)。然而,對(duì)于特征的選擇和提取,卻沒(méi)有可遵循的理論來(lái)指導(dǎo),我們很難比較一個(gè)物體中哪些特征是實(shí)質(zhì)性,那些特征是有代表性的,那些特征可能是不重要的或與識(shí)別無(wú)關(guān)的,這需要大量的實(shí)驗(yàn)和理論指導(dǎo)。經(jīng)過(guò)人們?cè)谶@方面的大量研究工作,發(fā)展了一些統(tǒng)計(jì)特征提取方法,在本章后面部分,我們將討論幾種常用的特征提取方法,并提出了本文中使用的特征向量 。]16[17 手寫特征模式識(shí)別方法對(duì)數(shù)字識(shí)別特征提取有多種方法,本論文采用的方法是先提取數(shù)字的輪廓特征,然后對(duì)圖像進(jìn)行裁剪之后按黑像素占總像素的比率提取出的特征值。 輪廓特征主要是指周邊輪廓特征,即將數(shù)字字形加上外接矩形邊框,然后分別從上、下、左、右四個(gè)方向依次掃描數(shù)字點(diǎn)陣直至碰到第一個(gè)黑象素或?qū)γ娴倪吙驗(yàn)橹?,記錄下每次?9 描所經(jīng)過(guò)的白象素?cái)?shù),從而得到對(duì)應(yīng)數(shù)字的 4 維特征向量,稱為數(shù)字的周邊輪廓特征,此特征穩(wěn)定性較強(qiáng)、較易提取、維數(shù)較低、獨(dú)立性較強(qiáng)。 完成圖像進(jìn)行裁剪以后,把每個(gè)數(shù)字圖形定義成一個(gè) N*N(5*5)的模板,將每個(gè)樣品的長(zhǎng)度和寬度 N 等分,平均有 N*N 個(gè)等分,對(duì)每一等分進(jìn)行像素個(gè)數(shù)統(tǒng)計(jì),除以每一份的面積總數(shù)即得特征值。具體步驟如下: 1) 調(diào)入樣本圖片,找出圖片中數(shù)字的上、下、左、右邊界。對(duì)圖像進(jìn)行裁剪處理。 2) 將數(shù)字區(qū)域平均分成 5*5 的小區(qū)域。 3) 計(jì)算 5*5 的每個(gè)小區(qū)域中黑像素所占比例,第一行的 5 個(gè)比例值保存到特征的前 5 個(gè),第二行對(duì)應(yīng)著特征的 610,如此保存樣本的特征值。調(diào)入樣本圖像保持特征數(shù)據(jù)計(jì)算每個(gè)小區(qū)域中黑色素所占比例將處理好的圖片劃分成 5 * 5 的均勻小區(qū)域把裁剪出來(lái)的圖片規(guī)范成1 5 0 * 1 5 0 的標(biāo)準(zhǔn)圖片根據(jù)圖片輪廓裁剪圖片圖 特征提取過(guò)程本論文提取每個(gè)數(shù)字 25 個(gè)樣本的特征值之后,把它們保存在結(jié)構(gòu)體 Mytemplet 里,構(gòu)成了特征庫(kù)。 下面以 0 為例看一下求取特征值的方法,首先把圖像按邊緣裁剪放縮后,然后分成 5x5 的小區(qū)域( 如下所示),然后計(jì)算出每個(gè)小區(qū)域中黑像素所占的比例,存儲(chǔ)之后即為 0 的一個(gè)樣本特征值。 18圖 數(shù)字 0 的特征提取下面提取出來(lái)的就是上面數(shù)字 0 每個(gè)區(qū)域?qū)?yīng)的特征值:表 數(shù)字 0 的特征值 0 0 0 0 0 0 0 0 0 得到的特征值再通過(guò) Bayes 決策進(jìn)行計(jì)算,最終得到?jīng)Q策結(jié)果。194 Bayes 分類器在手寫特征中應(yīng)用 Bayes 分類器貝葉斯(Bayes)分類器的分類原理是通過(guò)某對(duì)象的先驗(yàn)概率,利用貝葉斯公式計(jì)算出其后驗(yàn)概率,即該對(duì)象屬于某一類的概率,選擇具有最大后驗(yàn)概率的類作為該對(duì)象所屬的類。也就是說(shuō),貝葉斯分類器是最小錯(cuò)誤率意義上的優(yōu)化。目前研究較多的貝葉斯分類器主要有四種,分別是:Naive Bayes 、TAN 、BAN 和 GBN。貝葉斯分類器是用于分類的貝葉斯網(wǎng)絡(luò)。該網(wǎng)絡(luò)中應(yīng)包含類結(jié)點(diǎn) C,其中 C 的取值來(lái)自于類集合( c1 , c2 , ... , cm),還包含一組結(jié)點(diǎn) X = ( X1 , X2 , ... , Xn),表示用于分類的特征。對(duì)于貝葉斯網(wǎng)絡(luò)分類器,若某一待分類的樣本 D,其分類特征值為 x = ( x1 , x2 , ... , x n) ,則樣本 D 屬于類別 ci 的概率 P( C = ci |
點(diǎn)擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1