freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的數(shù)字識別系統(tǒng)設(shè)計論文-在線瀏覽

2024-10-29 15:21本頁面
  

【正文】 E2(T)= dzzpT)(1?? (式 33) 總的誤差概率為: E( T) =P2*E1(T)+P1*E2(T) (式 34) 為了求得誤差最小的閾值可將 E(T)對 T 求導并令導數(shù)為零,這樣得到: P1p1(T)=P2p2(T) (式 35) 將這個結(jié)果用于高斯密度,并假設(shè)先驗概率相等,即 P1=P2,則: T=( A1+A2) /2 (式 36) 其中 A1,A2 為別是背景和目標區(qū)域的平均灰度值。 實驗結(jié)果及分析 經(jīng)索書號定位和分割處理后,用于驗證本二值化算法的性能。圖 36為實驗樣本中存在文字褪色和陰影的典型索書號圖像。由于本算法是基于筆畫模型檢測文字像素點的,因此,實驗分為 2部分:筆畫模型檢測文字像素點實驗和提出的二值化算法實驗。 圖 31 索書號二值化圖像 11 4 單個字符的切分 粘連字符切分的概述 OCR(OplicalCharacterRecognition)文字識別系統(tǒng)大多數(shù)是指對單個字符的識別。 錯誤的字符切分是無法得到正確的識別結(jié)果的。美國 Nevada大學的商業(yè)印刷體文字識別系統(tǒng)實驗表明,錯誤的字符切分是產(chǎn)生錯誤識別的主要原,而且隨著圖像質(zhì)量的下降,粘連現(xiàn)象趨于嚴重,將會導致誤切分率的急劇增加。因此,準確的切分路徑就能糾正字符變形,保證切分后字符識別有較高的正確率。 但是,從書架上的圖書側(cè)翼分割出的索書號字符圖像是彩色圖像或灰度圖像,字符識別之前需要二值化處理。這些因素的存在,使字符圖像在二值化處理時,不可避免地會將部分背景 I 區(qū)域錯誤地分為字符筆劃使得筆畫變寬或變長,致使字符筆劃發(fā)生變形而導致粘連,即字符粘連處也是筆劃變形程度相當嚴重的地方,即使準確切分也不一定能完全糾正字 符的筆畫變形。 因此,索書號粘連字符在準確切分后還必須糾正粘連處的筆劃 J 變形。 4. 3.索書號粘連字符的切分 為了提高切分速度,本節(jié)提出了采用上下輪廓凹凸特征近似檢測單個字符的寬度,在字符寬 度的約束下,根據(jù)輪廓凹凸特征,直接建立切分路徑。 4. 3. 1 字符串凹凸輪廓的定義及檢測 圖書館藏書的索書號文字圖像經(jīng)過文字提取分割后得到的字符串,經(jīng)閾值分割后大小為 M N的二值化圖像定義 1:從上而下逐列掃描圖像,由每列的第一個黑色像素點組成的輪廓曲線稱之為字符串上輪廓。如果所在列無字符,即無黑色像素點,則該列 ET(i)為 0。下輪廓用其像素點的坐標表示為: PB(i)=EB(i) i=1, 2, 3, 4.......M (式 42) 式中 Eb(i) 即自上而下掃描 i列圖像時遇到的第一個黑色像素點的 y 軸坐標。 12 根據(jù)上述定義檢測到的索書號字符的上下輪廓如圖所示。上輪廓的離散差分為, TDp(i)=Tp(i+1)Tp(i), i=1, 2, 3, 4.......M1 (式 43) 下 輪廓的離散差分為: BDp(i)=Bp(i+1)Bp(i), i=1, 2, 3, 4.......M1 (式 44) 如 果 TDp(j)0,TDp(j+k)0,若 k≥2,i∈ (j,j+k),TDp(i)=0,則在 [j, j+k】內(nèi)必然存在唯一的凹結(jié)構(gòu), 如果 BDp(j)0,BDp(j+k)0,若 k≥2,i∈ (j,j+k),BDp(i)=0,則在 [j, j+k】內(nèi)必然存在唯一的凸結(jié)構(gòu), 如圖 41 所示為二值化的索書號圖像的上輪廓和下輪廓曲線,在凹凸輪廓實際檢測時,由于字符圖像受噪聲影響,字符的部分筆劃邊緣不光滑,會檢測到一些僅有 1, 2 個象素深度或高度的假凹輪廓或假凸輪廓。 0 10 20 30 40 50 60 70 80 90 1000510152025303540上輪廓 0 10 20 30 40 50 60 70 80 90 100510152025303540下輪廓 圖 41( a) 字符串上輪廓曲線 圖 41( b) 字符串下輪廓曲線 4. 3. 2.字符高度和寬度的近似檢測 根據(jù)上輪廓和下輪廓的定義,可以檢測到各列字符高度 H(i): H(i)=ET(i) EB(i) (式 44) 取字符串的最大高度為字符的近似高度 Hw: Hw=max[H(i)] (式 45) 字符串圖像的上下輪廓曲線表明: (1)非粘連字符的間隔處存在鮮明的凹凸結(jié)構(gòu); (2)絕大部分粘連字符在間隔處也會同樣存在凹凸結(jié)構(gòu); (3)絕大部分水平筆劃粘連的字符至少也會存在凹結(jié)構(gòu)或凸結(jié)構(gòu)。設(shè) n 個凹結(jié)構(gòu)的位置集合為 {CT( 1), CT(2), ...CT(n)},凸結(jié)構(gòu)位置集合為 {CB(1), CB(2), ...CB(m)},則凹結(jié)構(gòu)和凸結(jié)構(gòu)的間距分別為 : DCT(i)=CT(i)CT(i1),i=2,3,.......,n (式 46) DCB(i)=CB(i)CB(i1),i=2,3,.......,m (式 47) 為了將第一個凹結(jié)構(gòu)和凸結(jié)構(gòu)的間距包括在內(nèi),定義第一個凹結(jié)構(gòu)和凸結(jié)構(gòu)的間距為: DCT(1)=CT(1)Lc (式 48) DCB(1)=CB(1)Lc (式 49) 其中 Lc 為字符串的 起始列。因此,字符高度的檢測比寬度檢測更加準確,一般來說印刷體的字符高度和寬度之間滿足如下關(guān)系; Gw= (式 411) 因此,如果當字符因干擾嚴重而無法準確檢測到字符寬度時,根據(jù)上述 (414)式關(guān)系,建立字符 寬度檢測的約束條件: ≤Gw≤ (式 412) 即當用凹凸結(jié)構(gòu)輪廓檢測的字符寬度不能滿足式 (411)的約束關(guān)系時,用式 (412)估計字符寬度。上下輪 廓的凹凸結(jié)構(gòu)位置作為可能的切分列,在如 在約束條件的作用下進行切分: 同一索書號的字符尺寸大小相同,則每個字符的寬度 Lw 應該在一定范圍內(nèi),即 : ≤Lw≤ (式 413) 在上述約束條件的作用下,切分算法如下所示。檢測上輪廓的凹結(jié)構(gòu),若第 i 個凹結(jié)構(gòu)的 Tp(CT(i))=0,則 i 凹結(jié)構(gòu)為非粘連字符的間隔,切分后所得的字符區(qū)域為 {Pl, P2.......Pn)。 .字符筆畫變形的修復 粘連字符的切分是對字符變形的糾正,但并不是正確的切分就能完全修復字符筆劃的變形。由于索書號字符串的字符筆劃寬度接近相等, 粘連筆劃切分后同樣應該滿足該條件 : Rw=min{SL/SR,SR/SL} (式 414) 若 Rw≤,若 Rw≤ ,則消除 筆劃寬度較小的筆劃。經(jīng)過筆劃修復后,字符‘ 3’可以回復筆劃形。首先驗證算法對字符寬度和高度估計的準確性。為此,采用 Wo+1 個像素的范圍來衡量字符寬度估計的準確性。 50 本書共有字符 377 個,若不考慮 1 和 J 等過窄字符,字符的真實寬度均在估計 范圍內(nèi)。在凹凸輪廓結(jié)構(gòu)分析選擇切分路徑時,容易在 M 和 N 的兩邊的豎直筆劃處發(fā) 生錯誤切分。 14 圖 42 字符‘ 4’ 圖 43 字符‘ 7’ 圖 44 字符‘ 3’ 15 5 字符識別 采用數(shù)字字符輪廓解構(gòu)特征和統(tǒng)計特征相結(jié)合的方法,并從中選出穩(wěn)定 的局部特征,理由結(jié)夠語句識別的方法進行數(shù)字的識別,能夠?qū)崿F(xiàn)不同字體索書號多種字體數(shù)字的準確識別,同事還提高了識別的速度。為了盡量減少這種變形對星系特征的干擾,或者從變形的字符中提取可靠的特征子女系,講字符的整體輪廓分解為底部,頂部,左側(cè)和右側(cè) 4 個方向的輪廓特征來描述,是的當其中某部位的筆畫發(fā)生變形是,不會改變或者減少對其他部位特征的影響。 LP(i)=min{ x/P(x,y),y=i} i=1,2.....M (式 51) 式中 P(x,y)表示圖像坐標為( x,y)的像素點,同理,右輪廓( RP(k),k=1,2...M) 定義為字符最右側(cè)邊界像素點的遂平方向坐標值。底部輪廓( BP( k),k=1,2.......N)定義為字符最低邊界像素點的垂直方向坐標值。左右兩側(cè)的輪廓,結(jié)構(gòu)基元按照從上到下的順序組合排列;頂部和底部輪廓的結(jié)構(gòu)基元,按照從左到右的順序組合排列。 ( 5) 突變 連續(xù)的字符輪廓,其一階微分值的變化量比較小,而當字符輪廓不連續(xù)時,其一階微分值相對比較大。 基元的檢測 根據(jù)上述定義,考慮實際 應用中存在的干擾,基元的檢測規(guī)則如下: (1)若 )(kPD =PT,則在 k處檢測到結(jié)構(gòu)突變 (P); 若 SLLT, SRRT,則檢測到結(jié)構(gòu)為豎直 (V); 若 SLLT, SRRT.則檢測到結(jié)構(gòu)為左斜 (L); 若 SLLT, SRRT,則檢測到結(jié)構(gòu)為右斜 (R); 若 SLLT, SRRT,則檢測到結(jié)構(gòu)為圓弧 (c)。即若 kl處檢測到 P,則在【 1, k1— 1】的字符輪廓范圍內(nèi)統(tǒng)計 SL, SV和 SR獨立進行結(jié)構(gòu)基元檢測。 (3)由于字符輪廓基元的形成需要一定數(shù)( T)輪廓像素點,即只有當 SL+SV+SR=ST 時,才能進行基元檢測,否則不進行基元檢測。一般取 ST=4。這主要是因為在其他范圍內(nèi)出現(xiàn)的結(jié)構(gòu) P多為干擾所致,結(jié)構(gòu) P截成的輪 廓曲線過短,不能判定其結(jié)構(gòu)。頂部輪廓上, Ts(i)表示頂部輪廓結(jié)構(gòu)基元的向量組的第 i個結(jié)構(gòu)基元, Tn表示頂部輪廓共有的基元數(shù)目;左側(cè)輪廓上, LS(i)表示左側(cè)輪廓結(jié)構(gòu)基元的向量組的第 i個結(jié)構(gòu)基元, Ln表示左側(cè)輪廓共有的基元數(shù)目;右側(cè)輪廓上, RS(i)表示右側(cè)輪廓結(jié)構(gòu)基元的向量組的第 i個結(jié)構(gòu)基元, Rn表示右側(cè)輪廓共有的基元數(shù)目。 ( 1)水平方向的最大字符寬度 Wmax; Wmax =max{RP(k)LP(k)} 該特征主要用語識別數(shù)字 1。 ( 2) 垂直方向的筆劃數(shù) 該特征主要用于所示別數(shù)字 0 和 8。 8 在垂直方向的最大筆畫數(shù)也可能位。假設(shè) J列上的像素點 P(j,i1),檢測到垂直方向的筆畫書為 1,在 P(j,i1)檢測到了第二個筆 畫,則 S2=i,表示檢測到第二個筆畫的像素點位置。 17 數(shù)字字符的識別算法 講數(shù)字字符的頂部,左右兩側(cè)的局部輪廓解構(gòu)特征和輪廓統(tǒng)計特征結(jié)合成特征向量,用以描述 10個數(shù)字。由于底部特征丟失,會改變左右兩側(cè)的部分結(jié)構(gòu)特征,但
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1