freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的數(shù)字識別系統(tǒng)設(shè)計論文-展示頁

2025-06-27 17:13本頁面
  

【正文】 結(jié)果證明,該方法具有定位精度高,準(zhǔn)確率高,抗噪能力強(qiáng),并在“索書號自動識別系統(tǒng)”中取得理想效果。 本課題利用基于邊緣點數(shù)量統(tǒng)計的文字圖像分割方法。紅色條形框還包含有其他文字,紅色條形框以及裝飾景物等,為了能夠正確識別該書的索書號,首先必須從圖像中正確分割出索書號圖像。 第四階段:索書號單字識別。而粘連索書號切分存在的主要問題是(1)粘連字符的切分比較困難:(2)索書號字符發(fā)生粘連有一部分是字符的筆畫發(fā)生變形所致,如筆劃寬度變粗等。非粘連單字切分比價容易解決。因此,單字切分往往與字符識別緊密結(jié)合在一起。 第三階段:索書號字符切分是將索書號字符串切分成一個個字符,以提供給識別算法進(jìn)行識別。(3)污跡的影響。索書號提取主要存在的問題:(1)不均勻光照增大了索書號圖像的灰度值變化范圍。但由于定位得到的圖像區(qū)域略大于真實索書號區(qū)域,二值化后在索書號字符附近可能會存在一些非字符目標(biāo),影響后續(xù)的單字切分和識別。 第二階段:索書號提取是在定位得到的索書號區(qū)域中,將索書號字符與周圍目標(biāo)和背景相互分離。索書號定位主要存在兩個問題:(1)受不均勻光照和褪色的影響,索書號的紋理特征、顏色特征以及形狀特征等有較大的變化,可靠性相對較差;(2)有的索書號由1個字符串組成,有的索陸號由2個字符串組成,而在索書號的周圍附近還會存在其他文字,如出版社名稱和作者姓名。由于該階段是解決索書號的區(qū)域查找問題,而沒有涉及單字切分,因此圖像區(qū)域的估計允許有一定誤差。為了能夠解決上述問題,索書號圖像識別主要由以下4個模塊組成:索書號定位,索書號提取,索書號字符切分和索書號單字識別。本論文選取圖書館的主要類別圖書——印刷體索書號,從圖書館的書架上隨即抽取樣本進(jìn)行研究。圖像處理技術(shù)是索書號識別的核心技術(shù),而與相類似的應(yīng)用相比,索書號圖像處理與識別又有其自身顯著的特點和難點。按照上述流程,具體介紹索書號識別的整個過程。由于噪聲和五點的干擾,以及光照不均勻的影響,二值化后的文字會發(fā)生粘連,嚴(yán)重改變文字的自營。如圖11所示 CCD攝像 索書號文字圖像分割 文字圖像二值化 單個字符切分 索書號識別 圖書排放位置判斷CCD攝像機(jī)拍攝排放在書架上的圖書圖像,圖書的圖像出索書號外還有其他內(nèi)容,如出版社的標(biāo)志,其他文字甚至大塊的污漬等,必須從中分割出僅包含索書號的文字圖像。因此,借助其經(jīng)驗,本文研究采用圖像處理和識別技術(shù)實現(xiàn)索書號的自動識別。確保電子數(shù)據(jù)庫中的圖書狀態(tài)與書庫中的一致,以及書庫中的圖書準(zhǔn)確排放,從而有效解決上述“用索書號找不到圖書”的問題。但是,由丁館藏圖書多達(dá)上萬,甚至幾十萬,而且每天又都有大量圖書的借出和還入,人工檢查工作量很大,單調(diào)、重復(fù)的工作容易使工作員疲勞,檢查速度比較慢,無法滿足實際的需要。這一方面嚴(yán)重降低了圖書館的資源的利用率;另一方面,浪費了讀者的時間,造成了很大麻煩。(2)圖書已經(jīng)丟失,即雖然電子數(shù)據(jù)庫中顯示圖書狀態(tài)為“歸還”,但實質(zhì)圖書已經(jīng)丟失,并不在書庫中。但是,經(jīng)常會遇到下列問題:電子數(shù)據(jù)庫系統(tǒng)顯示圖書狀態(tài)為“歸還”,利用檢索到號,卻無法在書庫找到此書。讀者借圖書的流程如圖2所示,一般利用書目查詢系統(tǒng),根據(jù)圖書的書名,出版社,作者以及書的內(nèi)容等在電子數(shù)據(jù)庫中檢索自己需要的圖書,記錄圖書相關(guān)信息。最后按照字母表和數(shù)字大小的順序排列。有的圖書館如清華大學(xué)還在圖書分類號碼后添加按照圖書作者姓名所編排的著者號碼,或者是按照圖書進(jìn)館時間的先后所取用的順序號碼。字母之后再用阿拉伯?dāng)?shù)字對大類進(jìn)行細(xì)分。根據(jù)圖書的學(xué)科主題,以拉丁字母標(biāo)記并順序展列出22個基本大類,其中沒有L、M和Y開頭的——參考附錄1中圖法簡表。索書號通常是根據(jù)中國圖書資料分類法編排的【1】——簡稱《中圖法》。基于matlab的數(shù)字識別系統(tǒng)設(shè)計論文 索書號是圖書館賦予每一種館藏圖書的號碼,這種號碼具有一定結(jié)構(gòu)并帶有特定的意義。在館藏系中,每種書的索書號是唯一的,可準(zhǔn)確地確定館藏圖書在書架上的排列位置,它是讀者查找圖書必要的代碼信息?!吨袌D法》采拉丁字母和阿拉伯?dāng)?shù)字相結(jié)合的混合標(biāo)記符號。由于“T工業(yè)技術(shù)”的大類范圍廣泛、內(nèi)容繁多,故又在該類基礎(chǔ)上采用雙位拉丁字母標(biāo)記出16個二級類目,如TK、TL、TM和TN等。如B表示哲學(xué)、宗教一大類;B020則表示宗教理論。 不同索書號確定排列先后順序的步驟是,先比較分類號碼:如分類號碼相同再比較著者號碼或順序號碼。 隨著電子計算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,現(xiàn)代圖書館都已經(jīng)廣泛建立電子數(shù)據(jù)庫圖書管理系統(tǒng),方便用戶查找、閱覽書籍。最后,根據(jù)圖書的索書號,快速方便地在書庫中找到相應(yīng)的圖書。出現(xiàn)這種情況主要有兩個原因:(1)圖書錯位放置,即圖書在書庫中擺放的位置與索書號不一致。隨著圖書館藏書數(shù)目的不斷增加,每天借閱的人數(shù)增多,而且有的圖書館發(fā)展成擁有幾個分館,上述問題越來越嚴(yán)重。 目前,圖書館主要通過定期的人工檢查發(fā)現(xiàn)書庫中錯位和丟失的圖書。因此,迫切希望開發(fā)索書號自動識別系統(tǒng),實現(xiàn)對書庫中圖書放置位置的自動檢查,并通過索書號識別結(jié)果與電子數(shù)據(jù)庫中圖書信息的比較,找出已經(jīng)丟失的圖書。.索書號自動識別系統(tǒng) 近年來,隨著電子計算機(jī)技術(shù)、圖像處理技術(shù)和攝像技術(shù)的迅速發(fā)展,圖像中的文字信息提取系統(tǒng)已經(jīng)成功地應(yīng)用于各個領(lǐng)域。系統(tǒng)的硬件由彩色CCD攝像頭,8位圖像采集卡和計算機(jī)組成,拍攝的圖像為8位RGB彩色數(shù)字圖像?;叶鹊奈淖謭D像難以直接用于識別,所以講灰度的文字圖像裝換為二值圖像。字符切分成單個字符后才進(jìn)行文字識別。 索書號識別存在的問題及關(guān)鍵技術(shù) 索書號識別所涉及的攝像技術(shù),無線通訊技術(shù),電子數(shù)據(jù)庫圖書管理技術(shù),AGV自動導(dǎo)引技術(shù)和圖像處理技術(shù)都已經(jīng)在其他領(lǐng)域有成功應(yīng)用的實例。 圖書館收集了近幾十年的藏書,不同時代的索書號編寫風(fēng)格大不相同。如圖7所示,CCD攝像頭拍攝的索書號圖像,由于光照不均勻、退色、污跡、噪聲以及其他非索書號文字的存在,大大增加了索書號識別的困難。 第一階段:索書號定位是在圖像中找到包含索書號的圖像區(qū)域,要求該區(qū)域盡可能包含完整的索書號,同時盡量排除非索書號的圖像區(qū)域。為了包含完整的索書號以及避免索書號漏檢,往往是定位得到的圖像區(qū)域略大于索書號的真實區(qū)域。因此,將索書號與其他文字相區(qū)別比較困難。通過二值化處理,能將字符與背最相互分離。所以,二值化后采用連通域濾波進(jìn)一步消除索書號周圍的非字符目標(biāo)。(2)褪色程度的不同則降低了字符與背景的對比度。上述因素的存在不僅使得確定二值化過程中合理的閾值非常困難,而且會改變索書號字符的形狀特征,最終影響連通域濾波的性能。單字切分的結(jié)果如何將直接影響識別結(jié)果,而且切分好壞除字符能否正確識別之外,沒有較好的判別依據(jù)。索書號的單字切分可以分為兩種情況:非粘連單字切分和粘連字符的單字切分。但質(zhì)量較差索書號圖像二值化處理后,相鄰字符可能會發(fā)生粘連。即使正確的切分也不一定能夠完全修正筆畫的變形,即無法通過粘連切分恢復(fù)字符的原形。印刷體單字識別的研究已經(jīng)相當(dāng)成熟,只是與其他應(yīng)用領(lǐng)域的文字識別相比,索書號文字的質(zhì)量較差,存在字符不均勻褪色,筆劃殘缺以及大面積污跡等問題, 2索書號文字圖像分割 復(fù)雜背景圖像中的文字定位和分割是從圖像中獲取文字信息的關(guān)鍵步驟,直接影響到后續(xù)文字識別的準(zhǔn)確性,它在機(jī)器人視覺.汽車牌照自動識別,計算機(jī)文本自動輸入,郵件地址自動識別,集裝箱編號自動識別以及視頻圖像內(nèi)容的檢索等系統(tǒng)中都有廣泛的應(yīng)用。 圖21 圖書索書號圖像但是,從圖像尤其場景圖像中自動定位和分割文字是比較困難的,其主要原因有以下幾個方面:第一,文字嵌入在圖像中,并與其它圖形共存,如邊框,商標(biāo),裝飾物以及污點等;第二,由于文字顏色退化,文字顏色不均勻,熱切背景顏色有食欲吻脖子顏色差異很?。坏谌?,文字尺寸大小變化;第四,關(guān)照條件無法控制,廣州不均勻;第五,索書號文字與其他文字。根據(jù)圖書館索書號的制定規(guī)則,索書號文字圖像具有如下特征:第一,索書號文字采用黑色應(yīng)刷;第二,索書號文字的數(shù)量至少為3個;第三,索書號字符水平排列;第四,索書號貼在書脊的下半部分。 HSI彩色空間轉(zhuǎn)換 索書號邊緣點彩色分割 Canny算子檢測 文字圖像行區(qū)域檢測 文字圖像列區(qū)域檢測 邊界調(diào)整 圖22 索書號圖像分割算法流程 HSI彩色空間轉(zhuǎn)換 攝像頭拍攝的彩色圖片的像素點通常是采用24位RGB表示。比較接近人堆顏色視覺感知的是色度,飽和度和亮度空間。 本算法中,只對邊緣點進(jìn)行財社分割,切自用S分量。轉(zhuǎn)換關(guān)系如下: I=(R+G+B)/3 (21) S=13/(R+G+B)*[min(R,G,B)] (22) 圖22 HSI彩色空間的I分量圖 Canny算子檢測Canny算子邊緣檢測先計算X和Y方向的梯度平方和,局部最大的梯度幅值局部變化最大的點的過程叫非極大值抑制。為此,Canny像影帝定義了3給準(zhǔn)函數(shù)衣表達(dá)上述指標(biāo)的約束:a,信噪比函數(shù)準(zhǔn)則;b,定位精度準(zhǔn)這函數(shù);c,單邊緣響應(yīng)準(zhǔn)這函數(shù)。 Canny算子中有3個參數(shù),σ是高斯函數(shù)聞不得參數(shù),他控制平滑程度:高閾值(TG)和低閾值(TL)。這樣在Canny算子中只保留了一個參數(shù)高閾值(TG)。由于文字和背景具有較強(qiáng)的對比度,TG取值有一個較大的范圍,實驗中TG=。 圖23 Canny算子檢測的邊緣 文字圖像有一些獨特的特征,文字圖像的解構(gòu)比較復(fù)雜,邊緣像素點比較多,切分布比較集中。Canny算子檢測等到的邊緣點在HSI彩色空間S分量上精心索書號文字邊緣點的分割。實驗中,去S1=0,S2=。 圖25 分割出的索書號圖像由于文字圖像中解構(gòu)相對比較復(fù)雜,其邊緣點數(shù)量也就比較多,分布比較集中。雖然文字圖像區(qū)域中也存在者字符見得間隔,必能完全保證每一行的邊緣點數(shù)量都比非文字區(qū)域的行邊緣點數(shù)量多。邊緣點數(shù)量統(tǒng)計如圖26所示。受文字圖形自身結(jié)構(gòu)繁簡程度不同的影響,以及索書號可能有多行字符串組成,而兩行字符串之間可能存在間隔,使的圖像文字區(qū)域中的某些行的邊緣點數(shù)量低于平均值,設(shè)置行方向的間隔閾值Ty=≤Ty,這經(jīng)性合并,否則視為兩個獨立的文字圖像區(qū)域?,F(xiàn)在其中包含可能文字圖像行最多的區(qū)域為索書號文字圖像。同理: Nx0(word)Nx0 (nonword) (26) 式中, Nx0(word)為文字圖像區(qū)域的列平均邊緣點個數(shù),Nx0(nonword) 為非文字圖像區(qū)域的列平均邊緣點個數(shù)。邊緣點數(shù)量統(tǒng)計如圖27所示。受文字圖形自身結(jié)構(gòu)繁簡程度不同的影響,以及索書號可能有多列字符串組成,而兩列字符串之間可能存在間隔,使的圖像文字區(qū)域中的某些列的邊緣點數(shù)量低于平均值,設(shè)置行方向的間隔閾值Tx=≤Tx,這經(jīng)性合并,否則視為兩個獨立的文字圖像區(qū)域?,F(xiàn)在其中包含可能文字圖像行最多的區(qū)域為索書號文字圖像。因此,必須調(diào)整文字圖像的邊界。同理在列方向進(jìn)行邊界調(diào)整。如圖21所示的索書號分割出的索書號圖像如圖28所示。因此,灰度文字圖像的二值化處理是文字識別系統(tǒng)中的關(guān)鍵步驟,其結(jié)果直接影響后續(xù)的圖像處理,包括字符切分、特征提取和字符識別等。設(shè)t為閾值,B=(0,1),是一對二值灰度,其二值化過程為: f(x,y)= f(x,y)≤t 由此可見,確定合理的閾值是灰度圖像二值化的關(guān)鍵。所確定的閾值作用與政府圖像的每個相熟,嬰兒對木表和背景的灰度有梯度變化的圖像效果較差或失效。許多常用的閾值選取反復(fù)發(fā)就是更具直方圖來進(jìn)行。谷的選取有很多方法,下面主要介紹最優(yōu)閾值法。實際中長希望能盡可能減少誤分割(包括吧目標(biāo)分成背景和把背景分成目標(biāo)兩類)的概率,而選取最有閾值是一種常用的方法。圖像的直方圖可看成像素灰度值的概率分布廣函數(shù)的一個近似,設(shè)疑富圖像僅包含兩類主要的灰度值區(qū)域(目標(biāo)和背景),那其直方圖所代表的像素灰度值概率分布密度函數(shù)實際上是對應(yīng)目標(biāo)和背景的兩個蛋羹分布密度函數(shù)紙盒。設(shè)有這樣一副混有加性高斯噪聲的圖像,背景和噪聲的概率密度分別是P1(z)和P2(z),政府圖像的混合概率密度: P(z)=P1*p1(z)+P2*p2(z) (式31)P1和p2分別是背景和目標(biāo)區(qū)域灰度值
點擊復(fù)制文檔內(nèi)容
電大資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1