freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文-免費(fèi)閱讀

  

【正文】 正是由于趙老師細(xì)心認(rèn)真的指導(dǎo),及時(shí)地糾正總體設(shè)計(jì)方案及論文方面的錯(cuò)誤,讓我能夠鍥而不舍的堅(jiān)持下去, 我才能很好地完成了設(shè)計(jì)。 (2)需要進(jìn)一步開(kāi)拓彩色圖像和背景復(fù)雜圖像中的文字提取的應(yīng)用領(lǐng)域,應(yīng)用需求的缺乏導(dǎo)致這方面研究工作開(kāi)展的難度。傳統(tǒng)的彩色圖像邊緣檢測(cè)算子是將灰度圖像邊緣檢測(cè)算子分別作用于顏色空間各個(gè)分量上,忽視了彩色分量間的關(guān)聯(lián)關(guān)系,往往會(huì)出現(xiàn)多邊緣和寬邊緣情況,不能充分體現(xiàn)顏色的距離,造成復(fù)雜圖像的分割困難。 若不滿足的話對(duì)行計(jì)數(shù)器進(jìn)行清0 處理, 直到重新得到滿足條件的行。在經(jīng)過(guò)邊緣檢測(cè)算子處理過(guò)的圖像中采用逐行逐像素點(diǎn)相比較判斷跳躍點(diǎn)次數(shù)的方法來(lái)尋找車牌的上下邊界, 這里的跳躍點(diǎn)是指相鄰兩像素之間灰度值之差在一定閾值之上的點(diǎn)。根據(jù)文本圖像的直方圖或灰度空間分布確定一個(gè)閾值,以此實(shí)現(xiàn)灰度文本圖像到二值圖像的轉(zhuǎn)化。[Ye04]中,Ye等在HSI顏色空間中使用GMM表示文字顏色的H, I兩分量的分布,首先利用文字的“邊緣對(duì)”特性通過(guò)采樣得到一部分屬于文字的像素,然后使用這些樣本在線估計(jì)GMM的參數(shù)并根據(jù)GMM提取剩余的文字像素[26]。 近年來(lái),研究人員在文字分割方面做了大量有意義的工作,提出了很多方法,這些方法大致可分成以下三類[23]: a 基于顏色閾值的方法。設(shè)原灰度圖像為f(x,y),二值化后的圖像為g(x,y),二值化的過(guò)程表示如下: ()二值化,基于實(shí)時(shí)性的要求,我力求尋找一種快速而且效果較好的方法,能夠更有針對(duì)性的解決在不同條件下牌照?qǐng)D像的二值化問(wèn)題。圖像二值化是指整幅圖像畫(huà)面內(nèi)僅黑、白二值的圖像。開(kāi)運(yùn)算通常用來(lái)消除小對(duì)象物、在纖細(xì)點(diǎn)處分離物體、平滑較大物體的邊界的同時(shí)并不明顯改變其面積。符號(hào)“+”代表該結(jié)構(gòu)元素的原點(diǎn),本例中,原點(diǎn)位于結(jié)構(gòu)元素之內(nèi)。a. 腐蝕(Erosion)腐蝕是在結(jié)構(gòu)元素的約束下,消除物體的部分邊界點(diǎn)的一種過(guò)程。為了使二值化取得良好的效果,首先對(duì)邊緣圖像進(jìn)行形態(tài)學(xué)填充,彌合孔洞去除噪聲,再進(jìn)行自適應(yīng)的閾值分割獲取二值圖像。若某個(gè)像素的灰度值與其梯度方向上前后兩個(gè)像素的灰度值相比不是最大的,那么將這個(gè)像素值置為0,即不是邊緣。2. 梯度取兩次閾值。算法如下:1. 用 33 高斯濾波器來(lái)對(duì)圖像濾波,以取出圖像中的噪聲。從以下的3個(gè)標(biāo)準(zhǔn)意義來(lái)說(shuō),Canny邊緣檢測(cè)算子對(duì)白噪聲影響的階躍型邊緣是最優(yōu)。由于平滑會(huì)導(dǎo)致邊緣的延展,因此邊緣檢測(cè)器只考慮那些具有局部梯度最大值的點(diǎn)為邊緣點(diǎn),這一點(diǎn)可以用二階倒數(shù)零交叉點(diǎn)來(lái)實(shí)現(xiàn)。 ()梯度的大小和方向是由: () ()因此最簡(jiǎn)單的邊緣檢測(cè)算子是用圖像的垂直和水平差分來(lái)逼近梯度算子: ()因此當(dāng)我想尋找邊緣的時(shí)候,最簡(jiǎn)單的方法是對(duì)每一個(gè)像素計(jì)算出的向量,然后求出他的絕對(duì)值,然后進(jìn)行閥值操作就可以了。用這個(gè)最大值作為算子的輸出值MIA,這樣可將邊緣像素檢測(cè)出來(lái)[13]。由于常量c的不同,這一算子與Sobel算子不同的地方在于沒(méi)有把重點(diǎn)放在接近模板中心的像素點(diǎn)。最簡(jiǎn)單的邊緣檢測(cè)判斷依據(jù)是梯度幅值。僅僅依靠單一文本特征的圖像分割方法不適于復(fù)雜彩色圖像文本的提取,必須要在初步提取的基礎(chǔ)上,考慮更多的文本特征,對(duì)候選文本區(qū)域進(jìn)行篩選。 經(jīng)過(guò)上述方法分割出來(lái)的文本區(qū)域圖像中存在目標(biāo)文本、背景還有噪聲,要想從圖像中直接提取目標(biāo)物體,最常用的方法就是設(shè)定一個(gè)閾值T,用T將圖像的數(shù)據(jù)分成兩部分:大于T的像素群和小于T的像素群,即對(duì)圖像的二值化。變換函數(shù)應(yīng)該滿足下列條件:① 在區(qū)間內(nèi),是單值單調(diào)增加; ② 對(duì)于,有這里第一個(gè)條件保證了圖像的灰度級(jí)西歐哪個(gè)白到黑的次序不變和反變換函數(shù)的存在。本文應(yīng)用中值濾波對(duì)圖像進(jìn)行降噪,所以根據(jù)中值濾波原理可知,通過(guò)數(shù)據(jù)排序的方法,將圖像中未被噪聲污染的點(diǎn)代替噪聲點(diǎn)的值的概率比較大,因此噪聲的抑制效果很好,同時(shí)畫(huà)面的輪廓依然比較清晰。因此,對(duì)圖像進(jìn)行去噪對(duì)圖像文本的提取很是重要。 ()其中考慮了整數(shù)除法的四舍五入。想要精確的提取出文本區(qū)域,必須綜合考慮文本的各種特征,在初步提取的基礎(chǔ)上利用各種限制性條件,濾除非文本區(qū)域,得到目標(biāo)文本。根據(jù)圖片底色等有關(guān)的先驗(yàn)知識(shí),采用彩色像素點(diǎn)統(tǒng)計(jì)的方法分割出合理的文本區(qū)域,確定圖片底色RGB對(duì)應(yīng)的各自灰度范圍,然后行方向統(tǒng)計(jì)在此顏色范圍內(nèi)的像素點(diǎn)數(shù)量,設(shè)定合理的閾值,確定車牌在行方向的合理區(qū)域。該方法包括文字區(qū)域的粗定位和細(xì)定位兩個(gè)步驟。通常文字在字體、大小、顏色、對(duì)齊方式和排列方向上常常有很大的變化,文字背景復(fù)雜,圖像分辨率低,圖像噪聲高,而且很多系統(tǒng)在應(yīng)用上還要求算法有較高的處理速度,這些都使得從圖像中有效地提取出文字變得異常困難。字符識(shí)別圖像采集字符分割文字定位圖像預(yù)處理 彩色圖像文本提取 文本信息提取流程包含了文字定位、文字分割和光學(xué)字符識(shí)別(OCR)三個(gè)串聯(lián)的階段。其主要的難點(diǎn)在于:文本存在于復(fù)雜背景之中難以區(qū)分;文本存在嚴(yán)重的形變和幾何畸變;自然環(huán)境下由于照度的不均勻、陰影、反射等原因等造成的文本圖像的亮度變化。結(jié)合數(shù)學(xué)形態(tài)學(xué)中各種運(yùn)算做了文本細(xì)定位。若能準(zhǔn)確的將這些文字信息定位出來(lái),并進(jìn)行處理,使之能夠被傳統(tǒng)的OCR軟件識(shí)別并被轉(zhuǎn)化成為機(jī)器內(nèi)碼,結(jié)合自然語(yǔ)言處理,文本檢索,文本翻譯,語(yǔ)音合成等技術(shù)可以被應(yīng)用到各種應(yīng)用領(lǐng)域。黃曉東等[15]綜合應(yīng)用小波變換和顏色聚類技術(shù)來(lái)提取視頻幀中的字幕區(qū)域。王辰等[6]等通過(guò)灰度邊緣檢測(cè)來(lái)定位文本區(qū)域。該算法要對(duì)每一個(gè)視頻幀進(jìn)行分裂合并算法,而且視頻中生成的連通元絕大部分都不會(huì)是文本,因此算法復(fù)雜度太高,系統(tǒng)效率低。因此從自然場(chǎng)景圖像中提取文本是一項(xiàng)極具挑戰(zhàn)性的工作。由于其廣泛的應(yīng)用領(lǐng)域越來(lái)越受到人們的重視。最近幾年以來(lái)隨著既有拍照功能的便攜式電子設(shè)備,比如智能手機(jī),平板電腦等,隨著技術(shù)的不斷更新升級(jí),人們急需一種方便的應(yīng)用程序來(lái)提取處理圖像中內(nèi)嵌的文本信息。如果這些文字信息能自動(dòng)準(zhǔn)確的被檢測(cè)、分割、識(shí)別出來(lái),則對(duì)圖像高層語(yǔ)義的自動(dòng)理解、索引和檢索是非常有價(jià)值的。首先對(duì)視頻幀使用分裂—合并算法,將視頻幀分解成顏色一致的連通元(connected ponent)。該算法是基于單個(gè)視頻幀圖像的字幕提取,效果并不明顯。該算法的優(yōu)點(diǎn)是可以檢測(cè)出各種字體大小的文本行。處理圖像的時(shí)間較長(zhǎng)。第三章文本預(yù)處理,主要介紹了對(duì)文本的灰度化,直方均衡,和圖像降噪等等,使提取出來(lái)的圖像對(duì)后面的文本細(xì)定位做了準(zhǔn)備。目前存在的很多圖像文本提取技術(shù)有很強(qiáng)的針對(duì)性,對(duì)于不同的文本特征。在本文將文本的定位、定位與提取、作為文本區(qū)域提取整體來(lái)討論,包含預(yù)處理、特征提取、分類(定位)、生成候選區(qū)域、文本區(qū)域提取幾個(gè)步驟來(lái)解決文本區(qū)域的準(zhǔn)確提取問(wèn)題。首先要對(duì)采集到的圖像進(jìn)行預(yù)處理,而文本定位又決定其后的文本字符識(shí)別,因此文本域定位是關(guān)鍵,文本區(qū)域定位就是從包含整個(gè)圖像中找到文本所在區(qū)域的位置。(2) 基于邊緣檢測(cè)的定位方法,這種方法是利用文本區(qū)域豐富的邊緣特征進(jìn)行文字定位[11],能夠進(jìn)行檢測(cè)的方法有多種,如Roberts 邊緣算子、Prewitt 算子、Sobel 算子以及拉普拉斯邊緣檢測(cè);(3) 基于顏色特征的定位方法,這種方法主要是應(yīng)用圖像的紋理特征、形狀特征和顏色特征即利用字符和底色具有明顯的反差特征來(lái)排除干擾進(jìn)行文字的定位;(4) 基于數(shù)學(xué)形態(tài)學(xué)的定位方法,這種方法是利用數(shù)學(xué)形態(tài)學(xué)圖像處理的基本思想,利用一個(gè)結(jié)構(gòu)元素來(lái)探測(cè)一個(gè)圖像,看是否能將這個(gè)結(jié)構(gòu)元素很好的填放在圖像內(nèi)部,同時(shí)驗(yàn)證填放元素的方法是否有效。數(shù)學(xué)形態(tài)學(xué)的應(yīng)用可以簡(jiǎn)化圖像數(shù)據(jù),保持它們基本的形態(tài)特征,并除去不相干的結(jié)構(gòu)。均值濾波是典型的線性濾波算法,它是指在圖像上對(duì)目標(biāo)像素給一個(gè)模板,該模板包括了其周圍的臨近像素。在RGB模型中,如果R=G=B時(shí),則彩色表示一種灰度顏色,其中R=G=B的值叫灰度值,因此,灰度圖像每個(gè)像素只需一個(gè)字節(jié)存放灰度值(又稱強(qiáng)度值、亮度值),灰度范圍為0255。 將彩色圖像中的三分量亮度求平均得到一個(gè)灰度圖[14]。其具體的操作是:首先確定一個(gè)以某個(gè)像素為中心點(diǎn)的領(lǐng)域,一般為方形領(lǐng)域(如3 * 5 * 5的矩形領(lǐng)域),然后將領(lǐng)域中的各個(gè)像素的灰度值進(jìn)行排序。直方圖反映了圖像的明暗分布規(guī)律,可以通過(guò)圖像變換進(jìn)行直方圖調(diào)整,獲得較好的視覺(jué)效果[17]。根據(jù)概率論的知識(shí),在已知和變換函數(shù)時(shí),反變換函數(shù)也是單調(diào)增長(zhǎng),則可由式()求出。根據(jù)圖片底色等有關(guān)的先驗(yàn)知識(shí),采用彩色像素點(diǎn)統(tǒng)計(jì)的方法分割出合理的文本區(qū)域,確定圖片底色RGB對(duì)應(yīng)的各自灰度范圍,然后行方向統(tǒng)計(jì)在此顏色范圍內(nèi)的像素點(diǎn)數(shù)量,設(shè)定合理的閾值,確定文本在行方向的合理區(qū)域。一般的圖像邊緣檢測(cè)方法有三個(gè)步驟:圖像濾波,使用濾波器來(lái)改善與噪聲有關(guān)的邊緣檢測(cè)器的性能。Sobel算子即是如此排列的一種梯度幅值, ()其中 ()其中的偏導(dǎo)數(shù)用下式計(jì)算(): ()其中常數(shù)c=2,和其他的梯度算子一樣,和,可用卷積模板來(lái)實(shí)現(xiàn),請(qǐng)注意這一算子把重點(diǎn)放在接近于模板中心的像素點(diǎn)。另一種方法是,可以將Prewitt算子擴(kuò)展成八個(gè)方向,即邊緣樣板算子。真實(shí)圖像的邊緣通常都具有有限的寬度呈現(xiàn)出陡峭的斜坡?tīng)?。由信?hào)處理中的測(cè)不準(zhǔn)原理知,與△w是矛盾的,達(dá)到測(cè)不準(zhǔn)下限的濾波器是高斯濾波器。Canny算子提出了評(píng)價(jià)檢測(cè)性能優(yōu)劣的三個(gè)準(zhǔn)則[28],信噪比準(zhǔn)則(真正的邊緣盡可能少的丟失又要盡可能避免將非邊緣點(diǎn)檢測(cè)為邊緣)、定位精度準(zhǔn)則(檢測(cè)的邊緣應(yīng)盡可能接近真實(shí)的邊緣)、單邊緣響應(yīng)準(zhǔn)則(對(duì)每一個(gè)邊緣點(diǎn)有唯一的響應(yīng),即得到單像素寬度的邊緣)。(3)單響應(yīng)標(biāo)準(zhǔn)。這4個(gè)區(qū)及其相應(yīng)的比較方向
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1