freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文-閱讀頁(yè)

2025-07-07 12:44本頁(yè)面
  

【正文】 設(shè)為0。2. 梯度取兩次閾值。Canny算子的實(shí)現(xiàn)步驟如下:(1)首先用2D高斯濾波模板與原始圖像進(jìn)行卷積,以消除噪聲。(4)求出了邊緣的方向,就可以把邊緣的梯度方向大致分為四種(水平、垂直、45176。方向),并可以找到這個(gè)像素梯度方向的鄰接像素。若某個(gè)像素的灰度值與其梯度方向上前后兩個(gè)像素的灰度值相比不是最大的,那么將這個(gè)像素值置為0,即不是邊緣。凡是大于高閾值的一定是邊緣,凡是小于低閾值的一定不是邊緣。Roberts 算子提取邊緣的結(jié)果邊緣較粗,邊緣定位不很準(zhǔn)確,Sobel 算子和Prewitt 算子對(duì)邊緣的定位就準(zhǔn)確了一些,而采用Log 算子進(jìn)行邊緣提取的結(jié)果要明顯優(yōu)于前4 種算子,特別是邊緣比較完整,位置比較準(zhǔn)確。其檢測(cè)結(jié)果如下圖: (a)灰度化調(diào)整圖 (b)邊緣檢測(cè)圖 利用Canny算子的邊緣檢測(cè)圖邊緣檢測(cè)之后給出的只是二值邊緣圖像。為了使二值化取得良好的效果,首先對(duì)邊緣圖像進(jìn)行形態(tài)學(xué)填充,彌合孔洞去除噪聲,再進(jìn)行自適應(yīng)的閾值分割獲取二值圖像。 1) 基本原理數(shù)學(xué)形態(tài)學(xué)是一種非線性的濾波方法,它以嚴(yán)格的數(shù)學(xué)理論和幾何學(xué)為基礎(chǔ),著重研究圖像的幾何結(jié)構(gòu)及相互關(guān)系。數(shù)學(xué)形態(tài)學(xué)不僅可以簡(jiǎn)化圖像數(shù)據(jù),并能在保持基本形狀特征的基礎(chǔ)上去除不相干結(jié)構(gòu)。設(shè)二值圖像集合為A,結(jié)構(gòu)元素集合為B。a. 腐蝕(Erosion)腐蝕是在結(jié)構(gòu)元素的約束下,消除物體的部分邊界點(diǎn)的一種過(guò)程。例如,假設(shè)結(jié)構(gòu)元素是半徑為r個(gè)象素的小圓,被作用的物體是一個(gè)大圓。如果被作用的圖象中的物體在某一處寬度小于2r+1,腐蝕的結(jié)果將使物體在該點(diǎn)斷開(kāi),分裂為兩個(gè)物體。腐蝕運(yùn)算的數(shù)學(xué)定義為: ()上式的含義是,結(jié)構(gòu)元素B平移至點(diǎn)x后仍在A中,或B完全包含在A中時(shí),B的原點(diǎn)處象素點(diǎn)x的集合。符號(hào)“+”代表該結(jié)構(gòu)元素的原點(diǎn),本例中,原點(diǎn)位于結(jié)構(gòu)元素之內(nèi)。繼續(xù)移動(dòng)結(jié)構(gòu)元素,直至遍歷圖象A全部。腐蝕運(yùn)算將一幅圖象中除去小且無(wú)意義的物體,突出主要感興趣目標(biāo)。結(jié)構(gòu)元素B對(duì)A的開(kāi)運(yùn)算記作,其定義為 () 即先用B對(duì)A作腐蝕運(yùn)算,再作膨脹運(yùn)算。開(kāi)運(yùn)算通常用來(lái)消除小對(duì)象物、在纖細(xì)點(diǎn)處分離物體、平滑較大物體的邊界的同時(shí)并不明顯改變其面積。然后對(duì)圖像進(jìn)行腐蝕運(yùn)算,開(kāi)啟運(yùn)算并結(jié)合形態(tài)學(xué)濾波,濾除非文本區(qū)域,最后得到目標(biāo)文本。5文字分割文字分割指的是指從彩色圖像文字塊中將背景去除,得到只含文字信息的二值圖像。 如前所述,通過(guò)文字定位,我們得到了原始圖像中出現(xiàn)文字的一系列矩形區(qū)域。圖像二值化是指整幅圖像畫(huà)面內(nèi)僅黑、白二值的圖像。這是因?yàn)?,一方面,有些需要處理的如文字圖像、指紋圖像、工程圖紙等圖像本身是二值的;另一方面,在某些情況下即使圖像本身是有灰度的,我們也設(shè)法使它變成二值圖像再進(jìn)行處理(即灰度圖像的二值化)。此外二值化的圖像能夠用幾何學(xué)中的概念進(jìn)行分析和特征描述,比灰度圖像優(yōu)勢(shì)大得多。同時(shí)車牌識(shí)別系統(tǒng)要求處理的速度高、成本低、信息量大,采用二值圖像進(jìn)行處理,能大大提高處理效率[21]。設(shè)原灰度圖像為f(x,y),二值化后的圖像為g(x,y),二值化的過(guò)程表示如下: ()二值化,基于實(shí)時(shí)性的要求,我力求尋找一種快速而且效果較好的方法,能夠更有針對(duì)性的解決在不同條件下牌照?qǐng)D像的二值化問(wèn)題。我們采用最簡(jiǎn)單的方法,當(dāng)象素灰度級(jí)低于常數(shù)C時(shí),[0C]象素灰度為0,[C255]象素灰度為255。在數(shù)字圖像處理中,二值圖像占有非常重要的地位,首先,圖像的二值化有利于圖像的進(jìn)一步處理,使圖像變得簡(jiǎn)單,而且數(shù)據(jù)量減小,能凸顯出感興趣的目標(biāo)的輪廓。 所有灰度大于或等于閾值的像素被判定為屬于特定物體,其灰度值為255表示,否則這些像素點(diǎn)被排除在物體區(qū)域以外,灰度值為0,表示背景或者例外的物體區(qū)域[22]。 近年來(lái),研究人員在文字分割方面做了大量有意義的工作,提出了很多方法,這些方法大致可分成以下三類[23]: a 基于顏色閾值的方法。文字的閾值又分為全局閾值和局部閾值兩種。文[Liu97]首先利用了[Ostus79]的提出的二值化算法獲得一系列的候選閾值,這些閾值各對(duì)應(yīng)一種邊緣特征,對(duì)這些邊緣進(jìn)行分析最后確定最優(yōu)的閾值。b 基于顏色模型的方法基于顏色模型的方法認(rèn)為圖像中的文字顏色分布是滿足一定的參數(shù)模型的,這種方法首先通過(guò)機(jī)器學(xué)習(xí)為文字像素建立一個(gè)顏色模型,然后利用該模型計(jì)算圖片中每一個(gè)像素屬于文字像素的概率,概率高于某個(gè)閾值的像素被標(biāo)記為文字像素,低于這個(gè)閾值的像素標(biāo)記為背景像素。[Ye04]中,Ye等在HSI顏色空間中使用GMM表示文字顏色的H, I兩分量的分布,首先利用文字的“邊緣對(duì)”特性通過(guò)采樣得到一部分屬于文字的像素,然后使用這些樣本在線估計(jì)GMM的參數(shù)并根據(jù)GMM提取剩余的文字像素[26]。c 基于連通分量分析的方法基于連通分量分析的方法利用了文字筆畫(huà)具有連通性的特征,這種方法首先將輸入的圖片分割成一系列的連通分量,然后通過(guò)自底向上的方法分析確定每個(gè)分量屬于前景還是背景,最后將所有前景分量組合成分割結(jié)果。基于連通分量的方法由于對(duì)文字的筆畫(huà)作為整體處理,因分而割的結(jié)果筆畫(huà)的連貫性比較好,易于被OCR軟件所識(shí)別;但是大多數(shù)這類方法進(jìn)行連通分量聚合的時(shí)候只利用了文字的顏色,因而只能對(duì)具有單一顏色的圖像文字有效,另一方面,較低的圖像分辨率和較高的圖像噪聲也會(huì)影響連通分量聚合的結(jié)果。全局閾值法是指在二值化過(guò)程中只使用一個(gè)全局閾值的方法。根據(jù)文本圖像的直方圖或灰度空間分布確定一個(gè)閾值,以此實(shí)現(xiàn)灰度文本圖像到二值圖像的轉(zhuǎn)化。閾值分割法的結(jié)果很大程度上依賴于對(duì)閾值的選擇,因此該方法的關(guān)鍵是如何選擇合適的閾值。另一種方法是局部閾值化,即設(shè)定多個(gè)二值化閾值,通常由像素灰度值和此像素區(qū)域的局部灰度特性來(lái)動(dòng)態(tài)地確定: ()下標(biāo)k表示第k個(gè)區(qū)域。如果依靠人眼來(lái)進(jìn)行判斷,不僅耗時(shí)耗力,而且由于人的主觀認(rèn)知誤差,還會(huì)對(duì)圖像的分割效果產(chǎn)生影響[29]。在經(jīng)過(guò)邊緣檢測(cè)算子處理過(guò)的圖像中采用逐行逐像素點(diǎn)相比較判斷跳躍點(diǎn)次數(shù)的方法來(lái)尋找車牌的上下邊界, 這里的跳躍點(diǎn)是指相鄰兩像素之間灰度值之差在一定閾值之上的點(diǎn)。與沒(méi)有經(jīng)過(guò)字符區(qū)的灰度值變化曲線比較來(lái)看, 這個(gè)特征完全可以作為判斷所檢驗(yàn)的行是否穿過(guò)文字所在區(qū)域的標(biāo)準(zhǔn)[30]。首先, 逐行讀取經(jīng)過(guò)處理的文本塊圖像的灰度值后計(jì)算相鄰像素點(diǎn)的灰度值的差, 如果差值大于設(shè)定的閾值(這個(gè)閾值就是層次化是使用的層次段的值)把變化次數(shù)的計(jì)數(shù)器進(jìn)行加 1, 在數(shù)組中記錄各行的灰度值變化總次數(shù), 如果總次數(shù)大于 15, 認(rèn)為這一行可能是文字所在行。記錄下這一可疑行, 并設(shè)置一個(gè)行計(jì)數(shù)器令其值為 1, 繼續(xù)按照上述方法計(jì)算下一行的灰度值變化次數(shù)。 若不滿足的話對(duì)行計(jì)數(shù)器進(jìn)行清0 處理, 直到重新得到滿足條件的行。在這些連續(xù)變化的行中, ,第一個(gè)滿足變化的行為字符的底部, 而最后的滿足變化條件的一行為字符的頂部, 這樣就得到了字符上下邊界的一個(gè)大體位置。6.結(jié)論全文工作總結(jié)本文主要研究了彩色圖像中的文本提取的算法研究。本算法能夠?qū)Σ噬珗D像文本進(jìn)行準(zhǔn)確和有效的提取。傳統(tǒng)的彩色圖像邊緣檢測(cè)算子是將灰度圖像邊緣檢測(cè)算子分別作用于顏色空間各個(gè)分量上,忽視了彩色分量間的關(guān)聯(lián)關(guān)系,往往會(huì)出現(xiàn)多邊緣和寬邊緣情況,不能充分體現(xiàn)顏色的距離,造成復(fù)雜圖像的分割困難。在視頻和彩色圖像文本區(qū)域提取的已有算法大都集中在基于區(qū)域的經(jīng)典方法上。我們研究了視頻和彩色圖像文本區(qū)域提取方法,也適用與廣告、標(biāo)志等的文本提取。 對(duì)今后圖像文字提取工作的發(fā)展,值得關(guān)注以下方面: (1)鑒于彩色圖像中文字的字體,大小,顏色等變化多端,目前的算法主要針對(duì)某類特定圖像,缺乏一個(gè)適用性廣泛的算法來(lái)從圖像中抽取文字。 (2)需要進(jìn)一步開(kāi)拓彩色圖像和背景復(fù)雜圖像中的文字提取的應(yīng)用領(lǐng)域,應(yīng)用需求的缺乏導(dǎo)致這方面研究工作開(kāi)展的難度。1999.[13]徐少宏,自然場(chǎng)景及白板視頻會(huì)議中文字定位方法[D].大連:大連理工大學(xué),2005.[14]胡德婷,自然場(chǎng)景文本提取方法研究[學(xué)位論文]2008[15] A K Zhong Page Segmentation Using Texture Analysis 1996(05)[16]白晶,復(fù)雜背景圖像中的文本定位方法研究[學(xué)位論文]2009[17]朱學(xué)芳,多媒體信息處理與檢索技術(shù)電子,工業(yè)出版社,2002年:123—143[18]田玉敏,林高全,基于顏色特征的彩色圖像提取方法,西安電子大學(xué)學(xué)報(bào)(自然科學(xué)版), [19]韋娜基,于紋理特征的圖像提取技術(shù)研究與實(shí)現(xiàn),碩士學(xué)位論文,西北大學(xué),2003年:8:79[20]蜜聰杰,劉洋,薛向陽(yáng),基于多幀圖像的視頻文字跟蹤和分割算法,《計(jì)算機(jī)研究與發(fā)展》,2006年,第43卷,第9期[21]劉洋,薛向陽(yáng),路紅,郭躍飛,一種基于邊緣檢測(cè)和線條特征的視頻字符檢測(cè)算法,《計(jì)算機(jī)學(xué)報(bào)》,2005年3月,第28卷,第3期,427—433[22]Sahoo P K, Arara G. A thresholding method based on twodimensional Renyi39。從理論學(xué)習(xí)研究到算法運(yùn)行實(shí)驗(yàn),我遇到了很多困難,在這里我要衷心的感謝在此期間對(duì)我進(jìn)行無(wú)私幫助的眾多老師和各位同學(xué)們,感謝他們對(duì)我的幫助。在進(jìn)行畢業(yè)設(shè)計(jì)的這段時(shí)間里,他為我研究階段的學(xué)習(xí)提供了良好的環(huán)境,營(yíng)造了濃厚的學(xué)術(shù)氛圍,讓我在這期間收獲很多。正是由于趙老師細(xì)心認(rèn)真的指導(dǎo),及時(shí)地糾正總體設(shè)計(jì)方案及論文方面的錯(cuò)誤,讓我能夠鍥而不舍的堅(jiān)持下去, 我才能很好地完成了設(shè)計(jì)。點(diǎn)滴之恩銘記心中,待日后涌泉相報(bào)
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1