freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文(完整版)

2025-07-28 12:44上一頁面

下一頁面
  

【正文】 基于邊緣的技術(shù)邊緣和梯度邊緣檢測算子基于紋理的技術(shù)紋理和梯度Kmean方法基于學(xué)習(xí)的技術(shù)像素灰度值、彩色梯度神經(jīng)網(wǎng)絡(luò),支持向量機(jī)目前文字識(shí)別各種技術(shù)相對成熟并已經(jīng)投入實(shí)際應(yīng)用。第四章結(jié)合邊緣檢測和數(shù)學(xué)形態(tài)學(xué)特征對文字進(jìn)行定位,邊緣檢測算法中5種算子的比較,基于邊緣的圖像文本處理技術(shù)。 課題的主要目標(biāo)就是在彩色圖像下提取文本信息,二值化分割進(jìn)而識(shí)別文字這一特定語義對象。但是算法不能提取灰度值和背景接近的文本。Marco Bertin{5]利用角點(diǎn)特征來進(jìn)行的視頻字幕檢測。然后通過匹配算法,對連通元進(jìn)行多幀跟蹤,去除那些沒有連續(xù)多幀出現(xiàn)的連通元。隨著技術(shù)的不斷發(fā)展,人們對彩色圖像中文字提取進(jìn)行了廣泛的研究,并已有許多成熟的技術(shù)應(yīng)用在各個(gè)領(lǐng)域,如交通管理中的汽車牌照識(shí)別和港口貨物管理的集裝箱編碼識(shí)別等。這都使得彩色圖像下的文本的提取成為一個(gè)很有意義的研究課題。彩色圖像中的文本提取即為彩色圖像中文本定位,是很困難的問題。但自然場景中的文本分割依然面臨著許多復(fù)雜的問題,主要原因是:(1)文字和其他自然景物混雜在一起,如樹、窗戶和房屋建筑等,背景復(fù)雜;(2)文字的顏色多種多樣;(3)文字的字體和大小復(fù)雜多變;(4)光照的變化等。最后通過對比度的分析,形狀分析等去除非文本的連通元。這種算法實(shí)質(zhì)上類似于基于灰度邊緣的算法等。郭麗等[8]提出一種基于顏色邊緣點(diǎn)和游程平滑的視頻文本提取算法。在各種彩色圖像中,往往可以見到各種各樣的文字,這些文字一般和該圖像的語義內(nèi)容相關(guān),或者提供了某種定位輔助信息。應(yīng)用了基于彩色圖像的canny算子邊緣的方法。相比之下,如何準(zhǔn)確的將文字區(qū)域提取出來目前還處于探索階段。彩色圖像文本提取流程如下圖所示。 圖像預(yù)處理根據(jù)三基色原理,世界上任何色彩都可以由紅綠藍(lán)(RGB)三色不同比例的混合來表示,如果紅綠藍(lán)(RGB)三個(gè)信號(hào)分別由一個(gè)字節(jié)表示,則該圖像顏色位數(shù)就達(dá)到二十四位真彩,也就是說在二十四位真彩的數(shù)字圖像中每個(gè)像素點(diǎn)由三個(gè)字節(jié)來表示,根據(jù)數(shù)字圖像水平和垂直方向像素點(diǎn)數(shù)(即圖像分辨率)可計(jì)算出一幅圖像實(shí)際位圖大小。這些方法各有優(yōu)缺點(diǎn),本文結(jié)合數(shù)學(xué)形態(tài)學(xué)的特征和邊緣檢測對文本進(jìn)行定位,對于提高文本定位準(zhǔn)確率提供更有利的保障。 文本細(xì)定位在獲得文本粗定位后,利用彩色圖像的彩色分割方法。:本章主要介紹了目前彩色圖像中文本信息的提取流程,對各個(gè)步驟進(jìn)行了簡單的概述。 ()為避免浮點(diǎn)數(shù)計(jì)算,加快計(jì)算速度,叫以用式(2) 代替式(1)運(yùn)算。 (a) 原圖 (b) 灰度化圖像圖 原圖像轉(zhuǎn)化為灰度化彩色圖像受到光照等影響,圖像的輸入、采集、處理的各個(gè)環(huán)節(jié)以及最終的輸出結(jié)果都會(huì)產(chǎn)生一定的影響,特別是在圖像的輸入、采集過程中,若輸入伴有較大噪聲,必定會(huì)對其后的處理以及最終的文字提取效果造成不利。當(dāng)窗口在圖像中上下左右進(jìn)行移動(dòng)后,利用中值濾波算法可以很好地對圖像進(jìn)行平滑處理。這時(shí)可以對[0,1]區(qū)間內(nèi)的任意一個(gè)r值進(jìn)行如下變換: ()也就是說,通過上述變換,每個(gè)原始圖像的像素值r都對應(yīng)產(chǎn)生一個(gè)s值。這種方法就是平滑處理。本文應(yīng)用基于邊緣的方法實(shí)現(xiàn)對文本的定位。圖像檢測,確定哪些點(diǎn)是邊緣點(diǎn)。 Prewitt 算子 Prewitt算子類似于Sobel算子,不同的是常系數(shù)c=l。依次用邊緣樣板去檢測圖像,與被檢測區(qū)域最為相似的樣板給出最大值。梯度是一個(gè)向量,?f 指出灰度變化的最快的方向和數(shù)量。Log邊緣檢測器的基本特征是: 平滑濾波器是高斯濾波器 增強(qiáng)步驟采用二階導(dǎo)數(shù)(二維拉普拉斯函數(shù)) 邊緣檢測判據(jù)是二階導(dǎo)數(shù)零交叉點(diǎn)并對應(yīng)一階導(dǎo)數(shù)的較大峰值 這種方法的特點(diǎn)是圖像首先與高斯濾波器進(jìn)行卷積,這一步既平滑了圖像又降低了噪聲,孤立的噪聲點(diǎn)和較小的結(jié)構(gòu)組織將被路濾除。 Canny算子還有一個(gè)重要的邊緣檢測算子,即Canny算子,它是最優(yōu)的階梯型邊緣(step edge)檢測算子。Canny 邊緣檢測法是高斯函數(shù)的一階微分,它能在噪聲抑制和邊緣檢測之間取得較好的平衡[27]。這個(gè)過程叫做“非極大抑制”。(5)遍歷圖像。邊緣圖像的二值化是很重要的問題,如果閾值太大可能會(huì)漏掉一些文本邊緣,而閾值太小則可能會(huì)使較多的非文本邊緣被當(dāng)作文本邊緣來處理,造成較多的誤檢。本文主要運(yùn)用其中的腐蝕、開啟運(yùn)算對圖像進(jìn)行后續(xù)處理。A是由多個(gè)象素點(diǎn)連接成的圖像物體,結(jié)構(gòu)元素B是直角連接的三個(gè)象素。為了更好的理解開運(yùn)算在圖像處理中的作用,現(xiàn)討論下面的等價(jià)方程 ()這個(gè)方程表明,B對A的開運(yùn)算可由對所有可以填入A的B并集得到,A的所有比B小的部分都將舍去。將這些區(qū)域剪裁下來,就得到了原圖像的一系列子圖像,我們稱之為圖像文字塊,文字分割指的是從以上的圖像文字塊中將背景去除,得到只含文字信息的二值圖像,從這個(gè)意義上說,文字分割也可以叫做圖像文字二值化[20]。二值化的關(guān)鍵是找到合適的閾值t來區(qū)分對象和背景。圖像的二值化如下圖所示: (a)原文字區(qū)域圖 (b)二值化圖像 轉(zhuǎn)為二值化圖由于字符本身的灰度與背景間的灰度值存在著較大差別, 使得文本區(qū)域中的邊緣特性很明顯, 這一特征也是尋找字符的重要依據(jù)。在[Chen02]中,Chen等首先為圖像中的文字灰度值建立一個(gè)高斯混合模型( Gaussian Mixture Model, GMM ),然后用基于馬爾科夫隨機(jī)場(MarkovRandom Field, MRF)的方法確定每個(gè)象素所屬的高斯項(xiàng),從而達(dá)到分割的目的。它將圖像的每個(gè)像素的灰度值與進(jìn)行比較,若大于,則取為前景色(白色);否則,取為背景色。由于字符本身的灰度與背景間的灰度值存在著較大差別, 使得文本區(qū)域中的邊緣特性很明顯, 這一特征也是尋找字符的重要依據(jù)。如果滿足以上的閾值條件那么行計(jì)數(shù)器的值加 1。2.研究了簡單背景下文本提取中的彩色圖像邊緣檢測的有關(guān)問題。由于從彩色圖像中抽取文字信息所走流程較多,定位,二值化,識(shí)別等步驟都會(huì)不同程度地引入錯(cuò)誤,即使單看其中某些步驟可能性能良好,但整體來看能完全正確抽取出來的文字還是不多,離完全實(shí)用還有一段距離。同時(shí),在課程學(xué)習(xí)和論文研究期間,趙英亮老師給予了我悉心的指導(dǎo)和熱情的幫助,在課題研究中給了我很多啟發(fā)性的建議,趙老師不但幫助我對課題方向進(jìn)行了解,還對我的設(shè)計(jì)方案提出了很多寶貴的建議,并耐心地解答我遇到的問題,使我的畢業(yè)設(shè)計(jì)有了質(zhì)的提高。在此,表示衷心的感謝!最后,感謝中北大學(xué)所有辛勤培育我的老師們,感謝您們在大學(xué)四年里對我的支持與幫助。參考文獻(xiàn)[1]陳鍛生,[J],計(jì)算機(jī)學(xué)報(bào),2006,29(2):194207[2]莊越挺,劉駿偉,吳飛,[J],計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),(8):750—753[3]Yu Zhong,Kalle Karu,Anil K Jain. Locating Text in Complex Color Images[J]. Pattern Recognition, 1995, 28(10):1523—1535[4]徐華根,唐慧明,[J].電視技術(shù),2005(1):36—38[5]陳兵旗,孫明,VisualC++使用圖像處理[M].北京:清華大學(xué)出版社,2004.[6]歐文武,朱軍民,.2003,17(5):55—60[7]Jain A K,Yu B. Automatic Text Location in Intages and VideoFrames[J].Pattern Remgnition,1998, 31(12) :2055—2076.[8]李昭早,.2006.1[9]章毓晉,.3:254—258[10]歐文武,朱軍民,30:65—67[11]崔瑩瑩,楊杰,[J].影像技術(shù),2006(1):28—30[12]張引,復(fù)雜背景下文本提取方法研究與應(yīng)用[D].杭州:浙江大學(xué)。3.研究了彩色圖像文本區(qū)域提取算法視頻和彩色圖像文本提取是典型的圖像分割問題??紤]到文字塊的高度, 若得到連續(xù)滿足變化條件的行數(shù)大于15 的話, 則認(rèn)為這個(gè)連續(xù)變化區(qū)域?yàn)檐嚺频纳舷聟^(qū)域。判斷取一條穿過文字區(qū)域的直線上各個(gè)點(diǎn)的灰度值進(jìn)行研究可以看出, 穿過文字區(qū)域的灰度值具有十分明顯的峰谷特征。其中全局閾值法又可分為基于點(diǎn)的閾值法和基于區(qū)域的閾值法?;陬伾P偷姆椒ㄓ捎诳紤]到了文字顏色的多峰值分布,因而能夠處理比較復(fù)雜的背景,但是對不同的圖像,其文字的顏色模型往往差別很大,為多種不同的圖像建立不同的模型并不容易,有時(shí)候甚至是不可能的。基于顏色閾值的方法假定了圖像中文字的亮度總是比背景高或者比背景低,通過估計(jì)背景顏色和前景顏色的閾值來達(dá)到分割的目的。求解閾值的方法很多,微分直方圖法、最大方差法、基于灰度的數(shù)學(xué)期望的方法、可變閾值法等。在數(shù)字圖像處理中二值圖像占有很重要的地位。如圖所示: 對腐蝕后的圖像開運(yùn)算結(jié)果圖在切除了非目標(biāo)文本的小區(qū)域后得到定位剪切的彩色文本區(qū)域如下圖所示,實(shí)現(xiàn)了文本的彩色細(xì)定位: 本章應(yīng)用了基于邊緣的文本提取方法通過形態(tài)學(xué)填充形成連通區(qū)域,得到的二值化圖像特征更加突出,更加便于后續(xù)的篩選。將結(jié)構(gòu)元素的原點(diǎn)移至圖象A起始部分,如果B的全部象素都包含在A之中,則此時(shí)處在結(jié)構(gòu)元素原點(diǎn)位置的象素記做“1”,否則,記做“0”。運(yùn)算結(jié)果使物體的面積減少了相應(yīng)數(shù)量的點(diǎn)。最基本的形態(tài)學(xué)算子有四個(gè):腐蝕、膨脹、開運(yùn)算以及閉運(yùn)算。(6)使用累計(jì)
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1