freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文(專業(yè)版)

2025-08-03 12:44上一頁面

下一頁面
  

【正文】 從理論學(xué)習(xí)研究到算法運(yùn)行實(shí)驗(yàn),我遇到了很多困難,在這里我要衷心的感謝在此期間對我進(jìn)行無私幫助的眾多老師和各位同學(xué)們,感謝他們對我的幫助。6.結(jié)論全文工作總結(jié)本文主要研究了彩色圖像中的文本提取的算法研究。另一種方法是局部閾值化,即設(shè)定多個(gè)二值化閾值,通常由像素灰度值和此像素區(qū)域的局部灰度特性來動(dòng)態(tài)地確定: ()下標(biāo)k表示第k個(gè)區(qū)域。文[Liu97]首先利用了[Ostus79]的提出的二值化算法獲得一系列的候選閾值,這些閾值各對應(yīng)一種邊緣特征,對這些邊緣進(jìn)行分析最后確定最優(yōu)的閾值。此外二值化的圖像能夠用幾何學(xué)中的概念進(jìn)行分析和特征描述,比灰度圖像優(yōu)勢大得多。腐蝕運(yùn)算將一幅圖象中除去小且無意義的物體,突出主要感興趣目標(biāo)。數(shù)學(xué)形態(tài)學(xué)不僅可以簡化圖像數(shù)據(jù),并能在保持基本形狀特征的基礎(chǔ)上去除不相干結(jié)構(gòu)。(4)求出了邊緣的方向,就可以把邊緣的梯度方向大致分為四種(水平、垂直、45176。實(shí)際邊緣與檢測到的邊緣位置之間的偏差最小。濾波器的選擇取決于兩個(gè)因素,一是要求濾波器在空間上平穩(wěn),空間位置誤差要小,二是要求平滑濾波器本身是帶通濾波器,在其有限帶通內(nèi)是平穩(wěn)的,即要求頻域誤差△w要小。這與真實(shí)的梯度值更接近。邊緣檢測的方法主要集中于計(jì)算圖像灰度值的一階導(dǎo)數(shù)或二階導(dǎo)數(shù),圖像的邊緣點(diǎn)對應(yīng)于一階微分圖像的峰值點(diǎn),在二階微分圖像上對應(yīng)于零交叉點(diǎn)。在這種情況下,當(dāng),且僅當(dāng)時(shí)發(fā)生,所以可以求得隨即變量的分布函數(shù)為: ()對式()兩邊求導(dǎo),即可得到隨即變量的分布密度函數(shù)為:()由式()可知,對于連續(xù)情況,設(shè)和分別表示原圖像和變換后圖像的灰度級概率密度函數(shù)。其實(shí)現(xiàn)原理如下:將某個(gè)像素鄰域中的像素按灰度值進(jìn)行排序,然后選擇該序列的中間值作為輸出的像素值,讓周圍像素灰度值的差比較大的像素改取與周圍的像素值接近的值,從而可以消除孤立的噪聲點(diǎn)。這時(shí)就可以采用灰度校正的方法來處理,增強(qiáng)灰度的變化范圍,豐富灰度層次,以達(dá)到增強(qiáng)圖像的對比率和分辨率。這里選用的是數(shù)學(xué)形態(tài)學(xué)的方法,其基本思想是用具有一定形態(tài)的機(jī)構(gòu)元素去量度和提取圖像中的對應(yīng)形狀以達(dá)到對圖像分析和識別的目的。彩色圖像中的文本提取的關(guān)鍵在于后四部分。目前電腦還達(dá)不到模擬人類直覺思維方式的水平,它只能利用大量的運(yùn)算來逼近人們的類比識別過程,因此某一些特定的數(shù)學(xué)運(yùn)算并不足以適應(yīng)多種情況下大的需要,并且對于圖像中的目標(biāo)文本而言,文本不單單以一種特定形式表現(xiàn),而是根據(jù)不同的情況存在有不同的表現(xiàn)方式,比如顏色、梯度、紋理、邊緣等等。但是該算法容易受到顏色一致的物體的干擾。Byung[4]提出用字符的拓?fù)浣Y(jié)構(gòu)特征來提取字符文本區(qū)域,然后對視頻字幕區(qū)域進(jìn)行復(fù)原。文本可以作為圖像的內(nèi)容標(biāo)識和索引,是圖像內(nèi)容重要程度的判斷依據(jù),例如出現(xiàn)醒目文字的幀,可以抽取出來作為對應(yīng)的圖像的代表幀。 因此,將圖像中的文本提取出來將便于不停國家,不同文化之間的交流。Boon Lock Yeo[3]提出利用場景變化來檢測視頻文本的出現(xiàn)和消失。首先,通過小波變換計(jì)算視頻中的局部能力特征,能量高的區(qū)域作為候選字幕區(qū)域。第五章介紹文字分割典型的常見手法并且加以比較,針對彩色圖像中文本定位提取的問題,對文本區(qū)域進(jìn)行字符提取,成功提取出單個(gè)字符串。本文主要介紹文字定位和文字分割。在粗定位階段中采用了基于數(shù)學(xué)形態(tài)學(xué)的定位方法,在得到定位圖像后進(jìn)行細(xì)定位,在細(xì)定位中采用顏色特征的方法以獲得最后定位圖像。3圖像預(yù)處理因?yàn)樘鞖饣蛘吲臄z角度等原因會造成圖像模糊、歪斜或缺損的情況,所以我們在分析圖像文本時(shí)要對圖像進(jìn)行預(yù)處理,一般動(dòng)作有對輸入的灰度圖像進(jìn)行大小歸一化,避免因圖像的變形而影響后續(xù)的處理,通過灰度拉伸增強(qiáng)圖像對比度,通過二值化處理實(shí)現(xiàn)圖像中背景和對象的分割。 均值濾波均值濾波也稱為線性濾波,其采用的主要方法為鄰域平均法。第二個(gè)條件則保證了映射變化后的像素灰度值在允許的范圍內(nèi)。鑒于圖像的邊緣是圖像的最基本特征之一,人們在觀察一幅圖像時(shí),最先得到的信息就是圖像的外形輪廓(邊緣)。當(dāng)用兩個(gè)掩模板(卷積算子)組成邊緣檢測器時(shí),通常取較大的幅度作為輸出值。利用這種思想就得到了Roberts算子: ()a) 它是一個(gè)兩個(gè)22模板作用的結(jié)果(): 和 Log算子 前面都是利用邊緣處的梯度最大(正的或負(fù)的)這一性質(zhì)來進(jìn)行邊緣檢測,即利用了灰度圖像的拐點(diǎn)位置是邊緣的性質(zhì)。(1)檢測標(biāo)準(zhǔn)。3. 邊緣連接。最基本的形態(tài)學(xué)算子有四個(gè):腐蝕、膨脹、開運(yùn)算以及閉運(yùn)算。將結(jié)構(gòu)元素的原點(diǎn)移至圖象A起始部分,如果B的全部象素都包含在A之中,則此時(shí)處在結(jié)構(gòu)元素原點(diǎn)位置的象素記做“1”,否則,記做“0”。在數(shù)字圖像處理中二值圖像占有很重要的地位。基于顏色閾值的方法假定了圖像中文字的亮度總是比背景高或者比背景低,通過估計(jì)背景顏色和前景顏色的閾值來達(dá)到分割的目的。其中全局閾值法又可分為基于點(diǎn)的閾值法和基于區(qū)域的閾值法。考慮到文字塊的高度, 若得到連續(xù)滿足變化條件的行數(shù)大于15 的話, 則認(rèn)為這個(gè)連續(xù)變化區(qū)域?yàn)檐嚺频纳舷聟^(qū)域。參考文獻(xiàn)[1]陳鍛生,[J],計(jì)算機(jī)學(xué)報(bào),2006,29(2):194207[2]莊越挺,劉駿偉,吳飛,[J],計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),(8):750—753[3]Yu Zhong,Kalle Karu,Anil K Jain. Locating Text in Complex Color Images[J]. Pattern Recognition, 1995, 28(10):1523—1535[4]徐華根,唐慧明,[J].電視技術(shù),2005(1):36—38[5]陳兵旗,孫明,VisualC++使用圖像處理[M].北京:清華大學(xué)出版社,2004.[6]歐文武,朱軍民,.2003,17(5):55—60[7]Jain A K,Yu B. Automatic Text Location in Intages and VideoFrames[J].Pattern Remgnition,1998, 31(12) :2055—2076.[8]李昭早,.2006.1[9]章毓晉,.3:254—258[10]歐文武,朱軍民,30:65—67[11]崔瑩瑩,楊杰,[J].影像技術(shù),2006(1):28—30[12]張引,復(fù)雜背景下文本提取方法研究與應(yīng)用[D].杭州:浙江大學(xué)。同時(shí),在課程學(xué)習(xí)和論文研究期間,趙英亮老師給予了我悉心的指導(dǎo)和熱情的幫助,在課題研究中給了我很多啟發(fā)性的建議,趙老師不但幫助我對課題方向進(jìn)行了解,還對我的設(shè)計(jì)方案提出了很多寶貴的建議,并耐心地解答我遇到的問題,使我的畢業(yè)設(shè)計(jì)有了質(zhì)的提高。2.研究了簡單背景下文本提取中的彩色圖像邊緣檢測的有關(guān)問題。由于字符本身的灰度與背景間的灰度值存在著較大差別, 使得文本區(qū)域中的邊緣特性很明顯, 這一特征也是尋找字符的重要依據(jù)。在[Chen02]中,Chen等首先為圖像中的文字灰度值建立一個(gè)高斯混合模型( Gaussian Mixture Model, GMM ),然后用基于馬爾科夫隨機(jī)場(MarkovRandom Field, MRF)的方法確定每個(gè)象素所屬的高斯項(xiàng),從而達(dá)到分割的目的。二值化的關(guān)鍵是找到合適的閾值t來區(qū)分對象和背景。為了更好的理解開運(yùn)算在圖像處理中的作用,現(xiàn)討論下面的等價(jià)方程 ()這個(gè)方程表明,B對A的開運(yùn)算可由對所有可以填入A的B并集得到,A的所有比B小的部分都將舍去。本文主要運(yùn)用其中的腐蝕、開啟運(yùn)算對圖像進(jìn)行后續(xù)處理。(5)遍歷圖像。Canny 邊緣檢測法是高斯函數(shù)的一階微分,它能在噪聲抑制和邊緣檢測之間取得較好的平衡[27]。Log邊緣檢測器的基本特征是: 平滑濾波器是高斯濾波器 增強(qiáng)步驟采用二階導(dǎo)數(shù)(二維拉普拉斯函數(shù)) 邊緣檢測判據(jù)是二階導(dǎo)數(shù)零交叉點(diǎn)并對應(yīng)一階導(dǎo)數(shù)的較大峰值 這種方法的特點(diǎn)是圖像首先與高斯濾波器進(jìn)行卷積,這一步既平滑了圖像又降低了噪聲,孤立的噪聲點(diǎn)和較小的結(jié)構(gòu)組織將被路濾除。依次用邊緣樣板去檢測圖像,與被檢測區(qū)域最為相似的樣板給出最大值。圖像檢測,確定哪些點(diǎn)是邊緣點(diǎn)。這種方法就是平滑處理。當(dāng)窗口在圖像中上下左右進(jìn)行移動(dòng)后,利用中值濾波算法可以很好地對圖像進(jìn)行平滑處理。 ()為避免浮點(diǎn)數(shù)計(jì)算,加快計(jì)算速度,叫以用式(2) 代替式(1)運(yùn)算。 文本細(xì)定位在獲得文本粗定位后,利用彩色圖像的彩色分割方法。 圖像預(yù)處理根據(jù)三基色原理,世界上任何色彩都可以由紅綠藍(lán)(RGB)三色不同比例的混合來表示,如果紅綠藍(lán)(RGB)三個(gè)信號分別由一個(gè)字節(jié)表示,則該圖像顏色位數(shù)就達(dá)到二十四位真彩,也就是說在二十四位真彩的數(shù)字圖像中每個(gè)像素點(diǎn)由三個(gè)字節(jié)來表示,根據(jù)數(shù)字圖像水平和垂直方向像素點(diǎn)數(shù)(即圖像分辨率)可計(jì)算出一幅圖像實(shí)際位圖大小。相比之下,如何準(zhǔn)確的將文字區(qū)域提取出來目前還處于探索階段。在各種彩色圖像中,往往可以見到各種各樣的文字,這些文字一般和該圖像的語義內(nèi)容相關(guān),或者提供了某種定位輔助信息。這種算法實(shí)質(zhì)上類似于基于灰度邊緣的算法等。但自然場景中的文本分割依然面臨著許多復(fù)雜的問題,主要原因是:(1)文字和其他自然景物混雜在一起,如樹、窗戶和房屋建筑等,背景復(fù)雜;(2)文字的顏色多種多樣;(3)文字的字體和大小復(fù)雜多變;(4)光照的變化等。這都使得彩色圖像下的文本的提取成為一個(gè)很有意義的研究課題。然后通過匹配算法,對連通元進(jìn)行多幀跟蹤,去除那些沒有連續(xù)多幀出現(xiàn)的連通元。但是算法不能提取灰度值和背景接近的文本。第四章結(jié)合邊緣檢測和數(shù)學(xué)形態(tài)學(xué)特征對文字進(jìn)行定位,邊
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1