freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文(留存版)

2025-08-06 12:44上一頁面

下一頁面
  

【正文】 緣檢測(cè)算法中5種算子的比較,基于邊緣的圖像文本處理技術(shù)。在本文將文本的定位、定位與提取、作為文本區(qū)域提取整體來討論,包含預(yù)處理、特征提取、分類(定位)、生成候選區(qū)域、文本區(qū)域提取幾個(gè)步驟來解決文本區(qū)域的準(zhǔn)確提取問題。腐蝕、膨脹、開啟和關(guān)閉是數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算。再用模板中的全體像素的平均值來代替原來像素值。綜上所述。一幅給定圖像的灰度級(jí)經(jīng)歸一化處理后,分布在范圍內(nèi)。然后,在分割出的行區(qū)域內(nèi),統(tǒng)計(jì)列方向藍(lán)色像素點(diǎn)的數(shù)量,最終確定完整的文字區(qū)域。Sobel算子是邊緣檢測(cè)器中最常用的算子之一。 邊緣的銳利程度由圖像灰度的梯度決定。根據(jù)三個(gè)準(zhǔn)則,可以得到最佳的邊緣。如果不是,則把像素的灰度值設(shè)為0。其檢測(cè)結(jié)果如下圖: (a)灰度化調(diào)整圖 (b)邊緣檢測(cè)圖 利用Canny算子的邊緣檢測(cè)圖邊緣檢測(cè)之后給出的只是二值邊緣圖像。腐蝕運(yùn)算的數(shù)學(xué)定義為: ()上式的含義是,結(jié)構(gòu)元素B平移至點(diǎn)x后仍在A中,或B完全包含在A中時(shí),B的原點(diǎn)處象素點(diǎn)x的集合。 如前所述,通過文字定位,我們得到了原始圖像中出現(xiàn)文字的一系列矩形區(qū)域。 所有灰度大于或等于閾值的像素被判定為屬于特定物體,其灰度值為255表示,否則這些像素點(diǎn)被排除在物體區(qū)域以外,灰度值為0,表示背景或者例外的物體區(qū)域[22]。全局閾值法是指在二值化過程中只使用一個(gè)全局閾值的方法。記錄下這一可疑行, 并設(shè)置一個(gè)行計(jì)數(shù)器令其值為 1, 繼續(xù)按照上述方法計(jì)算下一行的灰度值變化次數(shù)。 對(duì)今后圖像文字提取工作的發(fā)展,值得關(guān)注以下方面: (1)鑒于彩色圖像中文字的字體,大小,顏色等變化多端,目前的算法主要針對(duì)某類特定圖像,缺乏一個(gè)適用性廣泛的算法來從圖像中抽取文字。點(diǎn)滴之恩銘記心中,待日后涌泉相報(bào)。在視頻和彩色圖像文本區(qū)域提取的已有算法大都集中在基于區(qū)域的經(jīng)典方法上。與沒有經(jīng)過字符區(qū)的灰度值變化曲線比較來看, 這個(gè)特征完全可以作為判斷所檢驗(yàn)的行是否穿過文字所在區(qū)域的標(biāo)準(zhǔn)[30]。c 基于連通分量分析的方法基于連通分量分析的方法利用了文字筆畫具有連通性的特征,這種方法首先將輸入的圖片分割成一系列的連通分量,然后通過自底向上的方法分析確定每個(gè)分量屬于前景還是背景,最后將所有前景分量組合成分割結(jié)果。我們采用最簡(jiǎn)單的方法,當(dāng)象素灰度級(jí)低于常數(shù)C時(shí),[0C]象素灰度為0,[C255]象素灰度為255。然后對(duì)圖像進(jìn)行腐蝕運(yùn)算,開啟運(yùn)算并結(jié)合形態(tài)學(xué)濾波,濾除非文本區(qū)域,最后得到目標(biāo)文本。例如,假設(shè)結(jié)構(gòu)元素是半徑為r個(gè)象素的小圓,被作用的物體是一個(gè)大圓。凡是大于高閾值的一定是邊緣,凡是小于低閾值的一定不是邊緣。為此要使以下22大小的模板作為對(duì)X和Y方向偏微分的一階近似。為了避免檢測(cè)出非顯著邊緣,應(yīng)選擇一階導(dǎo)數(shù)大于某一閾值的零交叉點(diǎn)為邊緣點(diǎn)[16]。邊緣,是指周圍像素灰度有階躍變化或屋頂?shù)茸兓哪切┫袼氐募?。幾種常用的邊緣檢測(cè)方法有屬于梯度算子的Roberts算子、Sobel算子和Prewitt算子、高斯偏導(dǎo)濾波器(LOG)以及Canny邊緣檢測(cè)器等。: 對(duì)圖像中文本區(qū)域的細(xì)定位首先要是對(duì)圖像進(jìn)行預(yù)處理,本章著重介紹了目前常用的預(yù)處理方法,通常文字在字體、大小、顏色、對(duì)齊方式和排列方向上常常有很大的變化,文字背景復(fù)雜,圖像分辨率低,圖像噪聲高,而且很多系統(tǒng)在應(yīng)用上還要求算法有較高的處理速度,這些都使得從圖像中有效地提取出文字變得異常困難。直方圖均衡化的目的是使圖像在整個(gè)灰度值動(dòng)態(tài)范圍內(nèi)的分布均勻化,改善圖像的亮度分布狀態(tài),增強(qiáng)圖像的視覺效果。實(shí)驗(yàn)時(shí),系統(tǒng)采用式(4)進(jìn)行灰度化計(jì)算。圖像的分割即把文本區(qū)域分割成單字符區(qū)域,以便后續(xù)進(jìn)行識(shí)別。 文字定位彩色圖像往往是在復(fù)雜的環(huán)境中得到的,圖像中往往有很大的形變,如何在復(fù)雜背景中準(zhǔn)確、快速找出文本的位置成為文本識(shí)別中的難點(diǎn)[10]。通常情況下根據(jù)文本對(duì)象的存在形式將文本分為人工文本和場(chǎng)景文本。論文從課題出發(fā),第一章緒論中闡述了彩色圖像中文本信息提取的四種方式,然后比較對(duì)于不同場(chǎng)景和復(fù)雜背景各種方式的可操作性。該算法不能提取灰度值和背景接近的文本。在各種自然彩色圖像中,往往可以見到各種各樣的文字,這些文字一般和該圖像的語義內(nèi)容相關(guān),或者提供了某種定位輔助信息。彩色圖像中文本提取的算法研究畢業(yè)論文1 緒論隨著互聯(lián)網(wǎng)和多媒體技術(shù)的快速發(fā)展,世界進(jìn)入了一個(gè)嶄新的信息化時(shí)代。若能準(zhǔn)確的將這些文字信息定位出來,并進(jìn)行處理,使之能夠被傳統(tǒng)的OCR軟件識(shí)別并被轉(zhuǎn)化成為機(jī)器內(nèi)碼,結(jié)合自然語言處理,文本檢索,文本翻譯,語音合成等技術(shù)可以被應(yīng)用到各種領(lǐng)域?qū)崿F(xiàn)。王勇等[7]提出一種基于邊緣點(diǎn)密度的視頻字幕自適應(yīng)檢測(cè)算法。并將完整的文字提取系統(tǒng)劃分為文字定位、文字分割和文字識(shí)別三個(gè)階段,指出前兩部分是本文所要解決的問題所在。目前的研究主要集中于對(duì)人工文本的研究,而場(chǎng)景文本的研究剛剛起步。目前已有不少學(xué)者在這方面進(jìn)行了研究。文字分割的難點(diǎn)在于噪聲合字符粘連,斷裂對(duì)字符的影響。 ()一般有以下三種方法對(duì)彩色圖像進(jìn)行灰度化: 將彩色圖像中的三分量的亮度作為三個(gè)灰度圖像的灰度值,可根據(jù)應(yīng)用需要選取一種灰度圖像?;叶戎狈綀D是圖像預(yù)處理涉及最廣泛的基本概念之一。但我們可以對(duì)圖像根據(jù)不同應(yīng)用特點(diǎn)進(jìn)行識(shí)別前的預(yù)處理,盡最大可能提高文本正確識(shí)別率,這些圖像預(yù)處理包括圖像平滑、傾斜校正、灰度修正等。下面介紹幾種經(jīng)典的邊緣檢測(cè)算子[13]。圖像的邊緣對(duì)應(yīng)著圖像灰度的不連續(xù)性。Log算子的輸出是通過卷積運(yùn)算得到的: () 根據(jù)卷積求導(dǎo)法有: ()一階導(dǎo)數(shù)的邊緣算子有時(shí)會(huì)導(dǎo)致檢測(cè)的邊緣點(diǎn)太多,檢測(cè)處的邊緣較粗。 ()由此得到梯度的大小M和方向O: ()對(duì) Canny算子作如下說明:1. 梯度進(jìn)行“非極大抑制”。如果檢測(cè)結(jié)果在兩個(gè)閾值之間,則根據(jù)這個(gè)像素的鄰接像素有沒有超過高閾值的邊緣像素,如果有,則它就是邊緣,否則不是[17]。腐蝕運(yùn)算的結(jié)果是沿大圓邊界向內(nèi)減少了r個(gè)象素的寬度,即直徑減少2r。本算法對(duì)彩色圖像中的文本提取具有較高的精確率和較快的運(yùn)算速度,取得了較好的綜合效果。將256個(gè)亮度等級(jí)的灰度圖像通過適當(dāng)?shù)拈y值選取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。文獻(xiàn)[Sobottka99]利用一種非監(jiān)督聚類的方法將圖片中顏色相近的像素聚成若干個(gè)像素類,然后通過一個(gè)自底向上和一個(gè)自頂向下相結(jié)合的方法來完成文字的分割;文[Zhou97]則應(yīng)用了一種基于EMST的聚類方法進(jìn)行顏色的量化[27]。基于上邊分析的特點(diǎn), 現(xiàn)在尋找文本的上下邊界。我們認(rèn)為充分利用文本區(qū)域強(qiáng)烈的空間頻率特征,采用邊緣檢測(cè)和二值化閾值結(jié)合的方法,可以較好的指導(dǎo)圖像分割算法完成視頻和彩色圖像文本區(qū)域提取的任務(wù)。最后,對(duì)評(píng)審論文的各位專家、學(xué)者表示衷心的感謝!37。今后工作展望文本所用的算法相較以前的算法有一些改進(jìn),但也存在著一定的局限,例如有一些經(jīng)驗(yàn)閾值需要設(shè)定,對(duì)低分辨率的圖像文字檢測(cè)效果不好。因?yàn)槿绻峭ㄟ^文本區(qū)域的話,選擇15 作為閾值是可行的。閾值方法分為全局閾值和局部閾值兩種,如果分割過程中對(duì)圖像上每個(gè)像素所使用的閾值都相等,則為全局閾值方法;如果每個(gè)像素所使用的閾值可能不同,則為局部閾值方法[28]。其次,要進(jìn)行二值圖像的處理與分析,首先要把灰度圖像二值化,得到二值化圖像。確定文本區(qū)域位置后下一步任務(wù)就是進(jìn)行字符切分分離出字符圖像。在任何方向?qū)挾炔淮笥?r個(gè)象素的物體將被消除。Canny 算子則能較好地體現(xiàn)圖像的弱邊緣[18]。這4個(gè)區(qū)及其相應(yīng)的比較方向如下模板所示:例如,如果中心像素x的梯度方向?qū)儆诘?區(qū),則把x的梯度值同它的左上和右下相鄰像素的梯度值比較,看x的梯度值是否是局部極大值。Canny算子提出了評(píng)價(jià)檢測(cè)性能優(yōu)劣的三個(gè)準(zhǔn)則[28],信噪比準(zhǔn)則(真正的邊緣盡可能少的丟失又要盡可能避免將非邊緣點(diǎn)檢測(cè)為邊緣)、定位精度準(zhǔn)則(檢測(cè)的邊緣應(yīng)盡可能接近真實(shí)的邊緣)、單邊緣響應(yīng)準(zhǔn)則(對(duì)每一個(gè)邊緣點(diǎn)有唯一的響應(yīng),即得到單像素寬度的邊緣)。真實(shí)圖像的邊緣通常都具有有限的寬度呈現(xiàn)出陡峭的斜坡狀。Sobel算子即是如此排列的一種梯度幅值, ()其中 ()其中的偏導(dǎo)數(shù)用下式計(jì)算(): ()其中常數(shù)c=2,和其他的梯度算子一樣,和,可用卷積模板來實(shí)現(xiàn),請(qǐng)注意這一算子把重點(diǎn)放在接近于模板中心的像素點(diǎn)。根據(jù)圖片底色等有關(guān)的先驗(yàn)知識(shí),采用彩色像素點(diǎn)統(tǒng)計(jì)的方法分割出合理的文本區(qū)域,確定圖片底色RGB對(duì)應(yīng)的各自灰度范圍,然后行方向統(tǒng)計(jì)在此顏色范圍內(nèi)的像素點(diǎn)數(shù)量,設(shè)定合理的閾值,確定文本在行方向的合理區(qū)域。直方圖反映了圖像的明暗分布規(guī)律,可以通過圖像變換進(jìn)行直方圖調(diào)整,獲得較好的視覺效果[17]。 將彩色圖像中的三分量亮度求平均得到一個(gè)灰度圖[14]。均值濾波是典型的線性濾波算法,它是指在圖像上對(duì)目標(biāo)像素給一個(gè)模板,該模板包括了其周圍的臨近像素。(2) 基于邊緣檢測(cè)的定位方法,這種方法是利用文本區(qū)域豐富的邊緣特征進(jìn)行文字定位[11],能夠進(jìn)行檢測(cè)的方法有多種,如Roberts 邊緣算子、Prewitt 算子、Sobel 算子以及拉普拉斯邊緣檢測(cè);(3) 基于顏色特征的定位方法,這種方法主要是應(yīng)用圖像的紋理特征、形狀特征和顏色特征即利用字符和底色具有明顯的反差特征來排除干擾進(jìn)行文字的定位;(4) 基于數(shù)學(xué)形態(tài)學(xué)的定位方法,這種方法是利用數(shù)學(xué)形態(tài)學(xué)圖像處理的基本
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1