freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文(更新版)

2025-07-31 12:44上一頁面

下一頁面
  

【正文】 直方圖計算兩個閾值。3. 邊緣連接。2. 對每個像素,計算其梯度的大小M和方向O。(1)檢測標(biāo)準(zhǔn)。拉普拉斯函數(shù)用作二維二階倒數(shù)的近似,是因為它是一種無方向算子。利用這種思想就得到了Roberts算子: ()a) 它是一個兩個22模板作用的結(jié)果(): 和 Log算子 前面都是利用邊緣處的梯度最大(正的或負(fù)的)這一性質(zhì)來進(jìn)行邊緣檢測,即利用了灰度圖像的拐點(diǎn)位置是邊緣的性質(zhì)。 Roberts 算子 1963年Roberts提出了邊緣檢測和邊緣檢測的這個簡單算子[14]。當(dāng)用兩個掩模板(卷積算子)組成邊緣檢測器時,通常取較大的幅度作為輸出值。 邊緣檢測的基本算法有很多,有梯度算子、方向算子、拉普拉斯算子和坎尼(Canny)算子等等。鑒于圖像的邊緣是圖像的最基本特征之一,人們在觀察一幅圖像時,最先得到的信息就是圖像的外形輪廓(邊緣)。均值濾波是典型的線性濾波算法,它是指在圖像上對目標(biāo)像素給一個模板,該模板包括了周圍的臨近像素,再用模板中的全體像素的平均值來代替原來的像素值。第二個條件則保證了映射變化后的像素灰度值在允許的范圍內(nèi)。如下即分別為用中值濾波處理后的圖像: (a)原圖 (b)中值濾波處理圖直方圖是圖像的最基本的統(tǒng)計特征,它反映的是圖像的灰度值的分布情況。 均值濾波均值濾波也稱為線性濾波,其采用的主要方法為鄰域平均法。式() 可進(jìn)一步簡化為: ()這使得運(yùn)算時間進(jìn)步縮短。3圖像預(yù)處理因為天氣或者拍攝角度等原因會造成圖像模糊、歪斜或缺損的情況,所以我們在分析圖像文本時要對圖像進(jìn)行預(yù)處理,一般動作有對輸入的灰度圖像進(jìn)行大小歸一化,避免因圖像的變形而影響后續(xù)的處理,通過灰度拉伸增強(qiáng)圖像對比度,通過二值化處理實現(xiàn)圖像中背景和對象的分割。然后,在分割出的行區(qū)域內(nèi),統(tǒng)計列方向藍(lán)色像素點(diǎn)的數(shù)量,最終確定完整的車牌區(qū)域。在粗定位階段中采用了基于數(shù)學(xué)形態(tài)學(xué)的定位方法,在得到定位圖像后進(jìn)行細(xì)定位,在細(xì)定位中采用顏色特征的方法以獲得最后定位圖像。但我們可以對圖像根據(jù)不同應(yīng)用特點(diǎn)進(jìn)行識別前的預(yù)處理,盡最大可能提高文本正確識別率,這些圖像預(yù)處理包括圖像平滑、傾斜校正、直方圖均衡化、灰度修正等。本文主要介紹文字定位和文字分割。由于存在這些難點(diǎn),才使得圖像文字提取成為一個值得深入研究的課題。第五章介紹文字分割典型的常見手法并且加以比較,針對彩色圖像中文本定位提取的問題,對文本區(qū)域進(jìn)行字符提取,成功提取出單個字符串。對圖像中文字的提取首先確定包含文字的圖像區(qū)域,濾除非文本背景的干擾,把彩色圖像中的文本區(qū)域定位出來,這是文字提取工作中最難、最關(guān)鍵的環(huán)節(jié),確定包含文字圖像的區(qū)域后,利用文本特征制定啟發(fā)式規(guī)則,濾除非文本區(qū)域,得到二值化文本字符,為了方便后面的文字抽取,在字符抽取前進(jìn)行一次文字區(qū)域圖像質(zhì)量的改善也很有必要,對文字提取后,最終采用OCR技術(shù)對字符進(jìn)行識別。首先,通過小波變換計算視頻中的局部能力特征,能量高的區(qū)域作為候選字幕區(qū)域。首先提取視頻幀的灰度邊緣,然后合并相鄰的邊緣,生成候選文本區(qū)域,最后用一些啟發(fā)式規(guī)則來去除虛假的文本區(qū)域。Boon Lock Yeo[3]提出利用場景變化來檢測視頻文本的出現(xiàn)和消失。目前已有的文本區(qū)域提取方法大致可以分為四類:(1)基于邊緣的方法(2)基于紋理的方法(3)基于連通域的方法(4)基于學(xué)習(xí)的方法。 因此,將圖像中的文本提取出來將便于不停國家,不同文化之間的交流。以圖像、動畫、視頻為主要元素的各種多媒體信息構(gòu)成了信息傳播的主力。文本可以作為圖像的內(nèi)容標(biāo)識和索引,是圖像內(nèi)容重要程度的判斷依據(jù),例如出現(xiàn)醒目文字的幀,可以抽取出來作為對應(yīng)的圖像的代表幀。針對圖像、視頻文本檢測和提取的研究,主要有以下算法:Rainer Lienhart[2]利用文字顏色的單一性、文本區(qū)域的大小約束、同一文本會在連續(xù)幾個視頻幀出現(xiàn)等特點(diǎn),對文本進(jìn)行檢測和定位。Byung[4]提出用字符的拓?fù)浣Y(jié)構(gòu)特征來提取字符文本區(qū)域,然后對視頻字幕區(qū)域進(jìn)行復(fù)原。采用基于邊緣檢測的方法,結(jié)合文字圖像區(qū)域本身的特點(diǎn),在對原圖像進(jìn)行邊緣檢測和形態(tài)學(xué)膨脹后,對其在水平和垂直方向的邊緣密度投影采用一種自適應(yīng)的檢測算法,從而檢測得到字幕圖像區(qū)域。但是該算法容易受到顏色一致的物體的干擾。第二章主要介紹了文本定位與提取方法綜述,簡單的介紹文本提取原理,對文本粗提取與細(xì)提取的步驟進(jìn)行了闡述。目前電腦還達(dá)不到模擬人類直覺思維方式的水平,它只能利用大量的運(yùn)算來逼近人們的類比識別過程,因此某一些特定的數(shù)學(xué)運(yùn)算并不足以適應(yīng)多種情況下大的需要,并且對于圖像中的目標(biāo)文本而言,文本不單單以一種特定形式表現(xiàn),而是根據(jù)不同的情況存在有不同的表現(xiàn)方式,比如顏色、梯度、紋理、邊緣等等。文本提取的研究思路主要集中于應(yīng)用各種圖像處理的方法將文字區(qū)域的邊角特征、色彩特征和紋理特征突出,然后根據(jù)一定的分類算法來劃分候選的區(qū)域,經(jīng)過進(jìn)一步的后處理來最終確定實際的文本區(qū)域。彩色圖像中的文本提取的關(guān)鍵在于后四部分。總結(jié)起來主要有如下幾類方法:(1) 基于水平灰度變化特征的方法,這種方法主要在文本定位以前,需要對圖像進(jìn)行預(yù)處理,將彩色圖像轉(zhuǎn)換為灰度圖像。這里選用的是數(shù)學(xué)形態(tài)學(xué)的方法,其基本思想是用具有一定形態(tài)的機(jī)構(gòu)元素去量度和提取圖像中的對應(yīng)形狀以達(dá)到對圖像分析和識別的目的。要想從圖像中直接提取出目標(biāo)物體,最常用的方法就是設(shè)定一個閾值T,用T將圖像的數(shù)據(jù)分成兩部分:大于T的像素群和小于T的像素群,即對圖像二值化。這時就可以采用灰度校正的方法來處理,增強(qiáng)灰度的變化范圍,豐富灰度層次,以達(dá)到增強(qiáng)圖像的對比率和分辨率。 將彩色圖像中的三分量亮度的最大值作為灰度圖的灰度值。其實現(xiàn)原理如下:將某個像素鄰域中的像素按灰度值進(jìn)行排序,然后選擇該序列的中間值作為輸出的像素值,讓周圍像素灰度值的差比較大的像素改取與周圍的像素值接近的值,從而可以消除孤立的噪聲點(diǎn)。圖像的直方圖事實上就是圖像的亮度分布的概率密度函數(shù),是一幅圖像的所有像素集合的最基本的統(tǒng)計規(guī)律。在這種情況下,當(dāng),且僅當(dāng)時發(fā)生,所以可以求得隨即變量的分布函數(shù)為: ()對式()兩邊求導(dǎo),即可得到隨即變量的分布密度函數(shù)為:()由式()可知,對于連續(xù)情況,設(shè)和分別表示原圖像和變換后圖像的灰度級概率密度函數(shù)。4 文本定位在獲得預(yù)處理的圖像后,利用彩色圖像的彩色分割方法。邊緣檢測的方法主要集中于計算圖像灰度值的一階導(dǎo)數(shù)或二階導(dǎo)數(shù),圖像的邊緣點(diǎn)對應(yīng)于一階微分圖像的峰值點(diǎn),在二階微分圖像上對應(yīng)于零交叉點(diǎn)。 Sobel 算子考慮到采用33鄰域可以避免在像素之間內(nèi)插點(diǎn)上計算梯度,[i,j] 周圍點(diǎn)的排列。這與真實的梯度值更接近。顯然圖像的邊緣很少是從一個灰度跳到另一個灰度這樣的理想狀況。濾波器的選擇取決于兩個因素,一是要求濾波器在空間上平穩(wěn),空間位置誤差要小,二是要求平滑濾波器本身是帶通濾波器,在其有限帶通內(nèi)是平穩(wěn)的,即要求頻域誤差△w要小。而二階導(dǎo)數(shù)的過零點(diǎn)處對應(yīng)著一階導(dǎo)數(shù)的局部最大值,因此利用二階導(dǎo)數(shù)的算子求得局部梯度最大值對應(yīng)的點(diǎn),并判定它們屬于邊緣點(diǎn),可以檢測得出更加精確的邊緣。實際邊緣與檢測到的邊緣位置之間的偏差最小。梯度的方向可以被定義為屬于4個區(qū)之一,各個區(qū)有不同的鄰近像素用來進(jìn)行比較,以決定局部極大值。(4)求出了邊緣的方向,就可以把邊緣的梯度方向大致分為四種(水平、垂直、45176。Roberts 算子提取邊緣的結(jié)果邊緣較粗,邊緣定位不很準(zhǔn)確,Sobel 算子和Prewitt 算子對邊緣的定位就準(zhǔn)確了一些,而采用Log 算子進(jìn)行邊緣提取的結(jié)果要明顯優(yōu)于前4 種算子,特別是邊緣比較完整,位置比較準(zhǔn)確。數(shù)學(xué)形態(tài)學(xué)不僅可以簡化圖像數(shù)據(jù),并能在保持基本形狀特征的基礎(chǔ)上去除不相干結(jié)構(gòu)。如果被作用的圖象中的物體在某一處寬度小于2r+1,腐蝕的結(jié)果將使物體在該點(diǎn)斷開,分裂為兩個物體。腐蝕運(yùn)算將一幅圖象中除去小且無意義的物體,突出主要感興趣目標(biāo)。5文字分割文字分割指的是指從彩色圖像文字塊中將背景去除,得到只含文字信息的二值圖像。此外二值化的圖像能夠用幾何學(xué)中的概念進(jìn)行分析和特征描述,比灰度圖像優(yōu)勢大得多。在數(shù)字圖像處理中,二值圖像占有非常重要的地位,首先,圖像的二值化有利于圖像的進(jìn)一步處理,使圖像變得簡單,而且數(shù)據(jù)量減小,能凸顯出感興趣的目標(biāo)的輪廓。文[Liu97]首先利用了[Ostus79]的提出的二值化算法獲得一系列的候選閾值,這些閾值各對應(yīng)一種邊緣特征,對這些邊緣進(jìn)行分析最后確定最優(yōu)的閾值。基于連通分量的方法由于對文字的筆畫作為整體處理,因分而割的結(jié)果筆畫的連貫性比較好,易于被OCR軟件所識別;但是大多數(shù)這類方法進(jìn)行連通分量聚合的時候只利用了文字的顏色,因而只能對具有單一顏色的圖像文字有效,另一方面,較低的圖像分辨率和較高的圖像噪聲也會影響連通分量聚合的結(jié)果。另一種方法是局部閾值化,即設(shè)定多個二值化閾值,通常由像素灰度值和此像素區(qū)域的局部灰度特性來動態(tài)地確定: ()下標(biāo)k表示第k個區(qū)域。首先, 逐行讀取經(jīng)過處理的文本塊圖像的灰度值后計算相鄰像素點(diǎn)的灰度值的差, 如果差值大于設(shè)定的閾值(這個閾值就是層次化是使用的層次段的值)把變化次數(shù)的計數(shù)器進(jìn)行加 1, 在數(shù)組中記錄各行的灰度值變化總次數(shù), 如果總次數(shù)大于 15, 認(rèn)為這一行可能是文字所在行。6.結(jié)論全文工作總結(jié)本文主要研究了彩色圖像中的文本提取的算法研究。我們研究了視頻和彩色圖像文本區(qū)域提取方法,也適用與廣告、標(biāo)志等的文本提取。從理論學(xué)習(xí)研究到算法運(yùn)行實驗,我遇到了很多困難,在這里我要衷心的感謝在此期間對我進(jìn)行無私幫助的眾多老師和各位同學(xué)們,感謝他們對我的幫助
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1