freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文-在線瀏覽

2024-08-02 12:44本頁面
  

【正文】 等造成的文本圖像的亮度變化。通常情況下根據(jù)文本對象的存在形式將文本分為人工文本和場景文本。文本提取的研究思路主要集中于應(yīng)用各種圖像處理的方法將文字區(qū)域的邊角特征、色彩特征和紋理特征突出,然后根據(jù)一定的分類算法來劃分候選的區(qū)域,經(jīng)過進一步的后處理來最終確定實際的文本區(qū)域。在本文將文本的定位、定位與提取、作為文本區(qū)域提取整體來討論,包含預(yù)處理、特征提取、分類(定位)、生成候選區(qū)域、文本區(qū)域提取幾個步驟來解決文本區(qū)域的準確提取問題。字符識別圖像采集字符分割文字定位圖像預(yù)處理 彩色圖像文本提取 文本信息提取流程包含了文字定位、文字分割和光學(xué)字符識別(OCR)三個串聯(lián)的階段。在第一部分圖像采集中,主要通過CCD 攝像頭與計算機的視頻捕捉卡直接相連來完成圖像采集。彩色圖像中的文本提取的關(guān)鍵在于后四部分。目前,已經(jīng)提出了很多種方法,一個共同的出發(fā)點是:通過文本的特征來判斷區(qū)域,利用的文本特征主要包括:文本區(qū)域內(nèi)的邊緣灰度直方圖統(tǒng)計“特征”、文本的幾何特征、文本區(qū)域的灰度分布特征、文本區(qū)域水平或垂直投影特征、文本形狀特征和頻譜特征。通常文字在字體、大小、顏色、對齊方式和排列方向上常常有很大的變化,文字背景復(fù)雜,圖像分辨率低,圖像噪聲高,而且很多系統(tǒng)在應(yīng)用上還要求算法有較高的處理速度,這些都使得從圖像中有效地提取出文字變得異常困難。 文字定位彩色圖像往往是在復(fù)雜的環(huán)境中得到的,圖像中往往有很大的形變,如何在復(fù)雜背景中準確、快速找出文本的位置成為文本識別中的難點[10]??偨Y(jié)起來主要有如下幾類方法:(1) 基于水平灰度變化特征的方法,這種方法主要在文本定位以前,需要對圖像進行預(yù)處理,將彩色圖像轉(zhuǎn)換為灰度圖像。腐蝕、膨脹、開啟和關(guān)閉是數(shù)學(xué)形態(tài)學(xué)的基本運算。該方法包括文字區(qū)域的粗定位和細定位兩個步驟。本方法對在多種光照條件下采集的彩色圖像、背景復(fù)雜等情形,均能取得較好的定位效果。這里選用的是數(shù)學(xué)形態(tài)學(xué)的方法,其基本思想是用具有一定形態(tài)的機構(gòu)元素去量度和提取圖像中的對應(yīng)形狀以達到對圖像分析和識別的目的。在本文中用到了膨脹和開運算這兩個基本運算。根據(jù)圖片底色等有關(guān)的先驗知識,采用彩色像素點統(tǒng)計的方法分割出合理的文本區(qū)域,確定圖片底色RGB對應(yīng)的各自灰度范圍,然后行方向統(tǒng)計在此顏色范圍內(nèi)的像素點數(shù)量,設(shè)定合理的閾值,確定車牌在行方向的合理區(qū)域。圖像的分割即把文本區(qū)域分割成單字符區(qū)域,以便后續(xù)進行識別。要想從圖像中直接提取出目標(biāo)物體,最常用的方法就是設(shè)定一個閾值T,用T將圖像的數(shù)據(jù)分成兩部分:大于T的像素群和小于T的像素群,即對圖像二值化。再用模板中的全體像素的平均值來代替原來像素值。想要精確的提取出文本區(qū)域,必須綜合考慮文本的各種特征,在初步提取的基礎(chǔ)上利用各種限制性條件,濾除非文本區(qū)域,得到目標(biāo)文本。采用動態(tài)閾值法確定圖像二值化的關(guān)鍵閾值,使用帶修正的自適應(yīng)鄰域平均法消除圖像干擾和噪音一般對灰度圖像可以實現(xiàn)較好的處理效果。這時就可以采用灰度校正的方法來處理,增強灰度的變化范圍,豐富灰度層次,以達到增強圖像的對比率和分辨率。根據(jù)人類色彩感光特性,可以采用以下公式計算得到彩色圖像中各個像素的灰度值。 ()其中考慮了整數(shù)除法的四舍五入。實驗時,系統(tǒng)采用式(4)進行灰度化計算。 將彩色圖像中的三分量亮度的最大值作為灰度圖的灰度值。綜上所述。因此,對圖像進行去噪對圖像文本的提取很是重要。其基本原理是用均值替代原圖像中的各個像素值,即對待處理的當(dāng)前像素點,選擇一個模板,該模板由其近鄰的若干像素組成,求模板中所有像素的均值,再把該均值賦予當(dāng)前像素點 ,作為處理后圖像在該點上的灰度: ()其中,為模板,為該模板中包含當(dāng)前像素在內(nèi)的像素總個數(shù)。其實現(xiàn)原理如下:將某個像素鄰域中的像素按灰度值進行排序,然后選擇該序列的中間值作為輸出的像素值,讓周圍像素灰度值的差比較大的像素改取與周圍的像素值接近的值,從而可以消除孤立的噪聲點。假設(shè)其排序為:, ()取排好序的序列的中間值作為中心點像素灰度的新值,這里的鄰域通常被稱為窗口。本文應(yīng)用中值濾波對圖像進行降噪,所以根據(jù)中值濾波原理可知,通過數(shù)據(jù)排序的方法,將圖像中未被噪聲污染的點代替噪聲點的值的概率比較大,因此噪聲的抑制效果很好,同時畫面的輪廓依然比較清晰。直方圖均衡化的目的是使圖像在整個灰度值動態(tài)范圍內(nèi)的分布均勻化,改善圖像的亮度分布狀態(tài),增強圖像的視覺效果。圖像的直方圖事實上就是圖像的亮度分布的概率密度函數(shù),是一幅圖像的所有像素集合的最基本的統(tǒng)計規(guī)律。一幅給定圖像的灰度級經(jīng)歸一化處理后,分布在范圍內(nèi)。變換函數(shù)應(yīng)該滿足下列條件:① 在區(qū)間內(nèi),是單值單調(diào)增加; ② 對于,有這里第一個條件保證了圖像的灰度級西歐哪個白到黑的次序不變和反變換函數(shù)的存在。從s到r的反變換可用式()表示,同樣也滿足上述兩個條件 ()由概率論理論可知,若已知隨機變量的概率密度為,而隨機變量是的函數(shù),即,的概率密度為,所以可以由求出。在這種情況下,當(dāng),且僅當(dāng)時發(fā)生,所以可以求得隨即變量的分布函數(shù)為: ()對式()兩邊求導(dǎo),即可得到隨即變量的分布密度函數(shù)為:()由式()可知,對于連續(xù)情況,設(shè)和分別表示原圖像和變換后圖像的灰度級概率密度函數(shù)。 (a)原灰度圖像 (b)直方圖均衡圖3. 3 直方圖均衡處理 對于受噪聲干擾嚴重的圖像,由于噪音點多在頻譜中映射為高頻分量,因此可以通過中值濾波來濾除噪音,但實際中為了簡化算法也可以直接在空域中用求領(lǐng)域平均值得方法來消弱噪音影響。 經(jīng)過上述方法分割出來的文本區(qū)域圖像中存在目標(biāo)文本、背景還有噪聲,要想從圖像中直接提取目標(biāo)物體,最常用的方法就是設(shè)定一個閾值T,用T將圖像的數(shù)據(jù)分成兩部分:大于T的像素群和小于T的像素群,即對圖像的二值化。: 對圖像中文本區(qū)域的細定位首先要是對圖像進行預(yù)處理,本章著重介紹了目前常用的預(yù)處理方法,通常文字在字體、大小、顏色、對齊方式和排列方向上常常有很大的變化,文字背景復(fù)雜,圖像分辨率低,圖像噪聲高,而且很多系統(tǒng)在應(yīng)用上還要求算法有較高的處理速度,這些都使得從圖像中有效地提取出文字變得異常困難。4 文本定位在獲得預(yù)處理的圖像后,利用彩色圖像的彩色分割方法。然后,在分割出的行區(qū)域內(nèi),統(tǒng)計列方向藍色像素點的數(shù)量,最終確定完整的文字區(qū)域。僅僅依靠單一文本特征的圖像分割方法不適于復(fù)雜彩色圖像文本的提取,必須要在初步提取的基礎(chǔ)上,考慮更多的文本特征,對候選文本區(qū)域進行篩選。因此,本章提出一種基于邊緣的文本檢測算法,借助圖像的邊緣特征為主要特征,顏色尺寸等特征為輔,更好地分割識別出彩色圖像中的文本。邊緣檢測的方法主要集中于計算圖像灰度值的一階導(dǎo)數(shù)或二階導(dǎo)數(shù),圖像的邊緣點對應(yīng)于一階微分圖像的峰值點,在二階微分圖像上對應(yīng)于零交叉點。圖像增強,一般是通過計算梯度的幅值來完成。最簡單的邊緣檢測判斷依據(jù)是梯度幅值。幾種常用的邊緣檢測方法有屬于梯度算子的Roberts算子、Sobel算子和Prewitt算子、高斯偏導(dǎo)濾波器(LOG)以及Canny邊緣檢測器等。 Sobel 算子考慮到采用33鄰域可以避免在像素之間內(nèi)插點上計算梯度,[i,j] 周圍點的排列。Sobel算子是邊緣檢測器中最常用的算子之一。由于常量c的不同,這一算子與Sobel算子不同的地方在于沒有把重點放在接近模板中心的像素點。這使得它們對邊緣的走向有些敏感。這與真實的梯度值更接近。這些算子樣板由理想的邊緣子圖構(gòu)成。用這個最大值作為算子的輸出值MIA,這樣可將邊緣像素檢測出來[13]。邊緣,是指周圍像素灰度有階躍變化或屋頂?shù)茸兓哪切┫袼氐募稀o@然圖像的邊緣很少是從一個灰度跳到另一個灰度這樣的理想狀況。 邊緣的銳利程度由圖像灰度的梯度決定。 ()梯度的大小和方向是由: () ()因此最簡單的邊緣檢測算子是用圖像的垂直和水平差分來逼近梯度算子: ()因此當(dāng)我想尋找邊緣的時候,最簡單的方法是對每一個像素計算出的向量,然后求出他的絕對值,然后進行閥值操作就可以了。Log算法理論是從生物視覺理論導(dǎo)出的方法。濾波器的選擇取決于兩個因素,一是要求濾波器在空間上平穩(wěn),空間位置誤差要小,二是要求平滑濾波器本身是帶通濾波器,在其有限帶通內(nèi)是平穩(wěn)的,即要求頻域誤差△w要小。Marr和Hildreth提出的差分算子是各向同性的拉普拉斯二階差分算子[15]。由于平滑會導(dǎo)致邊緣的延展,因此邊緣檢測器只考慮那些具有局部梯度最大值的點為邊緣點,這一點可以用二階倒數(shù)零交叉點來實現(xiàn)。為了避免檢測出非顯著邊緣,應(yīng)選擇一階導(dǎo)數(shù)大于某一閾值的零交叉點為邊緣點[16]。而二階導(dǎo)數(shù)的過零點處對應(yīng)著一階導(dǎo)數(shù)的局部最大值,因此利用二階導(dǎo)數(shù)的算子求得局部梯度最大值對應(yīng)的點,并判定它們屬于邊緣點,可以檢測得出更加精確的邊緣。根據(jù)三個準則,可以得到最佳的邊緣。從以下的3個標(biāo)準意義來說,Canny邊緣檢測算子對白噪聲影響的階躍型邊緣是最優(yōu)。不丟失重要的邊緣,不應(yīng)有虛假的邊緣。實際邊緣與檢測到的邊緣位置之間的偏差最小。將多個響應(yīng)降低為單個邊緣響應(yīng)。算法如下:1. 用 33 高斯濾波器來對圖像濾波,以取出圖像中的噪聲。為此要使以下22大小的模板作為對X和Y方向偏微分的一階近似。梯度的方向可以被定義為屬于4個區(qū)之一,各個區(qū)有不同的鄰近像素用來進行比較,以決定局部極大值。如果不是,則把像素的灰度值
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1