freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文-文庫吧在線文庫

2025-07-25 12:44上一頁面

下一頁面
  

【正文】 章緒論中闡述了彩色圖像中文本信息提取的四種方式,然后比較對于不同場景和復(fù)雜背景各種方式的可操作性。第六章展望與總結(jié)。通常情況下根據(jù)文本對象的存在形式將文本分為人工文本和場景文本。在第一部分圖像采集中,主要通過CCD 攝像頭與計算機的視頻捕捉卡直接相連來完成圖像采集。 文字定位彩色圖像往往是在復(fù)雜的環(huán)境中得到的,圖像中往往有很大的形變,如何在復(fù)雜背景中準確、快速找出文本的位置成為文本識別中的難點[10]。本方法對在多種光照條件下采集的彩色圖像、背景復(fù)雜等情形,均能取得較好的定位效果。圖像的分割即把文本區(qū)域分割成單字符區(qū)域,以便后續(xù)進行識別。采用動態(tài)閾值法確定圖像二值化的關(guān)鍵閾值,使用帶修正的自適應(yīng)鄰域平均法消除圖像干擾和噪音一般對灰度圖像可以實現(xiàn)較好的處理效果。實驗時,系統(tǒng)采用式(4)進行灰度化計算。其基本原理是用均值替代原圖像中的各個像素值,即對待處理的當(dāng)前像素點,選擇一個模板,該模板由其近鄰的若干像素組成,求模板中所有像素的均值,再把該均值賦予當(dāng)前像素點 ,作為處理后圖像在該點上的灰度: ()其中,為模板,為該模板中包含當(dāng)前像素在內(nèi)的像素總個數(shù)。直方圖均衡化的目的是使圖像在整個灰度值動態(tài)范圍內(nèi)的分布均勻化,改善圖像的亮度分布狀態(tài),增強圖像的視覺效果。從s到r的反變換可用式()表示,同樣也滿足上述兩個條件 ()由概率論理論可知,若已知隨機變量的概率密度為,而隨機變量是的函數(shù),即,的概率密度為,所以可以由求出。: 對圖像中文本區(qū)域的細定位首先要是對圖像進行預(yù)處理,本章著重介紹了目前常用的預(yù)處理方法,通常文字在字體、大小、顏色、對齊方式和排列方向上常常有很大的變化,文字背景復(fù)雜,圖像分辨率低,圖像噪聲高,而且很多系統(tǒng)在應(yīng)用上還要求算法有較高的處理速度,這些都使得從圖像中有效地提取出文字變得異常困難。因此,本章提出一種基于邊緣的文本檢測算法,借助圖像的邊緣特征為主要特征,顏色尺寸等特征為輔,更好地分割識別出彩色圖像中的文本。幾種常用的邊緣檢測方法有屬于梯度算子的Roberts算子、Sobel算子和Prewitt算子、高斯偏導(dǎo)濾波器(LOG)以及Canny邊緣檢測器等。這使得它們對邊緣的走向有些敏感。邊緣,是指周圍像素灰度有階躍變化或屋頂?shù)茸兓哪切┫袼氐募稀og算法理論是從生物視覺理論導(dǎo)出的方法。為了避免檢測出非顯著邊緣,應(yīng)選擇一階導(dǎo)數(shù)大于某一閾值的零交叉點為邊緣點[16]。不丟失重要的邊緣,不應(yīng)有虛假的邊緣。為此要使以下22大小的模板作為對X和Y方向偏微分的一階近似。Canny算子的實現(xiàn)步驟如下:(1)首先用2D高斯濾波模板與原始圖像進行卷積,以消除噪聲。凡是大于高閾值的一定是邊緣,凡是小于低閾值的一定不是邊緣。 1) 基本原理數(shù)學(xué)形態(tài)學(xué)是一種非線性的濾波方法,它以嚴格的數(shù)學(xué)理論和幾何學(xué)為基礎(chǔ),著重研究圖像的幾何結(jié)構(gòu)及相互關(guān)系。例如,假設(shè)結(jié)構(gòu)元素是半徑為r個象素的小圓,被作用的物體是一個大圓。繼續(xù)移動結(jié)構(gòu)元素,直至遍歷圖象A全部。然后對圖像進行腐蝕運算,開啟運算并結(jié)合形態(tài)學(xué)濾波,濾除非文本區(qū)域,最后得到目標文本。這是因為,一方面,有些需要處理的如文字圖像、指紋圖像、工程圖紙等圖像本身是二值的;另一方面,在某些情況下即使圖像本身是有灰度的,我們也設(shè)法使它變成二值圖像再進行處理(即灰度圖像的二值化)。我們采用最簡單的方法,當(dāng)象素灰度級低于常數(shù)C時,[0C]象素灰度為0,[C255]象素灰度為255。文字的閾值又分為全局閾值和局部閾值兩種。c 基于連通分量分析的方法基于連通分量分析的方法利用了文字筆畫具有連通性的特征,這種方法首先將輸入的圖片分割成一系列的連通分量,然后通過自底向上的方法分析確定每個分量屬于前景還是背景,最后將所有前景分量組合成分割結(jié)果。閾值分割法的結(jié)果很大程度上依賴于對閾值的選擇,因此該方法的關(guān)鍵是如何選擇合適的閾值。與沒有經(jīng)過字符區(qū)的灰度值變化曲線比較來看, 這個特征完全可以作為判斷所檢驗的行是否穿過文字所在區(qū)域的標準[30]。在這些連續(xù)變化的行中, ,第一個滿足變化的行為字符的底部, 而最后的滿足變化條件的一行為字符的頂部, 這樣就得到了字符上下邊界的一個大體位置。在視頻和彩色圖像文本區(qū)域提取的已有算法大都集中在基于區(qū)域的經(jīng)典方法上。1999.[13]徐少宏,自然場景及白板視頻會議中文字定位方法[D].大連:大連理工大學(xué),2005.[14]胡德婷,自然場景文本提取方法研究[學(xué)位論文]2008[15] A K Zhong Page Segmentation Using Texture Analysis 1996(05)[16]白晶,復(fù)雜背景圖像中的文本定位方法研究[學(xué)位論文]2009[17]朱學(xué)芳,多媒體信息處理與檢索技術(shù)電子,工業(yè)出版社,2002年:123—143[18]田玉敏,林高全,基于顏色特征的彩色圖像提取方法,西安電子大學(xué)學(xué)報(自然科學(xué)版), [19]韋娜基,于紋理特征的圖像提取技術(shù)研究與實現(xiàn),碩士學(xué)位論文,西北大學(xué),2003年:8:79[20]蜜聰杰,劉洋,薛向陽,基于多幀圖像的視頻文字跟蹤和分割算法,《計算機研究與發(fā)展》,2006年,第43卷,第9期[21]劉洋,薛向陽,路紅,郭躍飛,一種基于邊緣檢測和線條特征的視頻字符檢測算法,《計算機學(xué)報》,2005年3月,第28卷,第3期,427—433[22]Sahoo P K, Arara G. A thresholding method based on twodimensional Renyi39。點滴之恩銘記心中,待日后涌泉相報。在進行畢業(yè)設(shè)計的這段時間里,他為我研究階段的學(xué)習(xí)提供了良好的環(huán)境,營造了濃厚的學(xué)術(shù)氛圍,讓我在這期間收獲很多。 對今后圖像文字提取工作的發(fā)展,值得關(guān)注以下方面: (1)鑒于彩色圖像中文字的字體,大小,顏色等變化多端,目前的算法主要針對某類特定圖像,缺乏一個適用性廣泛的算法來從圖像中抽取文字。本算法能夠?qū)Σ噬珗D像文本進行準確和有效的提取。記錄下這一可疑行, 并設(shè)置一個行計數(shù)器令其值為 1, 繼續(xù)按照上述方法計算下一行的灰度值變化次數(shù)。如果依靠人眼來進行判斷,不僅耗時耗力,而且由于人的主觀認知誤差,還會對圖像的分割效果產(chǎn)生影響[29]。全局閾值法是指在二值化過程中只使用一個全局閾值的方法。b 基于顏色模型的方法基于顏色模型的方法認為圖像中的文字顏色分布是滿足一定的參數(shù)模型的,這種方法首先通過機器學(xué)習(xí)為文字像素建立一個顏色模型,然后利用該模型計算圖片中每一個像素屬于文字像素的概率,概率高于某個閾值的像素被標記為文字像素,低于這個閾值的像素標記為背景像素。 所有灰度大于或等于閾值的像素被判定為屬于特定物體,其灰度值為255表示,否則這些像素點被排除在物體區(qū)域以外,灰度值為0,表示背景或者例外的物體區(qū)域[22]。同時車牌識別系統(tǒng)要求處理的速度高、成本低、信息量大,采用二值圖像進行處理,能大大提高處理效率[21]。 如前所述,通過文字定位,我們得到了原始圖像中出現(xiàn)文字的一系列矩形區(qū)域。結(jié)構(gòu)元素B對A的開運算記作,其定義為 () 即先用B對A作腐蝕運算,再作膨脹運算。腐蝕運算的數(shù)學(xué)定義為: ()上式的含義是,結(jié)構(gòu)元素B平移至點x后仍在A中,或B完全包含在A中時,B的原點處象素點x的集合。設(shè)二值圖像集合為A,結(jié)構(gòu)元素集合為B。其檢測結(jié)果如下圖: (a)灰度化調(diào)整圖 (b)邊緣檢測圖 利用Canny算子的邊緣檢測圖邊緣檢測之后給出的只是二值邊緣圖像。方向),并可以找到這個像素梯度方向的鄰接像素。如果不是,則把像素的灰度值設(shè)為0。將多個響應(yīng)降低為單個邊緣響應(yīng)。根據(jù)三個準則,可以得到最佳的邊緣。Marr和Hildreth提出的差分算子是各向同性的拉普拉斯二階差分算子[15]。 邊緣的銳利程度由圖像灰度的梯度決定。這些算子樣板由理想的邊緣子圖構(gòu)成。Sobel算子是邊緣檢測器中最常用的算子之一。圖像增強,一般是通過計算梯度的幅值來完成。然后,在分割出的行區(qū)域內(nèi),統(tǒng)計列方向藍色像素點的數(shù)量,最終確定完整的文字區(qū)域。 (a)原灰度圖像 (b)直方圖均衡圖3. 3 直方圖均衡處理 對于受噪聲干擾嚴重的圖像,由于噪音點多在頻譜中映射為高頻分量,因此可以通過中值濾波來濾除噪音,但實際中為了簡化算法也可以直接在空域中用求領(lǐng)域平均值得方法來消弱噪音影響。一幅給定圖像的灰度級經(jīng)歸一化處理后,分布在范圍內(nèi)。假設(shè)其排序為:, ()取排好序的序列的中間值作為中心點像素灰度的新值,這里的鄰域通常被稱為窗口。綜上所述。根據(jù)人類色彩感光特性,可以采用以下公式計算得到彩色圖像中各個像素的灰度值。再用模板中的全體像素的平均值來代替原來像素值。在本文中用到了膨脹和開運算這兩個基本運算。腐蝕、膨脹、開啟和關(guān)閉是數(shù)學(xué)形態(tài)學(xué)的基本運算。目前,已經(jīng)提出了很多種方法,一個共同的出發(fā)點是:通過文本的特征來判斷區(qū)域,利用的文本特征主要包括:文本區(qū)域內(nèi)的邊緣灰度直方圖統(tǒng)計“特征”、文本的幾何特征、文本區(qū)域的灰度分布特征、文本區(qū)域水平或垂直投影特征、文本形狀特征和頻譜特征。在本文將文本的定位、定位與提取、作為文本區(qū)域提取整體來討論,包含預(yù)處理、特征提取、分類(定位)、生成候選區(qū)域、文本區(qū)域提取幾個步驟來解決文本區(qū)域的準確提取問題。文本提取技術(shù)對應(yīng)文本特征具體實現(xiàn)方案基于連通分量的技術(shù)顏色、灰度值閾值化方法,顏色聚類,顏色量化
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1