freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

復雜背景圖像中文本定位算法設(shè)計終稿畢業(yè)論文(留存版)

2025-08-11 13:46上一頁面

下一頁面
  

【正文】 點做平均,并將結(jié)果作為最終的濾波輸出。Canny算子正是基于這三個準則提出來的,其基本思想是先將圖像使用高斯函數(shù)進行平滑,再由一階微分的極大值確定邊緣點。因此,Soble算子對噪聲具有平滑作用,提供較為精確的邊緣方向信息,但是這是由于局部平均的影響,它同時也會檢測出許多的偽邊緣,且邊緣定位精度不夠高。其定義為:+ (31)在數(shù)字圖像中,可用差分近似微分運算,其離散形式為: + (32)也可以寫成: (33)由于拉普拉斯算子是一個二階導數(shù),它將在邊緣處產(chǎn)生一個陡峭的零叉,所以它是一個良好的銳化濾波器?;谶吘壍奈谋径ㄎ环椒?,認為文本與背景之間有一定的對比度,邊緣檢測的方法可以有效的檢測到字符的邊緣,而且文本區(qū)域通常含有較高的邊緣密度。該算法可處理各種大小、類型和排列方向的文字,但是當背景復雜時效果不佳?;谶吘壍姆椒ń?jīng)常根據(jù)文本的水平排列特性進行有效的分析,確認文本區(qū)域。他們先用Haar小波分解得到文本和非文本的紋理特征;然后用1616的窗口掃描整個圖像,采用三層BP神經(jīng)網(wǎng)絡(luò)作為分類器識別分類文本區(qū)域和非文本區(qū)域。但是這種方法容易受到復雜背景的影響,一些類似字符的背景目標很難被區(qū)分,所以準確率相對較低?;谧址伾囊恢滦?,提出了基于區(qū)域的分析方法;基于字符一致排列而呈現(xiàn)一定的紋理特征,提出了基于紋理的文本區(qū)域定位方法;基于文本區(qū)域含有較多的邊緣,提出了基于邊緣的文本定位方法?!∥谋玖鞒潭ㄎ粡碗s背景圖像中的文本定位一般由特征提取、特征分類、特征聚集、候選文本區(qū)域提取和文本區(qū)域驗證等五個步驟組成,如圖21所示。前者幫助我們設(shè)計方法來從圖像中找出候選的文本區(qū)域;后者則從候選區(qū)域中剔除錯誤,找到真正包含文本的區(qū)域。總的來講,有:文本定位、算法集成、算法評價。在文獻[2]中作者提出了9條人工文字的特征,在對輸入圖像做了分割和合并算法之后,根據(jù)9條特征去除非文本區(qū)域,然后將文本區(qū)域按一定的規(guī)則合并成文字區(qū)域,通過紋理分析去除虛假區(qū)域。(3)字符一般由一致寬度的筆畫構(gòu)成,筆畫的密集程度在中文各個字符中并不一致,在英文字符中筆畫的密度變化不是很大。(5)網(wǎng)絡(luò)過濾。近年來,隨著多媒體技術(shù)和計算機網(wǎng)絡(luò)的飛速發(fā)展,全世界的數(shù)字圖像的容量正以驚人的速度增長。其中,基于邊緣檢測的文本定位主要由金字塔分解、基于改進Canny算子的邊緣檢測、邊緣提取和二值化、連通區(qū)域分析、以及文本區(qū)域鑒定與合并幾部分組成。(2)互聯(lián)網(wǎng)應用。文本定位的目的主要可以分為:視頻圖像中的文本定位用于基于內(nèi)容的視頻索、場景圖像中的文本定位用于場景理解等。但對于計算機來說,要完成這個過程就很困難了,因為計算機只能依靠如方差、水平邊緣、垂直邊緣等可以量化的視覺特征,而文字的特征遠不止這些,特別是中國漢字。文獻[6]采用了一種適應性的文本檢測方法,該方法的實驗對象是場景文字(Scene Text),應用多尺度邊緣檢測方法來彌補對比度和噪聲帶來的影響,采用了基于高斯混合顏色模型的搜索策略,對提取出來的候選區(qū)域進行排列分析,該方法對對比度強的場景文字效果比較突出,但是對透明的文字、相對較小的文字效果就不是很理想,并且虛檢率很高。第二章:介紹了復雜背景圖像中文本的類別,文本定位的流程,并對多種復雜背景下文本的定位方法做了詳細介紹、比較和分析。例如,在新聞視頻n引中添加的新聞標題、電影視頻中的字幕等等。因此候選文本區(qū)域會有一些區(qū)域不是文本區(qū)域,需要進一步對它們進行驗證。Lienhart等人把文本區(qū)域看做是顏色相似的連通區(qū)域,用分離和合并算法對圖像進行分割,并把分割得到的太大和太小的塊都去掉;在形態(tài)學膨脹后,再利用相鄰幀的運動估計增強文本提取效果;最后用文本的啟發(fā)性知識濾除非文本區(qū)。他們用三種不同尺度的二階高斯濾波器對圖像濾波,并對濾波后的圖像作非線性變換;變換后的結(jié)果作為每個像素的特征并用Kmeans聚類的方法進行紋理聚類、分割。而且基于紋理的文本定位方法由于假設(shè)文本是一種特殊的紋理,要求字符是成塊的出現(xiàn),字符數(shù)越少越難于進行有效的識別,也容易受復雜圖像中具有紋理特性的背景影響,虛檢率較高。但僅僅利用邊緣很難有效的區(qū)分文本區(qū)域和背景區(qū)域,因為很多的圖像中背景也含有非常多的邊緣。混合的方法對基于區(qū)域、紋理、邊緣的方法進行了融合的嘗試,充分利用這三類定位的優(yōu)點進行融合,是實現(xiàn)魯棒的文本定位的關(guān)鍵,但是如何進行融合、如何提取三類方法中的有效特征并組合到一個框架中是一個難點。所謂P階金字塔模型(pstep Pyramid)是指對原始圖像分辨率逐次進行P次縮小。Sobel提出一種將方向差分運算與局部平均相結(jié)合的方法,即Sobel算子?!』贑anny算子的邊緣檢測經(jīng)典的邊緣檢測算子具有實現(xiàn)簡單、運算速度快等特點,但其檢測受噪聲的影響很大,檢測結(jié)果不可靠,不能準確判定邊緣的存在及邊緣的準確位置,造成這種情況的原因有:(1) 實際的邊緣灰度與理想的邊緣灰度值間存在差異,這類算子可能檢測出多個邊緣。即在圖像I(x,y)的每個像素,I(i,j)的8鄰域里按梯度方向比較梯度幅度,如果在梯度方向上的兩個像素的幅值均小于,I(i,j)的,則其有可能是邊緣像素,否則肯定不是邊緣像素,將其梯度幅度置為0。式(317)中函數(shù)G的作用是確定參與平均的灰度窗口大小。目前圖像二值化方法主要有以下幾種:全局閾值法;局部閾值法;動態(tài)閥值法。后續(xù)操作不斷從堆棧中取出種子段,重復上述操作直到堆棧為空(標記完一個連通區(qū)域)。如果連通域的面積不滿足上式,則它是非文本區(qū)域。第四章  總結(jié) 復雜背景下的文本定位研究對于今天這樣一個信息時代有重要的意義。本文對這一課題進行了研究,具有理論意義與應用價值。對于相交文本框采用合并的方法m。該方法不僅充分利用區(qū)域的鄰域信息,而且一次掃描就可以標記出圖像中所有目標物體,不會出現(xiàn)標號沖突的現(xiàn)象,真正做到了快速、簡單。法,它反映了整個圖像灰度分布情況,如Ostu算法是一種經(jīng)典的整體閾值方但它單一闋值的特性決定了它的抗噪能力較差。由于噪聲與圖像信號,特別是與圖像細節(jié)相比變化較慢,因此噪聲窗口的尺寸可以選得比濾波窗口大。然后將極大值抑制后的圖像按進行兩次閾值處理,將梯度小于閾值的像素灰度置為0。(3)對噪聲都比較敏感。其梯度大小為: (38)或取絕對值: (39)它的卷積算子 1 0 1 1 2 1 2 0 2 0 0 0 1 0 1 1 2 1由上面兩個卷積算子對圖像運算后,代入式(39),可求的圖像的梯度幅值g(x,y),然后適當選取門限TH,作如下判斷:g(x,y)TH,(i,j)為階躍狀邊點,為一個二值圖像,{g(i,j也就是圖像的邊緣圖像。如圖3l中,小的字符在底層子圖上被檢測到,而在高層的子圖上找到了較大的字符,最后的定位結(jié)果中包含了不同大小的文本區(qū)域。復雜背景中的文字相對于其背景來說還是有著自身顯著的特征,充分利用這些特征,尋找行之有效的檢測算法?!∑渌椒ㄊ褂萌N方法(對應三類特征)分別進行文本定位,然后再將這些定位的結(jié)果組合到一起的組合策略為:如果各個文本框之間有80%是重合的就認為是文本區(qū)域,否則再用一個基于SVM的方法進行確認?;诩y理的方法一般很難準確的定位字符區(qū)域的邊框,一般在利用紋理進行定位之后,還需提取定位窗口中的連通分量進行更為準確的定位和抽取。Mao等人利用小波變換檢測圖像紋理,再通過紋理分析進行文本定位。Jain和Yu先把24bits的真彩色圖像降低為6bits的彩色圖像,再用顏色聚類的方法把原圖像分解成不同顏色的子圖像;檢查每幅子圖像中是否包含滿足特定啟發(fā)式搜索的文本;最后將每幅子圖像中檢測到的文本區(qū)域進行合并Sochang 2Pei等人首先用一個SOFM神經(jīng)網(wǎng)絡(luò)對輸入圖像進行顏色量化,然后分析三維彩色直方圖;當某一顏色處的梯度大于閾值時,則認為該顏色可能是文本顏色,并將該顏色所占區(qū)域賦值為1,其它為0,從而得N值子圖像。文本區(qū)域驗證的方法有:用候選文本區(qū)域的高、寬、高寬比和面積進行文本區(qū)域驗證:用候選文本區(qū)域的尺寸、偏心率、飽和度、強度變化與用置信度加權(quán)的排列值(Align Value)進行文本區(qū)域驗證;用候選文本區(qū)域內(nèi)邊緣點的密度進行文本區(qū)域驗證;用候選文本區(qū)域的直方圖分布、字符的結(jié)構(gòu)、字符的排列信息和字符識別進行文本區(qū)域驗證;用支持向量機進行文本區(qū)域驗證。人工文本一般比較規(guī)整,與背景之間具有較大的對比度,為了便于讓人閱讀,字符一般都具有一定的大小,字符的顏色比較一致。首先對圖像進行金字塔分解;然后在Canny算子邊緣檢測的研究基礎(chǔ)上,提出了一種改進的Canny算子;隨后進行連通區(qū)域分析,對文本區(qū)域進行鑒定與合并,定位出候選文本區(qū)域。應用該方法定位出來的文本塊空間位置比較精確,但是該方法有很大的局限性,對于字體很大的文本、對比度小的文本,效果就很差了。諸多因素使得復雜背景圖像中的文本定位成為一項極具挑戰(zhàn)性的研究課題。國外主要有美國的加州大學、IBM公司、MIT以及韓國和日本的主要研究機構(gòu)等。(3)圖像、視頻檢索。進一步,通過將定位出的候選文本區(qū)域運用支持向量機的分類器訓練的方法來提高文本定位的準確性。隨著光學字符識別(OCR)技術(shù)的興起,許多學者開始進行文檔圖像中文字定位與提取的研究。(4)實時處理護照、票據(jù)、身份證等。復雜背景圖像中的文本具有以下的特點:(1)文本區(qū)域中的字符一般成有規(guī)律的排列,字符間隔一致,排列方向一致,一般以水平排列居多。對原來輸入的圖像顏色聚類,如果候選矩形框附近的像素的顏色與候選矩形框內(nèi)的顏色在一個閾值范圍之內(nèi),則將該像素合并到候選矩形框內(nèi)。微軟亞洲研究院也在進行相關(guān)方面的研究,并取得一定的成就。 從上面列出的特征中,我們可以發(fā)現(xiàn)有很多信息幫助我們處理文本。兩者都可以統(tǒng)一在復雜背景圖像的文本定位中?,F(xiàn)在解決特定模式分類問題的關(guān)鍵就是提取有效的目標特征,然后選擇適當?shù)姆诸愃惴?。實驗采用的圖像具有不同分辨率和背景復雜度,其中的文字大小、風格也各不相同,%的準確率。因此,人們提出了基于學習的方法以自動分類紋理?!』谶吘壍奈谋径ㄎ环椒? 基于邊緣的方法,認為文本與背景顏色之間有一定的對比度,通過邊緣檢測的方法可以有效的檢測到字符的邊緣,而且文本區(qū)域通常含有較高的邊緣密度。大尺度的稱為Central Ridge,小尺度的稱為Skeleton Ridge。第三章  基于邊緣檢測的文本定位方法研究 引言從視覺的角度來看,人們在觀察一幅圖像時,最先得到的信息就是圖像的輪廓,也就是圖像的邊緣信息。因此,有必要求出斜率的變化率,即對圖像函數(shù)進行二階微分運算。當使用大的領(lǐng)域時,抗噪聲特性會更好,但這樣做會增加計算量,并且得到的邊緣也比較粗。在線性濾波邊緣檢測方法中,最具代表性的是Canny邊緣檢測方法。因此文本提出一種改進的Canny算法,用中心加權(quán)改進的均值濾波算(CWMTM,Center Weighted Modified Trimmed Mean)取代高斯濾波算法。由于賦予窗口中心點較大的權(quán)重,因此中心加權(quán)算法能更好地保護圖像的細節(jié)。動態(tài)閩值法充分考慮了像元的鄰域特征,能夠根據(jù)圖像的不同背景情況自適應地改變閩值,可較精確地提取出二值圖像,但它過度地夸大了像元的鄰域灰度的變化,會把不均勻灰度分布的背景分割到目標中去,帶來許多不應出現(xiàn)的假目標。本文中將部分包含文本區(qū)域劃分為文本區(qū)域?!嶒灲Y(jié)果利用本章第二節(jié)提出的改進Canny算子邊緣檢測方法可以看出,該算法對復雜背景圖像中的文本定位有不錯的效果,文本區(qū)域幾乎都被定位出來了。首先對圖像進行金字塔分解;然后在Canny算子邊緣檢測的研究基礎(chǔ)上,實現(xiàn)了一種改進的Canny算子;隨后進行連通區(qū)域分析,對文本區(qū)域進行鑒定與合并,定位出候選文本區(qū)域?!”菊滦〗Y(jié) 本章提出了基于圖像邊緣檢測的文本定位方法,在基于Canny算子的邊緣檢測研究的基礎(chǔ)上,提出了一種改進的Canny算子邊緣檢測,實驗結(jié)果證明改進后的算法圖像邊緣檢測準確,細節(jié)處理較好。(3) 去掉矩形框內(nèi)文本區(qū)域面積不合要求的矩形框。算法基本思想:找到連通區(qū)域的第一個目標段標記該段并且壓入堆棧,作為“區(qū)域增長的種子段。邊緣密度圖如圖3—5所示。在分析算法之前,先作如下定義: (316) (317) (318) 其中,表示濾波窗口,表示噪聲統(tǒng)計窗口。這一步實際是一個低通濾波過程,用于消除空尺度小于高斯空間系數(shù)仃的圖像灰度變化。這些算子樣板由理想的邊緣子圖像構(gòu)成,依次用邊緣樣板檢測圖像,與被檢測區(qū)域最為相似的樣板給出最大值。2 4 4 4 2 4 0 8 0 4 4 8 24 8 4 4 0 8 0 4 2 4 4 4 2 圖32 拉普拉斯算子的55模版2)Roberts邊緣檢測由Roberts提出的算子是一種利用局部差分算子尋找邊緣的算子,它在22鄰域上計算對角導數(shù): (34)G(x,y)又稱為Roberts交叉算子,在實際應用中為了簡化計算,用梯度函數(shù)的Roberts絕對值來近似: (35)另外還可以用Roberts最大值來計算: max() (36)上式能夠提供較好的不變性邊緣取向。經(jīng)典的邊緣檢測方法,是對原始圖像中像素的某小鄰域來構(gòu)造邊
點擊復制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1