freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

彩色圖像中文本提取的算法研究畢業(yè)論文-展示頁

2025-07-01 12:44本頁面
  

【正文】 細定位在獲得文本粗定位后,利用彩色圖像的彩色分割方法。數學形態(tài)學的應用可以簡化圖像數據,保持它們基本的形態(tài)特征,并除去不相干的結構。 文本粗定位由攝像機采集的彩色圖像首先轉化為灰度圖像,經過灰度均衡變換、Canny邊緣強化,其邊緣得到了勾勒和加強。在粗定位階段中采用了基于數學形態(tài)學的定位方法,在得到定位圖像后進行細定位,在細定位中采用顏色特征的方法以獲得最后定位圖像。這些方法各有優(yōu)缺點,本文結合數學形態(tài)學的特征和邊緣檢測對文本進行定位,對于提高文本定位準確率提供更有利的保障。(2) 基于邊緣檢測的定位方法,這種方法是利用文本區(qū)域豐富的邊緣特征進行文字定位[11],能夠進行檢測的方法有多種,如Roberts 邊緣算子、Prewitt 算子、Sobel 算子以及拉普拉斯邊緣檢測;(3) 基于顏色特征的定位方法,這種方法主要是應用圖像的紋理特征、形狀特征和顏色特征即利用字符和底色具有明顯的反差特征來排除干擾進行文字的定位;(4) 基于數學形態(tài)學的定位方法,這種方法是利用數學形態(tài)學圖像處理的基本思想,利用一個結構元素來探測一個圖像,看是否能將這個結構元素很好的填放在圖像內部,同時驗證填放元素的方法是否有效。目前已有不少學者在這方面進行了研究。但我們可以對圖像根據不同應用特點進行識別前的預處理,盡最大可能提高文本正確識別率,這些圖像預處理包括圖像平滑、傾斜校正、直方圖均衡化、灰度修正等。 圖像預處理根據三基色原理,世界上任何色彩都可以由紅綠藍(RGB)三色不同比例的混合來表示,如果紅綠藍(RGB)三個信號分別由一個字節(jié)表示,則該圖像顏色位數就達到二十四位真彩,也就是說在二十四位真彩的數字圖像中每個像素點由三個字節(jié)來表示,根據數字圖像水平和垂直方向像素點數(即圖像分辨率)可計算出一幅圖像實際位圖大小。首先要對采集到的圖像進行預處理,而文本定位又決定其后的文本字符識別,因此文本域定位是關鍵,文本區(qū)域定位就是從包含整個圖像中找到文本所在區(qū)域的位置。該部分功能可簡單調用計算機視頻捕捉卡廠商提供的各種軟件開發(fā)包工具即可實現。本文主要介紹文字定位和文字分割。彩色圖像文本提取流程如下圖所示。在本文將文本的定位、定位與提取、作為文本區(qū)域提取整體來討論,包含預處理、特征提取、分類(定位)、生成候選區(qū)域、文本區(qū)域提取幾個步驟來解決文本區(qū)域的準確提取問題。目前的研究主要集中于對人工文本的研究,而場景文本的研究剛剛起步。由于存在這些難點,才使得圖像文字提取成為一個值得深入研究的課題。相比之下,如何準確的將文字區(qū)域提取出來目前還處于探索階段。目前存在的很多圖像文本提取技術有很強的針對性,對于不同的文本特征。2. 彩色圖像文本特征分析與提取人們識別文本的過程不是有規(guī)律的基于邏輯的思維方式,而是一種無規(guī)則的基于直覺的思維方式。第五章介紹文字分割典型的常見手法并且加以比較,針對彩色圖像中文本定位提取的問題,對文本區(qū)域進行字符提取,成功提取出單個字符串。應用了基于彩色圖像的canny算子邊緣的方法。第三章文本預處理,主要介紹了對文本的灰度化,直方均衡,和圖像降噪等等,使提取出來的圖像對后面的文本細定位做了準備。并將完整的文字提取系統劃分為文字定位、文字分割和文字識別三個階段,指出前兩部分是本文所要解決的問題所在。對圖像中文字的提取首先確定包含文字的圖像區(qū)域,濾除非文本背景的干擾,把彩色圖像中的文本區(qū)域定位出來,這是文字提取工作中最難、最關鍵的環(huán)節(jié),確定包含文字圖像的區(qū)域后,利用文本特征制定啟發(fā)式規(guī)則,濾除非文本區(qū)域,得到二值化文本字符,為了方便后面的文字抽取,在字符抽取前進行一次文字區(qū)域圖像質量的改善也很有必要,對文字提取后,最終采用OCR技術對字符進行識別。在各種彩色圖像中,往往可以見到各種各樣的文字,這些文字一般和該圖像的語義內容相關,或者提供了某種定位輔助信息。處理圖像的時間較長。最后利用字幕屬性特征消除噪聲。首先,通過小波變換計算視頻中的局部能力特征,能量高的區(qū)域作為候選字幕區(qū)域。郭麗等[8]提出一種基于顏色邊緣點和游程平滑的視頻文本提取算法。該算法的優(yōu)點是可以檢測出各種字體大小的文本行。王勇等[7]提出一種基于邊緣點密度的視頻字幕自適應檢測算法。首先提取視頻幀的灰度邊緣,然后合并相鄰的邊緣,生成候選文本區(qū)域,最后用一些啟發(fā)式規(guī)則來去除虛假的文本區(qū)域。這種算法實質上類似于基于灰度邊緣的算法等。該算法是基于單個視頻幀圖像的字幕提取,效果并不明顯。這種算法只能提取高亮的視頻字幕,而不能提取非高亮度的字幕,而且也會受到較亮的物體的干擾。Boon Lock Yeo[3]提出利用場景變化來檢測視頻文本的出現和消失。最后通過對比度的分析,形狀分析等去除非文本的連通元。首先對視頻幀使用分裂—合并算法,將視頻幀分解成顏色一致的連通元(connected ponent)。若能準確的將這些文字信息定位出來,并進行處理,使之能夠被傳統的OCR軟件識別并被轉化成為機器內碼,結合自然語言處理,文本檢索,文本翻譯,語音合成等技術可以被應用到各種領域實現。目前已有的文本區(qū)域提取方法大致可以分為四類:(1)基于邊緣的方法(2)基于紋理的方法(3)基于連通域的方法(4)基于學習的方法。但自然場景中的文本分割依然面臨著許多復雜的問題,主要原因是:(1)文字和其他自然景物混雜在一起,如樹、窗戶和房屋建筑等,背景復雜;(2)文字的顏色多種多樣;(3)文字的字體和大小復雜多變;(4)光照的變化等。如果這些文字信息能自動準確的被檢測、分割、識別出來,則對圖像高層語義的自動理解、索引和檢索是非常有價值的。在彩色圖像中,文本信息包含了豐富的高層語義信息[1]。 因此,將圖像中的文本提取出來將便于不停國家,不同文化之間的交流。彩色圖像中的文本提取即為彩色圖像中文本定位,是很困難的問題。最近幾年以來隨著既有拍照功能的便攜式電子設備,比如智能手機,平板電腦等,隨著技術的不斷更新升級,人們急需一種方便的應用程序來提取處理圖像中內嵌的文本信息。彩色圖像中文本提取的算法研究畢業(yè)論文1 緒論隨著互聯網和多媒體技術的快速發(fā)展,世界進入了一個嶄新的信息化時代。以圖像、動畫、視頻為主要元素的各種多媒體信息構成了信息傳播的主力。這都使得彩色圖像下的文本的提取成為一個很有意義的研究課題。由于其廣泛的應用領域越來越受到人們的重視。 隨著計算機技術、多媒體技術和通訊技術的發(fā)展,以圖像、聲音和視頻為主的多媒體信息的應用越來越廣泛,圖像中的文本信息對檢索和瀏覽有十分重要的意義。文本可以作為圖像的內容標識和索引,是圖像內容重要程度的判斷依據,例如出現醒目文字的幀,可以抽取出來作為對應的圖像的代表幀。隨著技術的不斷發(fā)展,人們對彩色圖像中文字提取進行了廣泛的研究,并已有許多成熟的技術應用在各個領域,如交通管理中的汽車牌照識別和港口貨物管理的集裝箱編碼識別等。因此從自然場景圖像中提取文本是一項極具挑戰(zhàn)性的工作。在各種自然彩色圖像中,往往可以見到各種各樣的文字,這些文字一般和該圖像的語義內容相關,或者提供了某種定位輔助信息。針對圖像、視頻文本檢測和提取的研究,主要有以下算法:Rainer Lienhart[2]利用文字顏色的單一性、文本區(qū)域的大小約束、同一文本會在連續(xù)幾個視頻幀出現等特點,對文本進行檢測和定位。然后通過匹配算法,對連通元進行多幀跟蹤,去除那些沒有連續(xù)多幀出現的連通元。該算法要對每一個視頻幀進行分裂合并算法,而且視頻中生成的連通元絕大部分都不會是文本,因此算法復雜度太高,系統效率低。算法對相鄰兩個視頻幀取差值,在差值圖像中尋找高亮區(qū)域。Byung[4]提出用字符的拓撲結構特征來提取字符文本區(qū)域,然后對視頻字幕區(qū)域進行復原。Marco Bertin{5]利用角點特征來進行的視頻字幕檢測。王辰等[6]等通過灰度邊緣檢測來定位文本區(qū)域。該算法不能提取灰度值和背景接近的文本。采用基于邊緣檢測的方法,結合文字圖像區(qū)域本身的特點,在對原圖像進行邊緣檢測和形態(tài)學膨脹后,對其在水平和垂直方向的邊緣密度投影采用一種自適應的檢測算法,從而檢測得到字幕圖像區(qū)域。但是算法不能提取灰度值和背景接近的文本。黃曉東等[15]綜合應用小波變換和顏色聚類技術來提取視頻幀中的字幕區(qū)域。然后利用字幕顏色一致的特征,進行鄰域顏色聚類算法,從背景中分離出字幕。但是該算法容易受到顏色一致的物體的干擾。 課題的主要目標就是在彩色圖像下提取文本信息,二值化分割進而識別文字這一特定語義對象。若能準確的將這些文字信息定位出來,并進行處理,使之能夠被傳統的OCR軟件識別并被轉化成為機器內碼,結合自然語言處理,文本檢索,文本翻譯,語音合成等技術可以被應用到各種應用領域。論文從課題出發(fā),第一章緒論中闡述了彩色圖像中文本信息提取的四種方式,然后比較對于不同場景和復雜背景各種方式的可操作性。第二章主要介紹了文本定位與提取方法綜述,簡單的介紹文本提取原理,對文本粗提取與細提取的步驟進行了闡述。第四章結合邊緣檢測和數學形態(tài)學特征對文字進行定位,邊緣檢測算法中5種算子的比較,基于邊緣的圖像文本處理技術。結合數學形態(tài)學中各種運算做了文本細定位。第六章展望與總結。目前電腦還達不到模擬人類直覺思維方式的水平,它只能利用大量的運算來逼近人們的類比識別過程,因此某一些特定的數學運算并不足以適應多種情況下大的需要,并且對于圖像中的目標文本而言,文本不單單以一種特定形式表現,而是根據不同的情況存在有不同的表現方式,比如顏色、梯度、紋理、邊緣等等。文本提取技術對應文本特征具體實現方案基于連通分量的技術顏色、灰度值閾值化方法,顏色聚類,顏色量化基于邊緣的技術邊緣和梯度邊緣檢測算子基于紋理的技術紋理和梯度Kmean方法基于學習的技術像素灰度值、彩色梯度神經網絡,支持向量機目前文字識別各種技術相對成熟并已經投入實際應用。其主要的難點在于:文本存在于復雜背景之中難以區(qū)分;文本存在嚴重的形變和幾何畸變;自然環(huán)境下由于照度的不均勻、陰影、反射等原因
點擊復制文檔內容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1