freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

彩色圖像中文本提取的算法研究畢業(yè)論文(存儲(chǔ)版)

2025-07-22 12:44上一頁面

下一頁面
  

【正文】 如下模板所示:例如,如果中心像素x的梯度方向?qū)儆诘?區(qū),則把x的梯度值同它的左上和右下相鄰像素的梯度值比較,看x的梯度值是否是局部極大值。方向和135176。Canny 算子則能較好地體現(xiàn)圖像的弱邊緣[18]。數(shù)學(xué)形態(tài)學(xué)的基礎(chǔ)是二值形態(tài)學(xué),基本運(yùn)算主要為腐蝕、膨脹、開啟和閉合四種。在任何方向?qū)挾炔淮笥?r個(gè)象素的物體將被消除。針對(duì)本文腐蝕運(yùn)算的處理結(jié)果如下圖: 對(duì)邊緣后的圖像進(jìn)行腐蝕化處理 使用同一個(gè)結(jié)構(gòu)元素對(duì)圖像先腐蝕再進(jìn)行膨脹的運(yùn)算稱為開運(yùn)算。確定文本區(qū)域位置后下一步任務(wù)就是進(jìn)行字符切分分離出字符圖像。 在實(shí)際的圖像處理系統(tǒng)中,進(jìn)行圖像二值化的關(guān)鍵使確定合適的閾值,使得字符與背景能夠分割開來,而且二值變換的結(jié)果圖像必須要具備良好的保形性,不丟掉有用的形狀信息,不會(huì)產(chǎn)生額外的空缺等。其次,要進(jìn)行二值圖像的處理與分析,首先要把灰度圖像二值化,得到二值化圖像。文[Wu97]利用了局部閾值來取出背景的噪聲,同時(shí)得到二值化的圖像。閾值方法分為全局閾值和局部閾值兩種,如果分割過程中對(duì)圖像上每個(gè)像素所使用的閾值都相等,則為全局閾值方法;如果每個(gè)像素所使用的閾值可能不同,則為局部閾值方法[28]。由于每一個(gè)區(qū)域所包含的內(nèi)容與其他區(qū)域大相徑庭,因此,必須考慮區(qū)域與區(qū)域之間的關(guān)系以及每一個(gè)小區(qū)域和整幅圖像之間的關(guān)系。因?yàn)槿绻峭ㄟ^文本區(qū)域的話,選擇15 作為閾值是可行的。主要研究成果如下: 、邊緣等特征以及目標(biāo)提取算法的基礎(chǔ)上,首先將圖像灰度化,繼而進(jìn)行邊緣、檢測形態(tài)學(xué)填充,然后對(duì)連通區(qū)域進(jìn)行自適應(yīng)閾值分割,進(jìn)而根據(jù)對(duì)文本字符區(qū)域顏色、通過行掃描邊界,去除非文本區(qū)域。今后工作展望文本所用的算法相較以前的算法有一些改進(jìn),但也存在著一定的局限,例如有一些經(jīng)驗(yàn)閾值需要設(shè)定,對(duì)低分辨率的圖像文字檢測效果不好。 首先,我要感謝我的指導(dǎo)老師趙英亮老師。最后,對(duì)評(píng)審論文的各位專家、學(xué)者表示衷心的感謝!37。s entropy [J],Pattern Recognition, 2004, 37(6): 11491161.[23]Yu Qiao, Qingmao Hua, et al. Thresholding based on variance and intensity contrast [J],Pattern Recognition, 2007, 40(2): 596608.[24][Jain98] , and . Automatic text location in images and video frames. PatternRognition, , , , 1998.[25][Li00] , , and . Automatic text detection and tracking in digital transactions on Image Processing, , , January, 2000.[26][Li99] , and . Text enhancement in digital videos. Recognition and Retrieval, 1999[27][[J],計(jì)算機(jī)應(yīng)用與軟件,2006, 23(4):8587.[28]周德龍,潘泉,[J],中國圖象圖形學(xué)報(bào),2001,6A(4);353358[29][M],電子工業(yè)出版社,2007年[30]侯格賢,畢篤彥,[J],中國圖像圖形學(xué)報(bào),2000, 5A(1):3943致 謝畢業(yè)設(shè)計(jì)結(jié)束了,短短的3個(gè)月的時(shí)間在研究彩色圖像文本提取算法研究的過程中,需要翻閱大量的資料,并進(jìn)行算法的分析與實(shí)驗(yàn)。我們認(rèn)為充分利用文本區(qū)域強(qiáng)烈的空間頻率特征,采用邊緣檢測和二值化閾值結(jié)合的方法,可以較好的指導(dǎo)圖像分割算法完成視頻和彩色圖像文本區(qū)域提取的任務(wù)?;谇懊娴墓ぷ?,最后完成在彩色圖像中文本的提取,如下圖: (a)原圖對(duì)文字區(qū)域定位得到目標(biāo)文本區(qū)域:(b)文字定位文本區(qū)域的提取得到字符串:(c)(文字分割)字符串圖像 本章對(duì)基于邊緣檢測算法的基礎(chǔ)上對(duì)文本的細(xì)定位做了字符的切分,即實(shí)現(xiàn)字符串,通過文本區(qū)域的二值化,去除殘余分量等算法,最后應(yīng)用閾值分割法對(duì)文本塊進(jìn)行行掃描確定文字的上下邊界,達(dá)到文字字符的單獨(dú)提取?;谏线叿治龅奶攸c(diǎn), 現(xiàn)在尋找文本的上下邊界。全局閾值法算法簡單,對(duì)于目標(biāo)和背景明顯分離、直方圖分布呈雙峰的圖像效果良好。文獻(xiàn)[Sobottka99]利用一種非監(jiān)督聚類的方法將圖片中顏色相近的像素聚成若干個(gè)像素類,然后通過一個(gè)自底向上和一個(gè)自頂向下相結(jié)合的方法來完成文字的分割;文[Zhou97]則應(yīng)用了一種基于EMST的聚類方法進(jìn)行顏色的量化[27]。全局閾值是指整個(gè)圖像都使用的一個(gè)閾值;局部閾值則是指根據(jù)圖像的具體區(qū)域來確定的閾值,與全局閾值相比,它的優(yōu)點(diǎn)是能處理亮度和對(duì)比度發(fā)生變化的圖像。將256個(gè)亮度等級(jí)的灰度圖像通過適當(dāng)?shù)拈y值選取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。這是考慮到在實(shí)用系統(tǒng)中,要求處理的速度高、成本低、信息量大的濃淡圖像處理的花銷大。本算法對(duì)彩色圖像中的文本提取具有較高的精確率和較快的運(yùn)算速度,取得了較好的綜合效果。最后得到的圖象就是腐蝕運(yùn)算的結(jié)果。腐蝕運(yùn)算的結(jié)果是沿大圓邊界向內(nèi)減少了r個(gè)象素的寬度,即直徑減少2r。其基本思想是:根據(jù)原圖像目標(biāo)特征選取適合的結(jié)構(gòu)元素,利用結(jié)構(gòu)元素對(duì)原圖像進(jìn)行平移、交、并等運(yùn)算,然后將結(jié)果圖輸出。如果檢測結(jié)果在兩個(gè)閾值之間,則根據(jù)這個(gè)像素的鄰接像素有沒有超過高閾值的邊緣像素,如果有,則它就是邊緣,否則不是[17]。(2)利用導(dǎo)數(shù)算子(如Prewitt算子、Sobel算子)找到圖像灰度沿兩個(gè)方向的導(dǎo)數(shù),并求出梯度的大?。海?)利用(2)的結(jié)果計(jì)算出梯度的方向:。 ()由此得到梯度的大小M和方向O: ()對(duì) Canny算子作如下說明:1. 梯度進(jìn)行“非極大抑制”。(2)定位標(biāo)準(zhǔn)。Log算子的輸出是通過卷積運(yùn)算得到的: () 根據(jù)卷積求導(dǎo)法有: ()一階導(dǎo)數(shù)的邊緣算子有時(shí)會(huì)導(dǎo)致檢測的邊緣點(diǎn)太多,檢測處的邊緣較粗。其基本思想是:首先在一定范圍內(nèi)做平滑濾波,然后利用差分算子檢測在相應(yīng)尺度上的邊緣。圖像的邊緣對(duì)應(yīng)著圖像灰度的不連續(xù)性。取它們的平方和的開方可以獲得性能更一致的全方位的響應(yīng)。下面介紹幾種經(jīng)典的邊緣檢測算子[13]。其文本定位如下圖示: (a)原圖像 (b)梯度分割結(jié)果 圖像定位結(jié)果根據(jù)邊緣是圖像上灰度值的變化最為劇烈的地方,反映為數(shù)學(xué)表達(dá)就是函數(shù)梯度比較大的地方,因此邊緣檢測的思路主要集中在研究比較好的求導(dǎo)算子上面[12]。但我們可以對(duì)圖像根據(jù)不同應(yīng)用特點(diǎn)進(jìn)行識(shí)別前的預(yù)處理,盡最大可能提高文本正確識(shí)別率,這些圖像預(yù)處理包括圖像平滑、傾斜校正、灰度修正等。因?yàn)槭菃握{(diào)增加的,由數(shù)學(xué)分析可知,它的反函數(shù)也是單調(diào)函數(shù)?;叶戎狈綀D是圖像預(yù)處理涉及最廣泛的基本概念之一。 中值濾波中值濾波是基于排序統(tǒng)計(jì)理論的一種能有效抑制噪聲的非線性信號(hào)處理技術(shù)。 ()一般有以下三種方法對(duì)彩色圖像進(jìn)行灰度化: 將彩色圖像中的三分量的亮度作為三個(gè)灰度圖像的灰度值,可根據(jù)應(yīng)用需要選取一種灰度圖像。由于圖像受到種種條件的現(xiàn)實(shí)和干擾,圖像的灰度值往往與實(shí)際景物不完全平匹配,這將直接影響到圖像的后續(xù)處理,如果造成這種影響的原因主要是被攝物體遠(yuǎn)近不同,或是由于曝光不足而使得圖像灰度變化范圍變窄。文字分割的難點(diǎn)在于噪聲合字符粘連,斷裂對(duì)字符的影響。 文本粗定位由攝像機(jī)采集的彩色圖像首先轉(zhuǎn)化為灰度圖像,經(jīng)過灰度均衡變換、Canny邊緣強(qiáng)化,其邊緣得到了勾勒和加強(qiáng)。目前已有不少學(xué)者在這方面進(jìn)行了研究。該部分功能可簡單調(diào)用計(jì)算機(jī)視頻捕捉卡廠商提供的各種軟件開發(fā)包工具即可實(shí)現(xiàn)。目前的研究主要集中于對(duì)人工文本的研究,而場景文本的研究剛剛起步。2. 彩色圖像文本特征分析與提取人們識(shí)別文本的過程不是有規(guī)律的基于邏輯的思維方式,而是一種無規(guī)則的基于直覺的思維方式。并將完整的文字提取系統(tǒng)劃分為文字定位、文字分割和文字識(shí)別三個(gè)階段,指出前兩部分是本文所要解決的問題所在。最后利用字幕屬性特征消除噪聲。王勇等[7]提出一種基于邊緣點(diǎn)密度的視頻字幕自適應(yīng)檢測算法。這種算法只能提取高亮的視頻字幕,而不能提取非高亮度的字幕,而且也會(huì)受到較亮的物體的干擾。若能準(zhǔn)確的將這些文字信息定位出來,并進(jìn)行處理,使之能夠被傳統(tǒng)的OCR軟件識(shí)別并被轉(zhuǎn)化成為機(jī)器內(nèi)碼,結(jié)合自然語言處理,文本檢索,文本翻譯,語音合成等技術(shù)可以被應(yīng)用到各種領(lǐng)域?qū)崿F(xiàn)。在彩色圖像中,文本信息包含了豐富的高層語義信息[1]。彩色圖像中文本提取的算法研究畢業(yè)論文1 緒論隨著互聯(lián)網(wǎng)和多媒體技術(shù)的快速發(fā)展,世界進(jìn)入了一個(gè)嶄新的信息化時(shí)代。 隨著計(jì)算機(jī)技術(shù)、多媒體技術(shù)和通訊技術(shù)的發(fā)展,以圖像、聲音和視頻為主的多媒體信息的應(yīng)用越來越廣泛,圖像中的文本信息對(duì)檢索和瀏覽有十分重要的意義。在各種自然彩色圖像中,往往可以見到各種各樣的文字,這些文字一般和該圖像的語義內(nèi)容相關(guān),或者提供了某種定位輔助信息。算法對(duì)相鄰兩個(gè)視頻幀取差值,在差值圖像中尋找高亮區(qū)域。該算法不能提取灰度值和背景接近的文本。然后利用字幕顏色一致的特征,進(jìn)行鄰域顏色聚類算法,從背景中分離出字幕。論文從課題出發(fā),第一
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1