freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

復(fù)雜背景圖像中文本定位算法設(shè)計(jì)終稿畢業(yè)論文(完整版)

  

【正文】 有很好的魯棒性,并且可在有限的樣本中進(jìn)行訓(xùn)練。另外紋理分析的計(jì)算量大、復(fù)雜度高,所以此類算法比較耗時(shí)。%%的誤檢率。除了以上的方法之外,Tran等人[22],提出了一種利用Ridge定位文本的方法,他們先在兩種不同尺度上提取圖像的Ridge。Liang等采用形態(tài)學(xué)方法,從規(guī)則的背景圖像中提取出文本,而字符形狀幾乎沒(méi)有損耗。由于統(tǒng)計(jì)模型在模式識(shí)別研究中體現(xiàn)的優(yōu)勢(shì),本文通過(guò)將定位出的候選文本區(qū)域運(yùn)用支持向量機(jī)的分類器訓(xùn)練的方法來(lái)提高文本定位的準(zhǔn)確性,取得了不錯(cuò)的效果。圖像灰度的變化情況可以用圖像灰度分布的梯度來(lái)反映,因此我們可以用局部圖像微分技術(shù)來(lái)獲得邊緣檢測(cè)算子。另外,在具有等斜率的寬區(qū)域上,有可能將全部區(qū)域都當(dāng)作邊緣檢測(cè)出來(lái)。常用的高斯一拉普拉斯算子是55的模版,如圖32所示。同時(shí),因?yàn)镾oble算子引入了局部平均,使其受噪聲的影響也比較小。另一種方法是,可以將Prewitt算子擴(kuò)展到八個(gè)方向,即邊緣樣板算子。為解決這一問(wèn)題發(fā)展并產(chǎn)生了平滑濾波邊緣檢測(cè)方法,也就是邊緣檢測(cè)中理論最成熟的線性濾波方法,也稱線性濾波邊緣檢測(cè)算子。所選高斯函數(shù)如下: (311) (312) 其中,是高斯曲線的標(biāo)準(zhǔn)差。越大,噪聲抑制效果越好,圖像越平滑,但是邊界定位也越不精確。將MTM算法的思路推廣可得中心加權(quán)改進(jìn)的均值濾波方法?;谝陨贤茝V公式,可以得出中心加權(quán)改進(jìn)的均值濾波算法的數(shù)學(xué)表達(dá)式為: (319)其中,x為窗口中心像素點(diǎn)的灰度值,w為權(quán)重。窗口的選取與字符的高度密切相關(guān),由于在此之前已經(jīng)做了金字塔分解,所以w可以取一個(gè)固定值13。如經(jīng)典的局部閩值化算法,Bemsen算法,其閨值由考察點(diǎn)鄰域的灰度確定,算法中不存在預(yù)定閾值,適應(yīng)性較整體閾值法廣,但是當(dāng)窗H的寬度較小時(shí),很易出現(xiàn)偽影現(xiàn)象和目標(biāo)的丟失;而當(dāng)窗口寬度增大時(shí),算法的速度將受到很大影響。算法從上往下、從左向右對(duì)圖像進(jìn)行掃描,采用8鄰域連通,如圖36所示:圖36 8鄰域連通圖,可見O點(diǎn),和8點(diǎn)是連通的,其余的點(diǎn)都不連通。圖像金字塔中不同尺度的圖像經(jīng)過(guò)邊緣密度、二值化、連通區(qū)域分析等處理后,得到了不同尺度間不同連通域結(jié)果,這些連通區(qū)域有三種可能:文本區(qū)域,非文本區(qū)域,部分包含文本區(qū)域。則認(rèn)為它是非文本區(qū)域。 (324)其中S(R)表示矩形框R的面積,表示和的相交區(qū)域。但是利用該算法進(jìn)行文本定位時(shí),有些非文本區(qū)域并沒(méi)有剔除,故本文將利用基于邊緣檢測(cè)的文本定位方法得到的候選文本區(qū)域在支持向量機(jī)下進(jìn)行擴(kuò)充,以倬得到較精確的文本區(qū)域。(2) 實(shí)現(xiàn)了一種基于邊緣檢測(cè)的文本定位方法。由于圖像文本的背景往往比較復(fù)雜,目前的研究方向一般都是針對(duì)某一類具體應(yīng)用,例如車牌定位、文檔識(shí)別、視頻檢索等,實(shí)現(xiàn)通用的復(fù)雜背景中的文本檢測(cè)還有很多困難。本文的基于邊緣檢測(cè)的文本定位方法通過(guò)連通區(qū)域分析得到候選文本區(qū)域,然后采用一定的規(guī)則對(duì)這些區(qū)域進(jìn)行鑒定與合并得到定位結(jié)果。文本定位結(jié)果如圖37所示: 圖37 實(shí)驗(yàn)結(jié)果示例3下面舉幾個(gè)誤檢的例子如圖38,39,310所示: 圖38 誤檢示例1 圖39 誤檢示例2 圖310 誤檢示例3本文上述實(shí)驗(yàn)是在Intel(R)Pentium(R)processor 1.40GHz的NfATLAB6 5上實(shí)現(xiàn),對(duì)100幅包含文本的圖像進(jìn)行實(shí)驗(yàn),選擇的實(shí)驗(yàn)樣本盡可能包括了文本定位的各種情況,其中包含光照不均、字跡模糊、文字歪斜等。面積太小的文本區(qū)域極有可能是噪聲區(qū)域,因此本文要求文本區(qū)域面積大于10個(gè)像素點(diǎn)。所有的連通區(qū)域?qū)⒆鳛楹蜻x區(qū)域進(jìn)行進(jìn)一步的處理。檢查當(dāng)前段的上下兩行是否有重疊并且未標(biāo)記的目標(biāo)段。考慮到整體閾值法對(duì)于光照不均、噪聲干擾大的圖像,其二值化效果較差,但其反映了整個(gè)圖像的整體灰度分布情況:而局部閩值法雖然對(duì)光照不均圖像有較好的適應(yīng)性,但局部閡值法容易出現(xiàn)筆劃斷裂及偽影(偽筆劃)現(xiàn)象。為了下一步的連通區(qū)域分析,本文接著對(duì)圖像進(jìn)行二值化處理。實(shí)驗(yàn)結(jié)果如圖34,35所示。式(316)中函數(shù)F的作用是在濾波窗口中選取一個(gè)像素點(diǎn),將其灰度值作為被處理點(diǎn)真實(shí)灰度的近似。中心加權(quán)改進(jìn)的均值濾波算法是對(duì)改進(jìn)的均值濾波算法(MTM,Modified Trimmed Mean)的改進(jìn)。經(jīng)過(guò)高斯濾波,圖像變得平滑,噪聲多被濾掉,設(shè)此時(shí)圖像為I(x,y),然后按照式(313)和式(314)求出圖像每一個(gè)像素的梯度幅度和方向。Canny實(shí)現(xiàn)了評(píng)價(jià)邊緣檢測(cè)性能優(yōu)劣的三個(gè)準(zhǔn)則:(1)信噪比標(biāo)準(zhǔn),即將真實(shí)的邊緣點(diǎn)檢測(cè)出的概率要高,將非邊緣點(diǎn)判為邊緣點(diǎn)的概率要低,使輸出的信噪比最大;(2)定位精度標(biāo)準(zhǔn),即檢測(cè)出的邊緣點(diǎn)要盡可能在實(shí)際邊緣的中心; (3)單邊響應(yīng)標(biāo)準(zhǔn),即單個(gè)邊緣產(chǎn)生多個(gè)響應(yīng)的概率要低,并且虛假邊緣響應(yīng)應(yīng)得到最大抑制。用這個(gè)最大值作為算子的輸出值e(x,y),這樣可將邊緣像素檢測(cè)出來(lái)。Soble算子利用像素點(diǎn)上下、左右相鄰點(diǎn)的灰度加權(quán)算法,根據(jù)在邊緣點(diǎn)處達(dá)到極值這一現(xiàn)象進(jìn)行邊緣的檢測(cè)。對(duì)于同等長(zhǎng)度但取向不同的邊緣,應(yīng)用Roberts最大值算子比應(yīng)用Roberts交叉算子所得到的合成幅度變化小。拉氏(Laplacian)算子是對(duì)二維函數(shù)進(jìn)行運(yùn)算的二階導(dǎo)數(shù)標(biāo)量算子?!〗鹱炙纸庥捎趫D像文本大小經(jīng)常變化,有的單一字符占到整幅圖像面積的50%以上,%。同樣,在圖像處理領(lǐng)域中,圖像的邊緣信息也非常重要,有很多提取圖像邊緣的算法,也有很多的圖像處理算法應(yīng)用圖像的邊緣信息。Hwang[26]等分析了OCR中字符受噪聲干擾的原因采用小波分析方法提取字符,獲得的字符筆畫完整無(wú)損耗。然后用Ridge的長(zhǎng)度限制及兩種Ridge的位置關(guān)系限制來(lái)定位文本區(qū)域。他們用多分辨分析的方法解決字符大小不同的問(wèn)題,對(duì)多分辨分解后不同尺度的圖像進(jìn)行相同的定位算法處理,即先采用一種改進(jìn)的Sobel算子提取邊緣;再用一種局部自適應(yīng)閾值的方法將邊緣圖像轉(zhuǎn)換為二值圖像;然后用投影分析的方法定位文本區(qū)域。由于場(chǎng)景中的文本一般為了能夠使讀者方便閱讀,制作時(shí)文本與背景在顏色上有很大的差別,所以有些研究者假設(shè)文本的邊緣比較陡峭,梯度也較大。大部分方法還是將圖像分為不重疊的子窗口提取子窗口的紋理特性,并進(jìn)行判斷是否為文本區(qū)域。Li等人利用基于學(xué)習(xí)的方法定位圖像中的文字。最后將兩個(gè)神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果加以合并,并結(jié)合投影分析得到牌照的矩形區(qū)域?;趨^(qū)域的文本定位方法對(duì)于具有較大文本與背景對(duì)比度的較大字符相對(duì)有較好的定位效果,實(shí)現(xiàn)簡(jiǎn)單,計(jì)算速度也較快,定位的文本框準(zhǔn)確,并同時(shí)可以提取文本的顏色,方便后續(xù)的文本提取操作。一些門限值需要根據(jù)經(jīng)驗(yàn)來(lái)決定,所以這個(gè)方法通用性不強(qiáng)。大多數(shù)文本定位方法都是利用文本特征進(jìn)行文本的定位?!『蜻x文本區(qū)域提取文本特征聚集形成區(qū)域里有一些明顯不是文本區(qū)域,根據(jù)區(qū)域的高、寬、高寬比、面積和區(qū)域內(nèi)邊緣點(diǎn)的密度可以除去這些噪聲區(qū)域。因此文本后續(xù)的研究中,對(duì)本文將不具體區(qū)分是定位人工文本還是場(chǎng)景文本,僅僅關(guān)注圖像背景的復(fù)雜性。場(chǎng)景文本容易受到光照條件、拍攝設(shè)備參數(shù)的影響,而且方向沒(méi)有任何的限制,字符有可能受到照相機(jī)拍攝角度的影響而發(fā)生形變,文字本身可能與場(chǎng)景中的其它物體發(fā)生相連等情況。通常,我們把這些特征分為兩類來(lái)講:用來(lái)進(jìn)行文本檢測(cè)的特征和用來(lái)驗(yàn)證文本的特征。本文實(shí)現(xiàn)了一種基于邊緣檢測(cè)的文本定位方法,并且將其擴(kuò)展到統(tǒng)計(jì)模型支持向量機(jī)的框架下來(lái)提高文本定位的準(zhǔn)確性,取得了較好的效果。復(fù)雜背景圖像中的文本定位是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)非常具有挑戰(zhàn)性的課題,有著十分廣泛的應(yīng)用前景,設(shè)計(jì)一個(gè)在任何復(fù)雜背景下的文本定位系統(tǒng)是無(wú)數(shù)研究者們追求的夢(mèng)想,但從目前的研究情況來(lái)看,這樣的系統(tǒng)在短期內(nèi)是不可能設(shè)計(jì)出來(lái)的。該方法對(duì)中文、韓文等方形文字有很好的效果。該方法的不足之處在于,如果圖像的對(duì)比度很低,則無(wú)法得到候選區(qū)域;其次如果字符的顏色變化很大,則顏色聚類就沒(méi)有效果。有的字符的背景單一,但是大部分的圖像和視頻中文字的背景都很復(fù)雜的,有很多的自然界中的物體與字符的筆劃很相似,比如樹葉、窗格等,還有一些情況既是背景又是文本。(2)字符一般大于一定的大小,太小的字符因無(wú)法識(shí)別而不去進(jìn)行定位,而字符大小的上限一般沒(méi)有限制。 文本定位研究的現(xiàn)狀復(fù)雜背景圖像中文本定位問(wèn)題的產(chǎn)生,是由于將OCR技術(shù)擴(kuò)展到其它應(yīng)用領(lǐng)域中而產(chǎn)生的問(wèn)題。用掃描、照相等方式獲得它們的數(shù)字圖像后,定位并識(shí)別圖像中的文字可以快速的獲得它們所包含的關(guān)鍵信息。復(fù)雜背景下的文本定位的應(yīng)用:(1)實(shí)時(shí)車牌定位。圖像文本定位作為OCR系統(tǒng)的一個(gè)預(yù)處理部分,對(duì)識(shí)別嵌入在復(fù)雜圖像中的文本具有重要的作用。要提取具有復(fù)雜背景的文本,首先要找到包含文本的區(qū)域,然后才能利用文本識(shí)別模塊進(jìn)行識(shí)別。首先運(yùn)用改進(jìn)的Canny邊緣檢測(cè)算法檢測(cè)出文本邊緣,然后對(duì)檢測(cè)結(jié)果進(jìn)行連通區(qū)域分析、文本區(qū)域鑒定與合并得到候選的文本區(qū)域。目前的計(jì)算機(jī)視覺和人工智能技術(shù)都無(wú)法自動(dòng)對(duì)圖像進(jìn)行標(biāo)注,而必須依賴于人工對(duì)圖像做出標(biāo)注。Web服務(wù)器的數(shù)量正以驚人的速度增長(zhǎng),文本構(gòu)成了Web頁(yè)的重要組成部分,在有的網(wǎng)頁(yè)上圖像中的文字居然占去了總的文字量的一半以上,這個(gè)比例是相當(dāng)驚人的,Web頁(yè)中的圖像包含了許多的像素文本信息?;趫D像內(nèi)嵌文本的語(yǔ)義分析可以實(shí)現(xiàn)基于圖像內(nèi)容的檢索和過(guò)濾。國(guó)內(nèi)外很多的學(xué)術(shù)機(jī)構(gòu)都開展了這一方面的研究工作。但是可能受到光照條件的影響,使顏色差變得很小。圖像文本定位的研究涉及到模式識(shí)別、圖像處理、生理學(xué)、心理學(xué)、認(rèn)知神經(jīng)科學(xué)等,和其它的檢測(cè)技術(shù)、計(jì)算機(jī)人機(jī)交互領(lǐng)域都有著十分密切的聯(lián)系。在文獻(xiàn)[3],[4]中也提出了類似的方法。文獻(xiàn)[7]提出了在YUV顏色空間上的邊緣提取和選擇性二值化文本提取算法,接著對(duì)文本區(qū)域進(jìn)行增強(qiáng)、弱化、噪聲的影響。(2)算法集成:多種算法集成難點(diǎn)主要在于集成方案選取上,即如何制訂不同算法的選擇策略,這將影響到整個(gè)系統(tǒng)的性能,另外還有一個(gè)必須要考慮的因素就是盡可能快的處理速度。第三章:實(shí)現(xiàn)了一種基于邊緣檢測(cè)的文本定位方法。復(fù)雜背景通常比簡(jiǎn)單背景要求更強(qiáng)的對(duì)比度來(lái)保證文本的可讀。人工本不是拍攝場(chǎng)景的一部分,被認(rèn)為是后期添加的結(jié)果。 文本特征選擇文本具有尺寸、顏色與灰度值、邊緣、紋理、對(duì)比度、排列方式、符間隙、運(yùn)動(dòng)、穩(wěn)定性、背景變化、陰影和透明效果等特征,應(yīng)該選那些容易把文本與背景區(qū)分開來(lái)的特征,以使文本與背景在特征空間內(nèi),類間距離較大而類內(nèi)距離較小。文本區(qū)域驗(yàn)證可以使用更多的特征,采用更嚴(yán)格的限制條件。根據(jù)不同的顏色分割方法,不同的確認(rèn)字符連通分量的方法,以及是否利用規(guī)則方法或者機(jī)器學(xué)習(xí)的方法,得到了各種基于區(qū)域的文本定位方法。他們的實(shí)驗(yàn)對(duì)象為2247幀視頻圖像,實(shí)驗(yàn)表明該算法能提取視頻幀中86%100%的標(biāo)題文本?!』诩y理的文本定位方法基于紋理的文本定位方法認(rèn)為文本具有特定的紋理屬性,這種紋理是由于字符特定的排列方向以及字符顏色與背景顏色周期性變化而產(chǎn)生。由于該方法是基于不同尺度紋理檢測(cè)的方法,因此對(duì)圖像分辨率高低不敏感,但是處理速度較慢。由于通過(guò)紋理檢測(cè)所得到的文本區(qū)域不夠準(zhǔn)確,最后再對(duì)候選文本區(qū)進(jìn)行水平和豎直的投影分析,以進(jìn)一步確認(rèn)文本區(qū)域。但是這類方法能夠很好的對(duì)很小的字符進(jìn)行有效的定位。該方法對(duì)噪聲不敏感,能夠定位不同排列方向的文本,包括傾斜和彎曲的文本。所以一般來(lái)說(shuō)基于邊緣的方法對(duì)文本非常密集(圖像中的人工文本)的圖像有較好的效果。Jun等利用灰度圖像局部領(lǐng)域技術(shù)識(shí)別復(fù)雜場(chǎng)景下的字符,%。 本章小結(jié)復(fù)雜背景中的文字背景是復(fù)雜多變的,本文區(qū)域定位是復(fù)雜背景中文字識(shí)別的首要環(huán)節(jié),隨著文字識(shí)別技術(shù)的逐步成熟和發(fā)展,復(fù)雜背景中文本區(qū)域定位已成為文字識(shí)別應(yīng)用推廣的瓶頸。本文針對(duì)圖像中文本定位問(wèn)題首先對(duì)圖像進(jìn)行金字塔分解,然后利用改進(jìn)的Canny算子對(duì)文本進(jìn)行邊緣檢測(cè),連通區(qū)域分析,最后定位出候選文本區(qū)域。例如,4階金字塔模型,總共對(duì)圖像縮小4次,在每一階都將原來(lái)圖像長(zhǎng)寬縮小為原來(lái)的1/,對(duì)每一階子圖分別采用相同的文本定位算法,然后將不同子圖上檢測(cè)到的文本區(qū)域放大到原始圖像大?。詈缶C合每幅子圖的定位結(jié)果就可以找出大小不同的文本區(qū)域。因此,它比較少直接用于邊緣檢測(cè),而主要用于已知邊緣像素后確定該像素是在圖像的黑暗區(qū)還是明亮區(qū)。該算子是在以f(x,y)為中心的33鄰域上計(jì)算x和y方向的偏導(dǎo)數(shù),即: (37) 實(shí)際上,上式應(yīng)用了f(x,y)鄰域圖像強(qiáng)度的加權(quán)平均差值。4)Prewitt 邊緣檢測(cè)方法Prewitt 提出了類似的計(jì)算偏微分估計(jì)值得方法 (310)梯度計(jì)算則與(39)相同。(2)邊緣存在的尺度范圍各不相同,這類算子固定的大小不利于檢測(cè)出不同尺度上的所有邊緣。通過(guò)使用兩個(gè)閾值來(lái)分別檢測(cè)強(qiáng)邊緣和弱邊緣,而且僅當(dāng)強(qiáng)邊緣和弱邊緣相連時(shí),弱邊緣才會(huì)包含在輸出中。根據(jù)一定算法得到低閾值,在這里可以根據(jù)圖像的梯度直方圖計(jì)算。標(biāo)準(zhǔn)MTM算法中m取為高斯噪聲標(biāo)準(zhǔn)差的2倍。由于窗口大小與高斯噪聲的標(biāo)準(zhǔn)差密切相關(guān),因此從某種意義上說(shuō),G是在噪聲窗口內(nèi)估計(jì)高斯噪聲的標(biāo)準(zhǔn)差。 邊緣提取和二值化在復(fù)雜背景文本圖像中,無(wú)論是背景區(qū)域還是文本區(qū)域,其邊緣都比較突出,很難從邊緣強(qiáng)度上區(qū)分是背景的邊緣還是文本的邊緣。全局閾值化方法實(shí)現(xiàn)簡(jiǎn)單,對(duì)于具有明顯雙峰直方圖的圖像效果明顯,但對(duì)于低對(duì)比度和光照不均勻的圖像效果不佳,抗噪能力差,因而應(yīng)用范圍受到極大限制。本文采用一種基于區(qū)域增長(zhǎng)法和線標(biāo)記法的方法。接著搜索圖像中下一個(gè)未標(biāo)記的連通區(qū)域,重復(fù)上述操作直到圖像中所有的連通區(qū)域標(biāo)記完畢。h8w12 (321)其中H為整幅圖像的高、W為寬,h為方框的高、W為寬。經(jīng)過(guò)鑒別后,大量的不滿足條件的連通區(qū)域被去除,對(duì)于剩下的連通域,如果相互之間的位置關(guān)系滿足一定的關(guān)系,我們則把它合并起來(lái),組合成一個(gè)更大的、更有意
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1