【正文】
目 錄摘 要 IIIAbstract IV第一章 緒 論 1 圖像與數(shù)字圖像 1 數(shù)字圖像處理技術(shù)內(nèi)容與發(fā)展現(xiàn)狀 2 灰度圖像二值化原理及意義 4第二章 軟件工具——MATLAB 6 MATLAB概述 6 MATLAB的工作環(huán)境 6 MATLAB圖像處理工具箱 8 工具箱實(shí)現(xiàn)的常用功能 9第三章 圖像二值化方法 11 課題研究對(duì)象 11 二值化方法研究動(dòng)態(tài) 13 全局閾值法 18 局部閾值法 18第四章 Otsu方法和Bernsen方法 20 Otsu算法分析 20 Otsu方法流程圖 22 Bernsen算法分析 23 Bernsen方法流程圖 23第五章 Otsu方法和Bernsen方法實(shí)驗(yàn)比較 25 Otsu方法實(shí)驗(yàn)結(jié)果分析 25 Bernsen方法結(jié)果分析 27 0tsu方法和Bernsen方法實(shí)驗(yàn)結(jié)果比較 28 結(jié)論 29結(jié)束語(yǔ) 31參考文獻(xiàn) 32致 謝 33附錄:源代碼 34摘 要在人類獲取的信息中,視覺(jué)信息約占60%,聽(tīng)覺(jué)約占20%,其它約占20%。由此可見(jiàn),視覺(jué)信息對(duì)人類非常重要。同時(shí),圖像是人類獲取視覺(jué)信息的主要途徑。圖像二值化是圖像預(yù)處理中的一項(xiàng)重要技術(shù),在模式識(shí)別、光學(xué)字符識(shí)別、醫(yī)學(xué)成像等方面都有重要應(yīng)用。論文介紹了圖像及數(shù)字圖像處理技術(shù)的一些概念和相關(guān)知識(shí); 軟件的發(fā)展和軟件在圖像處理中的應(yīng)用做了簡(jiǎn)要介紹;。課題重點(diǎn)實(shí)現(xiàn)了圖像分割技術(shù)中灰度圖像二值化方法,如Otsu算法、Bernsen算法,并對(duì)這些算法運(yùn)行的實(shí)驗(yàn)結(jié)果進(jìn)行分析與比較。 關(guān)鍵詞:圖像處理,二值化,Matlab,Otsu算法,Bernsen算法 AbstractHuman beings obtain a lot of information, among which the visual information is about 60%, the sense of hearing about 20%, and others about 20%. Therefore, the visual information is very important for human beings. Moreover, the images are the primary way, by which a lot of information is obtained. Image binarization, as an important technology in image preprocessing, is widelyemployed in pattern recognition, optical character recognition, medical imaging and so forth. In this paper, some notions and relative knowledge in digital image processing technology are introduced。 then, the development of and its application in image processing briefly introduced。 in addition, the method of grayscale image binarization and how to implement these algorithms based on are presented. This paper mainly implements the grayscale image binarization method in image segmentation technology, such as Otsu algorithm and Bernsen algorithm, and analyzes and pares the experimental results of the above algorithms.Keywords: Image processing, Binarization, Matlab, Otsu algorithm, Bernsen algorithm第一章 緒 論 圖像與數(shù)字圖像圖像就是用各種觀測(cè)系統(tǒng)觀測(cè)客觀世界獲得的且可以直接或間接作用與人眼而產(chǎn)生視覺(jué)的實(shí)體。視覺(jué)是人類從大自然中獲取信息的最主要的手段。拒統(tǒng)計(jì),在人類獲取的信息中,視覺(jué)信息約占60%,聽(tīng)覺(jué)信息約占20%,其他方式加起來(lái)才約占20%。由此可見(jiàn),視覺(jué)信息對(duì)人類非常重要。同時(shí),圖像又是人類獲取視覺(jué)信息的主要途徑,是人類能體驗(yàn)的最重要、最豐富、信息量最大的信息源。通常,客觀事物在空間上都是三維的(3D)的,但是從客觀景物獲得的圖像卻是屬于二維(2D)平面的。圖像存在方式多種多樣,可以是可視的或者非可視的,抽象的或者實(shí)際的,適于計(jì)算機(jī)處理的和不適于計(jì)算機(jī)處理的。但就其本質(zhì)來(lái)說(shuō),可以將圖像分為以下兩大類。模擬圖像。包括光學(xué)圖像、照相圖像、電視圖像等。比如人在顯微鏡下看到的圖像就是一幅光學(xué)模擬圖像。對(duì)模擬圖像的處理速度快,但精度和靈活性差,不易查找和判斷。數(shù)字圖像。數(shù)字圖像是將連續(xù)的模擬圖像經(jīng)過(guò)離散化處理后得到的計(jì)算機(jī)能夠辨識(shí)的點(diǎn)陣圖像。在嚴(yán)格意義上講,數(shù)字圖像是經(jīng)過(guò)等距離矩形網(wǎng)格采樣,對(duì)幅度進(jìn)行等間隔量化的二維函數(shù)。因此,數(shù)字圖像實(shí)際上就是被量化的二維采樣數(shù)組。一幅數(shù)字圖像都是由若干個(gè)數(shù)據(jù)點(diǎn)組成的,每個(gè)數(shù)據(jù)點(diǎn)稱為像素(pixel)。比如一幅256400,就是指該圖像是由水平方向上256列像素和垂直方向上400行像素組成的矩形圖。每一個(gè)像素具有自己的屬性,如顏色(color)、灰度(gray scale)等,顏色和灰度是決定一幅圖像表現(xiàn)里的關(guān)鍵因素。其中顏色量化等級(jí)包括單色、四色、16色、256色、24位真彩色等,量化等級(jí)越高,則量化誤差越小,圖像的顏色表現(xiàn)力越強(qiáng)。同樣,灰度是單色圖像中像素亮度的表征,量化等級(jí)越高,表現(xiàn)力越強(qiáng)。但是隨著量化等級(jí)的增加,數(shù)據(jù)量將大大增加,使得圖像處理的計(jì)算量和復(fù)雜度相應(yīng)的增加。與模擬圖像相比,數(shù)字圖像具有以下顯著優(yōu)點(diǎn):(1) 精度高。目前的計(jì)算機(jī)技術(shù)可以將一幅模擬圖像數(shù)字化為任意的二維數(shù)組,即數(shù)字圖像可以由無(wú)限個(gè)像素組成,每個(gè)像素的亮度可以量化為12位(即4096個(gè)灰度級(jí)),這樣的精度是數(shù)字圖像處理與彩色照片的效果相差無(wú)幾。(2) 處理方便。數(shù)字圖像在本質(zhì)上是一組數(shù)據(jù),所以可以用計(jì)算機(jī)對(duì)他進(jìn)行任意方式的修改,如放大、縮小、改變顏色、復(fù)制和刪除某一部分等。(3) 重復(fù)性好。模擬圖像,如照片,即便是使用非常好的底片和相紙,也會(huì)隨著時(shí)間的流逝而褪色、發(fā)黃,而數(shù)字圖像可以存儲(chǔ)在光盤(pán)中,上百年后再用計(jì)算機(jī)重現(xiàn)也不會(huì)有絲毫的改變。 數(shù)字圖像處理技術(shù)內(nèi)容與發(fā)展現(xiàn)狀數(shù)字圖像處理就是采用一定的算法對(duì)數(shù)字圖像進(jìn)行處理,以獲得人眼視覺(jué)或者某種接受系統(tǒng)所需要的圖像處理過(guò)程。圖像處理的基礎(chǔ)是數(shù)字,主要任務(wù)是進(jìn)行各種算法設(shè)計(jì)和算法實(shí)現(xiàn)。目前,圖像處理技術(shù)已經(jīng)在許多不同的應(yīng)用領(lǐng)域中得到重視,并取得了巨大成就。根據(jù)應(yīng)用領(lǐng)域要求的不同,數(shù)字圖像處理技術(shù)可以分為許多分支技術(shù)。重要的分支技術(shù)有:(1) 圖像變換。圖像陣列很大時(shí),若直接在空域中處理,計(jì)算量將很大。為此,通常采用各種圖像變換方法,如傅立葉變換、沃爾什變換、離散余弦變換、小波變換等間接處理技術(shù),將空域處理轉(zhuǎn)換到變換域處理,這樣可以有效地減少計(jì)算量,提高處理性能。(2) 圖像增強(qiáng)與復(fù)原。主要目的是增強(qiáng)圖像中的有用信心,削弱干擾和噪聲,使圖像更加清晰,或者將其轉(zhuǎn)換為更適合人或機(jī)器分析的形式。圖像增強(qiáng)并不是要求真實(shí)地反映原始圖像,而圖像復(fù)原則要求盡量消除或減少獲取圖像過(guò)程中所產(chǎn)生的某些退化,使圖像能夠反映原始圖像的真實(shí)面貌。(3) 圖像壓縮編碼。在滿足一定保真度條件下,對(duì)圖像信息進(jìn)行編碼,可以壓縮圖像信息量,簡(jiǎn)化圖像的邊式,從而大大壓縮圖像描述的數(shù)據(jù)量,以便存儲(chǔ)和傳輸;圖像壓縮在不同應(yīng)用背景下可以采用不失真壓縮和失真壓縮。(4) 圖像分割。圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一,是為了將圖像中有意義的特征提取出來(lái)。它是進(jìn)一步進(jìn)行圖像識(shí)別、分析和理解的基礎(chǔ)。圖像的有意義特征包括圖像的邊緣、區(qū)域等。(5) 圖像分析。對(duì)圖像中的不同對(duì)象進(jìn)行分割、分類、識(shí)別、描述和解釋。(6) 圖像識(shí)別。圖像識(shí)別屬于模式識(shí)別的范疇,起主要內(nèi)容是在圖像經(jīng)過(guò)某些預(yù)處理(增強(qiáng)、復(fù)原、壓縮)后,進(jìn)行圖像分割和提取,從而進(jìn)行判別分類。圖像分類常用的經(jīng)典識(shí)別方法有統(tǒng)計(jì)模式分類和句法模式分類。近年來(lái),新發(fā)展起來(lái)的模糊模式識(shí)別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識(shí)別中越來(lái)越受到重視。(7) 圖像隱藏。是指媒體信息的相互隱藏,常見(jiàn)的有數(shù)字水印和圖像的信息偽裝等。以上圖像處理內(nèi)容也并非孤立存在的,往往相互聯(lián)系,而一個(gè)實(shí)用的圖像處理系統(tǒng)通常需要將幾種圖像處理技術(shù)結(jié)合起來(lái),才能得到所需要的結(jié)果。例如,圖像變換是圖像編碼技術(shù)的基礎(chǔ),而圖像增強(qiáng)與復(fù)原一般又是圖像處理的最終目的,也可以作為進(jìn)一步圖像處理工作的準(zhǔn)備;通過(guò)圖像分割得到的圖像特征既可以作為最后結(jié)果,也可以作為下一步圖像分析的基礎(chǔ)。不同的圖像處理技術(shù)應(yīng)用與不同的領(lǐng)域,發(fā)展出不同的分支學(xué)科,如遙感圖像處理、醫(yī)學(xué)圖像處理等,其他如計(jì)算機(jī)圖形學(xué)、模式識(shí)別、人工智能和機(jī)器人視覺(jué)等學(xué)科領(lǐng)域也與圖像處理有著密切的關(guān)系。圖像處理技術(shù)的發(fā)展大致經(jīng)歷了初創(chuàng)期、發(fā)展期、普及期和實(shí)用化期4個(gè)階段。初創(chuàng)期開(kāi)始與20世紀(jì)60年代,當(dāng)時(shí)的圖像采用像素型光柵進(jìn)行少秒顯示,大多采用中、大型機(jī)對(duì)其處理。在這一時(shí)期,由于圖像存儲(chǔ)成本高、處理設(shè)備昂貴,其應(yīng)用面很窄。進(jìn)入20世紀(jì)70年代的發(fā)展期,開(kāi)始大量采用中、小型機(jī)進(jìn)行處理,圖像處理也逐漸改用光柵掃描方式,特別是CT和衛(wèi)星遙感圖像的出現(xiàn),對(duì)圖像處理技術(shù)的發(fā)展起到了很好的推動(dòng)作用。到了20世紀(jì)80年代,圖像處理技術(shù)進(jìn)入普及期,此時(shí)的微機(jī)已經(jīng)能夠擔(dān)當(dāng)起圖形圖像處理的任務(wù)。超大規(guī)模集成電路(Very Large Scale Integration, VLSI)的出現(xiàn)更使處理速度大大提高,設(shè)備造價(jià)也進(jìn)一步降低,極大地促進(jìn)了圖形圖像系統(tǒng)的普及和應(yīng)用。20世紀(jì)90年代是圖像處理技術(shù)的實(shí)用化時(shí)期,圖像處理的信息量巨大,對(duì)處理速度的要求極高。針對(duì)現(xiàn)有的實(shí)際應(yīng)用,數(shù)字圖像處理具有以下特點(diǎn)。(1) 信息量大,要求處理速度比較快。目前,數(shù)字圖像處理的信息大多是二維信息,處理信息量很大。比如一幅256256低分辨率的黑白圖像,要求64Kbit的數(shù)據(jù)量;對(duì)高分辨率彩色512512圖像,則要求256Kbit數(shù)據(jù)量;如果要處理30幀/s的視頻圖像,則每秒要求處理500Kbit~。因此對(duì)計(jì)算機(jī)的計(jì)算速度、存儲(chǔ)容量等要求較高。(2) 占用頻帶較寬。與語(yǔ)音信息相比,數(shù)字圖像占用的頻帶要大幾個(gè)數(shù)量級(jí)。如電視圖像的帶寬約56MHz,而語(yǔ)音帶寬僅為4KHz左右。所以數(shù)字圖像在成像、傳輸、存儲(chǔ)、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本高,且對(duì)頻帶壓縮技術(shù)提出了更高的要求。(3) 數(shù)字圖像中各個(gè)像素間的相關(guān)性強(qiáng),壓縮潛力大。在圖像畫(huà)面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫(huà)面而言,同一行中相鄰兩個(gè)像素或相鄰兩行間的像素。一般而言,相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性還要大。因此,圖像處理中的信息壓縮潛力巨大。(4) 圖像質(zhì)量評(píng)價(jià)受主觀因素影響。數(shù)字圖像處理后的圖像一般需要給人觀察和評(píng)價(jià),而人的視覺(jué)系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺(jué)性能、人的情緒、愛(ài)好以及知識(shí)狀況影響很大,因此評(píng)價(jià)結(jié)果受人的主觀因素影響較大。為此,如何客觀評(píng)價(jià)圖像質(zhì)量還有待進(jìn)一步深入的研究。另外,計(jì)算機(jī)視覺(jué)是模仿人的視覺(jué),人類的感知原理必然嚴(yán)重影響計(jì)算機(jī)視覺(jué)的研究。(5) 圖像處理技術(shù)綜合性強(qiáng)。數(shù)字圖像處理技術(shù)中設(shè)計(jì)的基礎(chǔ)知識(shí)和專業(yè)技術(shù)相當(dāng)廣泛,通常涉及通信技術(shù)、計(jì)算機(jī)技術(shù)、電子技術(shù)、電視技術(shù)以及更多的數(shù)學(xué)、物理等方面的基礎(chǔ)知識(shí)。例如,圖像編碼的理論基礎(chǔ)是信息論和抽象數(shù)學(xué)的結(jié)合,而圖像識(shí)別則需要掌握隨機(jī)過(guò)程和信號(hào)處理方面的知識(shí)。此外,不少課題還需要更加專業(yè)的知識(shí),如小波變換、神經(jīng)網(wǎng)絡(luò)、分形理論等。另外,圖像處理是一門(mén)應(yīng)用性很強(qiáng)的學(xué)問(wèn),必須與計(jì)算機(jī)技術(shù)的發(fā)展相適應(yīng)。隨著電子技術(shù)和計(jì)算機(jī)技術(shù)的不斷提高和普及,數(shù)字圖像處理技術(shù)進(jìn)入高速發(fā)展時(shí)期。 灰度圖像二值化原理及意義灰度圖像是指只含亮度信息,不含色彩信息的圖像。將彩色圖像轉(zhuǎn)化成為灰度圖像的過(guò)程稱為圖像的灰度化處理。彩色圖像中的每個(gè)像素的顏色有R、G、B三個(gè)分量決定,而每個(gè)分量有255種值可取,這樣一個(gè)像素點(diǎn)可以有1600多萬(wàn)的顏色的變化范圍。而灰度圖像是R、G、B三個(gè)分量相同的一種特殊的彩色圖像,一個(gè)像素點(diǎn)的變化范圍為255種,所以在數(shù)字圖像處理中一般先