【正文】
南京師范大學(xué)泰州學(xué)院畢 業(yè) 論 文題 目圖像二值化中閾值選取方法的研究學(xué)生姓名霍良學(xué) 號09090628專 業(yè)電子信息工程班 級信工院0906指導(dǎo)教師焦蓬蓬 2013 年 4 月南京師范大學(xué)泰州學(xué)院本科生畢業(yè)(設(shè)計(jì))論文摘 要在人類獲取的信息中,視覺信息約占60%,聽覺約占20%,其它約占20%。由此可見,視覺信息對人類非常重要。同時(shí),圖像是人類獲取視覺信息的主要途徑。圖像二值化是圖像預(yù)處理中的一項(xiàng)重要技術(shù),在模式識別、光學(xué)字符識別、醫(yī)學(xué)成像等方面都有重要應(yīng)用。論文介紹了圖像及數(shù)字圖像處理技術(shù)的一些概念和相關(guān)知識, 軟件的發(fā)展和軟件在圖像處理中的應(yīng)用做了簡要介紹。課題重點(diǎn)實(shí)現(xiàn)了圖像分割技術(shù)中灰度圖像二值化方法,如Otsu算法、Bernsen算法,并對這些算法運(yùn)行的實(shí)驗(yàn)結(jié)果進(jìn)行分析與比較。關(guān)鍵詞:圖像處理,二值化,Matlab,Otsu算法,Bernsen算法IVAbstractHuman beings obtain a lot of information, among which the visual information is about 60%, the sense of hearing about 20%, and others about 20%. Therefore, the visual information is very important for human beings. Moreover, the images are the primary way, by which a lot of information is obtained. Image binarization, as an important technology in image preprocessing, is widelyemployed in pattern recognition, optical character recognition, medical imaging and so forth. In this paper, some notions and relative knowledge in digital image processing technology are introduced。 then, the development of and its application in image processing briefly introduced。 in addition, the method of grayscale image binarization and how to implement these algorithms based on are presented. This paper mainly implements the grayscale image binarization method in image segmentation technology, such as Otsu algorithm and Bernsen algorithm, and analyzes and pares the experimental results of the above algorithms. Key words: Image processing, Binarization, Matlab, Otsu algorithm, Bernsen algorithm目 錄摘要 IAbstract II目 錄 III第一章 緒 論 1 圖像與數(shù)字圖像 1 數(shù)字圖像處理技術(shù)內(nèi)容與發(fā)展現(xiàn)狀 2 灰度圖像二值化原理及意義 5第二章 軟件工具——MATLAB 6 MATLAB概述 6 MATLAB的工作環(huán)境 6 MATLAB圖像處理工具箱 8 工具箱實(shí)現(xiàn)的常用功能 9第三章 圖像二值化方法 11 課題研究對象 11 二值化方法研究動(dòng)態(tài) 14 全局閾值法 18 局部閾值法 19第四章 Otsu方法和Bernsen方法 20 Otsu算法分析 20 Otsu方法流程圖 22 Bernsen算法分析 23 Bernsen方法流程圖 23第五章 Otsu方法和Bernsen方法實(shí)驗(yàn)比較 25 Otsu方法實(shí)驗(yàn)結(jié)果分析 25 Bernsen方法實(shí)驗(yàn)結(jié)果分析 27 0tsu方法和Bernsen方法實(shí)驗(yàn)結(jié)果比較 29 結(jié)論 30參考文獻(xiàn) 31致謝 31第一章 緒 論 圖像與數(shù)字圖像圖像就是用各種觀測系統(tǒng)觀測客觀世界獲得的且可以直接或間接作用與人眼而產(chǎn)生視覺的實(shí)體。視覺是人類從大自然中獲取信息的最主要的手段。據(jù)統(tǒng)計(jì),在人類獲取的信息中,視覺信息約占60%,聽覺信息約占20%,其他方式加起來才約占20%。由此可見,視覺信息對人類非常重要。同時(shí),圖像又是人類獲取視覺信息的主要途徑,是人類能體驗(yàn)的最重要、最豐富、信息量最大的信息源。 通常,客觀事物在空間上都是三維的(3D)的,但是從客觀景物獲得的圖像卻是屬于二維(2D)平面的。圖像存在方式多種多樣,可以是可視的或者非可視的,抽象的或者實(shí)際的,適于計(jì)算機(jī)處理的和不適于計(jì)算機(jī)處理的。但就其本質(zhì)來說,可以將圖像分為以下兩大類。模擬圖像。包括光學(xué)圖像、照相圖像、電視圖像等。比如人在顯微鏡下看到的圖像就是一幅光學(xué)模擬圖像。對模擬圖像的處理速度快,但精度和靈活性差,不易查找和判斷。數(shù)字圖像。數(shù)字圖像是將連續(xù)的模擬圖像經(jīng)過離散化處理后得到的計(jì)算機(jī)能夠辨識的點(diǎn)陣圖像。在嚴(yán)格意義上講,數(shù)字圖像是經(jīng)過等距離矩形網(wǎng)格采樣,對幅度進(jìn)行等間隔量化的二維函數(shù)。因此,數(shù)字圖像實(shí)際上就是被量化的二維采樣數(shù)組。一幅數(shù)字圖像都是由若干個(gè)數(shù)據(jù)點(diǎn)組成的,每個(gè)數(shù)據(jù)點(diǎn)稱為像素(pixel)。比如一幅128400,就是指該圖像是由水平方向上128列像素和垂直方向上400行像素組成的矩形圖。每一個(gè)像素具有自己的屬性,如顏色(color)、灰度(gray scale)等,顏色和灰度是決定一幅圖像表現(xiàn)的關(guān)鍵因素。其中顏色量化等級包括單色、四色、16色、128色、24位真彩色等,量化等級越高,則量化誤差越小,圖像的顏色表現(xiàn)力越強(qiáng)。同樣,灰度是單色圖像中像素亮度的表征,量化等級越高,表現(xiàn)力越強(qiáng)。但是隨著量化等級的增加,數(shù)據(jù)量將大大增加,使得圖像處理的計(jì)算量和復(fù)雜度相應(yīng)的增加。與模擬圖像相比,數(shù)字圖像具有以下顯著優(yōu)點(diǎn):(1) 精度高。目前的計(jì)算機(jī)技術(shù)可以將一幅模擬圖像數(shù)字化為任意的二維數(shù)組,即數(shù)字圖像可以由無限個(gè)像素組成,每個(gè)像素的亮度可以量化為12位(即4096個(gè)灰度級),這樣的精度是數(shù)字圖像處理與彩色照片的效果相差無幾。(2) 處理方便。數(shù)字圖像在本質(zhì)上是一組數(shù)據(jù),所以可以用計(jì)算機(jī)對他進(jìn)行任意方式的修改,如放大、縮小、改變顏色、復(fù)制和刪除某一部分等。(3) 重復(fù)性好。模擬圖像,如照片,即便是使用非常好的底片和相紙,也會隨著時(shí)間的流逝而褪色、發(fā)黃,而數(shù)字圖像可以存儲在光盤中,上百年后再用計(jì)算機(jī)重現(xiàn)也不會有絲毫的改變。 數(shù)字圖像處理技術(shù)內(nèi)容與發(fā)展現(xiàn)狀數(shù)字圖像處理就是采用一定的算法對數(shù)字圖像進(jìn)行處理,以獲得人眼視覺或者某種接受系統(tǒng)所需要的圖像處理過程。圖像處理的基礎(chǔ)是數(shù)字,主要任務(wù)是進(jìn)行各種算法設(shè)計(jì)和算法實(shí)現(xiàn)。目前,圖像處理技術(shù)已經(jīng)在許多不同的應(yīng)用領(lǐng)域中得到重視,并取得了巨大成就。根據(jù)應(yīng)用領(lǐng)域要求的不同,數(shù)字圖像處理技術(shù)可以分為許多分支技術(shù)。重要的分支技術(shù)有:(1) 圖像變換。圖像陣列很大時(shí),若直接在空域中處理,計(jì)算量將很大。為此,通常采用各種圖像變換方法,如傅立葉變換、沃爾什變換、離散余弦變換、小波變換等間接處理技術(shù),將空域處理轉(zhuǎn)換到變換域處理,這樣可以有效地減少計(jì)算量,提高處理性能。(2) 圖像增強(qiáng)與復(fù)原。主要目的是增強(qiáng)圖像中的有用信息,削弱干擾和噪聲,使圖像更加清晰,或者將其轉(zhuǎn)換為更適合人或機(jī)器分析的形式。圖像增強(qiáng)并不是要求真實(shí)地反映原始圖像,而圖像復(fù)原則要求盡量消除或減少獲取圖像過程中所產(chǎn)生的某些退化,使圖像能夠反映原始圖像的真實(shí)面貌。(3) 圖像壓縮編碼。在滿足一定保真度條件下,對圖像信息進(jìn)行編碼,可以壓縮圖像信息量,簡化圖像的邊式,從而大大壓縮圖像描述的數(shù)據(jù)量,以便存儲和傳輸;圖像壓縮在不同應(yīng)用背景下可以采用不失真壓縮和失真壓縮。(4) 圖像分割。圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一,是為了將圖像中有意義的特征提取出來。它是進(jìn)一步進(jìn)行圖像識別、分析和理解的基礎(chǔ)。圖像的有意義特征包括圖像的邊緣、區(qū)域等。(5) 圖像分析。對圖像中的不同對象進(jìn)行分割、分類、識別、描述和解釋。(6) 圖像識別。圖像識別屬于模式識別的范疇,其主要內(nèi)容是在圖像經(jīng)過某些預(yù)處理(增強(qiáng)、復(fù)原、壓縮)后,進(jìn)行圖像分割和提取,從而進(jìn)行判別分類。圖像分類常用的經(jīng)典識別方法有統(tǒng)計(jì)模式分類和句法模式分類。近年來,新發(fā)展起來的模糊模式識別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識別中越來越受到重視。(7) 圖像隱藏。是指媒體信息的相互隱藏,常見的有數(shù)字水印和圖像的信息偽裝等。以上圖像處理內(nèi)容也并非孤立存在的,往往相互聯(lián)系,而一個(gè)實(shí)用的圖像處理系統(tǒng)通常需要將幾種圖像處理技術(shù)結(jié)合起來,才能得到所需要的結(jié)果。例如,圖像變換是圖像編碼技術(shù)的基礎(chǔ),而圖像增強(qiáng)與復(fù)原一般又是圖像處理的最終目的,也可以作為進(jìn)一步圖像處理工作的準(zhǔn)備;通過圖像分割得到的圖像特征既可以作為最后結(jié)果,也可以作為下一步圖像分析的基礎(chǔ)。不同的圖像處理技術(shù)應(yīng)用與不同的領(lǐng)域,發(fā)展出不同的分支學(xué)科,如遙感圖像處理、醫(yī)學(xué)圖像處理等,其他如計(jì)算機(jī)圖形學(xué)、模式識別、人工智能和機(jī)器人視覺等學(xué)科領(lǐng)域也與圖像處理有著密切的關(guān)系。圖像處理技術(shù)的發(fā)展大致經(jīng)歷了初創(chuàng)期、發(fā)展期、普及期和實(shí)用化期4個(gè)階段。初創(chuàng)期開始于20世紀(jì)60年代,當(dāng)時(shí)的圖像采用像素型光柵進(jìn)行少秒顯示,大多采用中、大型機(jī)對其處理。在這一時(shí)期,由于圖像存儲成本高、處理設(shè)備昂貴,其應(yīng)用面很窄。進(jìn)入20世紀(jì)70年代的發(fā)展期,開始大量采用中、小型機(jī)進(jìn)行處理,圖像處理也逐漸改用光柵掃描方式,特別是CT和衛(wèi)星遙感圖像的出現(xiàn),對圖像處理技術(shù)的發(fā)展起到了很好的推動(dòng)作用。到了20世紀(jì)80年代,圖像處理技術(shù)進(jìn)入普及期,此時(shí)的微機(jī)已經(jīng)能夠擔(dān)當(dāng)起圖形圖像處理的任務(wù)。超大規(guī)模集成電路(Very Large Scale Integration, VLSI)的出現(xiàn)更使處理速度大大提高,設(shè)備造價(jià)也進(jìn)一步降低,極大地促進(jìn)了圖形圖像系統(tǒng)的普及和應(yīng)用。20世紀(jì)90年代是圖像處理技術(shù)的實(shí)用化時(shí)期,圖像處理的信息量巨大,對處理速度的要求極高。針對現(xiàn)有的實(shí)際應(yīng)用,數(shù)字圖像處理具有以下特點(diǎn)。(1) 信息量大,要求處理速度比較快。目前,數(shù)字圖像處理的信息大多是二維信息,處理信息量很大。比如一幅128128低分辨率的黑白圖像,要求64Kbit的數(shù)據(jù)量;對高分辨率彩色512512圖像,則要求128Kbit數(shù)據(jù)量;如果要處理30幀/s的視頻圖像,則每秒要求處理500Kbit~。因此對計(jì)算機(jī)的計(jì)算速度、存儲容量等要求較高。(2) 占用頻帶較寬。與語音信息相比,數(shù)字圖像占用的頻帶要大幾個(gè)數(shù)量級。如電視圖像的帶寬約56MHz,而語音帶寬僅為4KHz左右。所以數(shù)字圖像在成像、傳輸、存儲、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本高,且對頻帶壓縮技術(shù)提出了更高的要求。(3) 數(shù)字圖像中各個(gè)像素間的相關(guān)性強(qiáng),壓縮潛力大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個(gè)像素或相鄰兩行間的像素。一般而言,相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性還要大。(4) 圖像質(zhì)量評價(jià)受主觀因素影響。數(shù)字圖像處理后的圖像一般需要給人觀察和評價(jià),而人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、人的情緒、愛好以及知識狀況影響很大,因此評價(jià)結(jié)果受人的主觀因素影響較大。為此,如何客觀評價(jià)圖像質(zhì)量還有待進(jìn)一步深入的研究。另外,計(jì)算機(jī)視覺是模仿人的視覺,人類的感知原理必然嚴(yán)重影響計(jì)算機(jī)視覺的研究。(5) 圖像處理技術(shù)綜合性強(qiáng)。數(shù)字圖像處理技術(shù)中設(shè)計(jì)的基礎(chǔ)知識和專業(yè)技術(shù)相當(dāng)廣泛,通常涉及通信技術(shù)、計(jì)算機(jī)技術(shù)、電子技術(shù)、電視技術(shù)以及更多的數(shù)學(xué)、物理等方面的基礎(chǔ)知識。例如,圖像編碼的理論基礎(chǔ)是信息論和抽象數(shù)學(xué)的結(jié)合,而圖像識別則需要掌握隨機(jī)過程和信號處理方面的知識。此外,不少課題還需要更加專業(yè)的知識,如小波變換、神經(jīng)網(wǎng)絡(luò)、分形理論等。另外,圖像處理是一門應(yīng)用性很強(qiáng)的學(xué)問,必須與計(jì)算機(jī)技術(shù)的發(fā)展相適應(yīng)。隨著電子技術(shù)和計(jì)算機(jī)技術(shù)的不斷提高和普及,數(shù)字圖像處理技術(shù)進(jìn)入高速發(fā)展時(shí)期。 灰度圖像二值化原理及意義灰度圖像是指只含亮度信息,不含色彩信息的圖像。將彩色圖像轉(zhuǎn)化成為灰度圖像的過程稱為圖像的灰度化處理。彩色圖像中的每個(gè)像素的顏色有R、G、B三個(gè)分量決定,而每個(gè)分量有255種值可取,這樣一個(gè)像素點(diǎn)可以有1600多萬的顏色的變化范圍。而灰度圖像是R、G、B三個(gè)分量相同的一種特殊的彩色圖像,一個(gè)像素點(diǎn)的變化范圍為255種,所以在數(shù)字圖像處理中一般先將各種格式的圖像轉(zhuǎn)變成灰度圖像以使后續(xù)的圖像的計(jì)算量變得少一些?;叶葓D像的描述與彩色圖像一樣仍然反映了整幅圖像的整體和局部的色度和亮度等級的分布和特征。圖像的灰度化處理可先求出每個(gè)像素點(diǎn)的R、G、B三個(gè)分量的平均值,然后將這個(gè)平均值賦予給這個(gè)像素的三個(gè)分量。圖像的二值化處理就是將圖像上的點(diǎn)的灰度置為0或1,也就是使整個(gè)圖像呈現(xiàn)出明顯的黑白效果。即將128個(gè)亮度等級的灰度圖像通過適當(dāng)?shù)拈撝颠x取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。在數(shù)字圖像處理中,二值化圖像占有非常重要的地位,特別是在實(shí)用的圖像處理中,以二值圖像處理實(shí)現(xiàn)而構(gòu)成的系統(tǒng)是很多的,要進(jìn)行二值圖像的處理與分析,首先要把灰度圖像二值化,得到二值化圖像,這樣子有利于再對圖像做進(jìn)一步處理時(shí),圖像的集合性質(zhì)只與像素的值為0或1的點(diǎn)的位置有關(guān)