【正文】
展相適應。例如,圖像編碼的理論基礎是信息論和抽象數(shù)學的結合,而圖像識別則需要掌握隨機過程和信號處理方面的知識。(5) 圖像處理技術綜合性強。為此,如何客觀評價圖像質量還有待進一步深入的研究。(4) 圖像質量評價受主觀因素影響。一般而言,相鄰兩幀之間的相關性比幀內(nèi)相關性還要大。在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。所以數(shù)字圖像在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術難度較大,成本高,且對頻帶壓縮技術提出了更高的要求。與語音信息相比,數(shù)字圖像占用的頻帶要大幾個數(shù)量級。因此對計算機的計算速度、存儲容量等要求較高。目前,數(shù)字圖像處理的信息大多是二維信息,處理信息量很大。針對現(xiàn)有的實際應用,數(shù)字圖像處理具有以下特點。超大規(guī)模集成電路(Very Large Scale Integration, VLSI)的出現(xiàn)更使處理速度大大提高,設備造價也進一步降低,極大地促進了圖形圖像系統(tǒng)的普及和應用。進入20世紀70年代的發(fā)展期,開始大量采用中、小型機進行處理,圖像處理也逐漸改用光柵掃描方式,特別是CT和衛(wèi)星遙感圖像的出現(xiàn),對圖像處理技術的發(fā)展起到了很好的推動作用。初創(chuàng)期開始與20世紀60年代,當時的圖像采用像素型光柵進行少秒顯示,大多采用中、大型機對其處理。不同的圖像處理技術應用與不同的領域,發(fā)展出不同的分支學科,如遙感圖像處理、醫(yī)學圖像處理等,其他如計算機圖形學、模式識別、人工智能和機器人視覺等學科領域也與圖像處理有著密切的關系。以上圖像處理內(nèi)容也并非孤立存在的,往往相互聯(lián)系,而一個實用的圖像處理系統(tǒng)通常需要將幾種圖像處理技術結合起來,才能得到所需要的結果。(7) 圖像隱藏。圖像分類常用的經(jīng)典識別方法有統(tǒng)計模式分類和句法模式分類。(6) 圖像識別。(5) 圖像分析。它是進一步進行圖像識別、分析和理解的基礎。(4) 圖像分割。(3) 圖像壓縮編碼。主要目的是增強圖像中的有用信心,削弱干擾和噪聲,使圖像更加清晰,或者將其轉換為更適合人或機器分析的形式。為此,通常采用各種圖像變換方法,如傅立葉變換、沃爾什變換、離散余弦變換、小波變換等間接處理技術,將空域處理轉換到變換域處理,這樣可以有效地減少計算量,提高處理性能。重要的分支技術有:(1) 圖像變換。目前,圖像處理技術已經(jīng)在許多不同的應用領域中得到重視,并取得了巨大成就。 數(shù)字圖像處理技術內(nèi)容與發(fā)展現(xiàn)狀數(shù)字圖像處理就是采用一定的算法對數(shù)字圖像進行處理,以獲得人眼視覺或者某種接受系統(tǒng)所需要的圖像處理過程。(3) 重復性好。(2) 處理方便。與模擬圖像相比,數(shù)字圖像具有以下顯著優(yōu)點:(1) 精度高。同樣,灰度是單色圖像中像素亮度的表征,量化等級越高,表現(xiàn)力越強。每一個像素具有自己的屬性,如顏色(color)、灰度(gray scale)等,顏色和灰度是決定一幅圖像表現(xiàn)里的關鍵因素。一幅數(shù)字圖像都是由若干個數(shù)據(jù)點組成的,每個數(shù)據(jù)點稱為像素(pixel)。在嚴格意義上講,數(shù)字圖像是經(jīng)過等距離矩形網(wǎng)格采樣,對幅度進行等間隔量化的二維函數(shù)。數(shù)字圖像。比如人在顯微鏡下看到的圖像就是一幅光學模擬圖像。模擬圖像。圖像存在方式多種多樣,可以是可視的或者非可視的,抽象的或者實際的,適于計算機處理的和不適于計算機處理的。同時,圖像又是人類獲取視覺信息的主要途徑,是人類能體驗的最重要、最豐富、信息量最大的信息源。拒統(tǒng)計,在人類獲取的信息中,視覺信息約占60%,聽覺信息約占20%,其他方式加起來才約占20%。 in addition, the method of grayscale image binarization and how to implement these algorithms based on are presented. This paper mainly implements the grayscale image binarization method in image segmentation technology, such as Otsu algorithm and Bernsen algorithm, and analyzes and pares the experimental results of the above algorithms.Keywords: Image processing, Binarization, Matlab, Otsu algorithm, Bernsen algorithm第一章 緒 論 圖像與數(shù)字圖像圖像就是用各種觀測系統(tǒng)觀測客觀世界獲得的且可以直接或間接作用與人眼而產(chǎn)生視覺的實體。 關鍵詞:圖像處理,二值化,Matlab,Otsu算法,Bernsen算法 AbstractHuman beings obtain a lot of information, among which the visual information is about 60%, the sense of hearing about 20%, and others about 20%. Therefore, the visual information is very important for human beings. Moreover, the images are the primary way, by which a lot of information is obtained. Image binarization, as an important technology in image preprocessing, is widelyemployed in pattern recognition, optical character recognition, medical imaging and so forth. In this paper, some notions and relative knowledge in digital image processing technology are introduced。論文介紹了圖像及數(shù)字圖像處理技術的一些概念和相關知識; 軟件的發(fā)展和軟件在圖像處理中的應用做了簡要介紹;。同時,圖像是人類獲取視覺信息的主要途徑。目 錄摘 要 IIIAbstract IV第一章 緒 論 1 圖像與數(shù)字圖像 1 數(shù)字圖像處理技術內(nèi)容與發(fā)展現(xiàn)狀 2 灰度圖像二值化原理及意義 4第二章 軟件工具——MATLAB 6 MATLAB概述 6 MATLAB的工作環(huán)境 6 MATLAB圖像處理工具箱 8 工具箱實現(xiàn)的常用功能 9第三章 圖像二值化方法 11 課題研究對象 11 二值化方法研究動態(tài) 13 全局閾值法 18 局部閾值法 18第四章 Otsu方法和Bernsen方法 20 Otsu算法分析 20 Otsu方法流程圖 22 Bernsen算法分析 23 Bernsen方法流程圖 23第五章 Otsu方法和Bernsen方法實驗比較 25 Otsu方法實驗結果分析 25 Bernsen方法結果分析 27 0tsu方法和Bernsen方法實驗結果比較 28 結論 29結束語 31參考文獻 32致 謝 33附錄:源代碼 34摘 要在人類獲取的信息中,視覺信息約占60%,聽覺約占20%,其它約占20%。由此可見,視覺信息對人類非常重要。圖像二值化是圖像預處理中的一項重要技術,在模式識別、光學字符識別、醫(yī)學成像等方面都有重要應用。課題重點實現(xiàn)了圖像分割技術中灰度圖像二值化方法,如Otsu算法、Bernsen算法,并對這些算法運行的實驗結果進行分析與比較。 then, the development of and its application in image processing briefly introduced。視覺是人類從大自然中獲取信息的最主要的手段。由此可見,視覺信息對人類非常重要。通常,客觀事物在空間上都是三維的(3D)的,但是從客觀景物獲得的圖像卻是屬于二維(2D)平面的。但就其本質來說,可以將圖像分為以下兩大類。包括光學圖像、照相圖像、電視圖像等。對模擬圖像的處理速度快,但精度和靈活性差,不易查找和判斷。數(shù)字圖像是將連續(xù)的模擬圖像經(jīng)過離散化處理后得到的計算機能夠辨識的點陣圖像。因此,數(shù)字圖像實際上就是被量化的二維采樣數(shù)組。比如一幅256400,就是指該圖像是由水平方向上256列像素和垂直方向上400行像素組成的矩形圖。其中顏色量化等級包括單色、四色、16色、256色、24位真彩色等,量化等級越高,則量化誤差越小,圖像的顏色表現(xiàn)力越強。但是隨著量化等級的增加,數(shù)據(jù)量將大大增加,使得圖像處理的計算量和復雜度相應的增加。目前的計算機技術可以將一幅模擬圖像數(shù)字化為任意的二維數(shù)組,即數(shù)字圖像可以由無限個像素組成,每個像素的亮度可以量化為12位(即4096個灰度級),這樣的精度是數(shù)字圖像處理與彩色照片的效果相差無幾。數(shù)字圖像在本質上是一組數(shù)據(jù),所以可以用計算機對他進行任意方式的修改,如放大、縮小、改變顏色、復制和刪除某一部分等。模擬圖像,如照片,即便是使用非常好的底片和相紙,也會隨著時間的流逝而褪色、發(fā)黃,而數(shù)字圖像可以存儲在光盤中,上百年后再用計算機重現(xiàn)也不會有絲毫的改變。圖像處理的基礎是數(shù)字,主要任務是進行各種算法設計和算法實現(xiàn)。根據(jù)應用領域要求的不同,數(shù)字圖像處理技術可以分為許多分支技術。圖像陣列很大時,若直接在空域中處理,計算量將很大。(2) 圖像增強與復原。圖像增強并不是要求真實地反映原始圖像,而圖像復原則要求盡量消除或減少獲取圖像過程中所產(chǎn)生的某些退化,使圖像能夠反映原始圖像的真實面貌。在滿足一定保真度條件下,對圖像信息進行編碼,可以壓縮圖像信息量,簡化圖像的邊式,從而大大壓縮圖像描述的數(shù)據(jù)量,以便存儲和傳輸;圖像壓縮在不同應用背景下可以采用不失真壓縮和失真壓縮。圖像分割是數(shù)字圖像處理中的關鍵技術之一,是為了將圖像中有意義的特征提取出來。圖像的有意義特征包括圖像的邊緣、區(qū)域等。對圖像中的不同對象進行分割、分類、識別、描述和解釋。圖像識別屬于模式識別的范疇,起主要內(nèi)容是在圖像經(jīng)過某些預處理(增強、復原、壓縮)后,進行圖像分割和提取,從而進行判別分類。近年來,新發(fā)展起來的模糊模式識別和人工神經(jīng)網(wǎng)絡模式分類在圖像識別中越來越受到重視。是指媒體信息的相互隱藏,常見的有數(shù)字水印和圖像的信息偽裝等。例如,圖像變換是圖像編碼技術的基礎,而圖像增強與復原一般又是圖像處理的最終目的,也可以作為進一步圖像處理工作的準備;通過圖像分割得到的圖像特征既可以作為最后結果,也可以作為下一步圖像分析的基礎。圖像處理技術的發(fā)展大致經(jīng)歷了初創(chuàng)期、發(fā)展期、普及期和實用化期4個階段。在這一時期,由于圖像存儲成本高、處理設備昂貴,其應用面很窄。到了20世紀80年代,圖像處理技術進入普及期,此時的微機已經(jīng)能夠擔當起圖形圖像處理的任務。20世紀90年代是圖像處理技術的實用化時期,圖像處理的信息量巨大,對處理速度的要求極高。(1) 信息量大,要求處理速度比較快。比如一幅256256低分辨率的黑白圖像,要求64Kbit的數(shù)據(jù)量;對高分辨率彩色512512圖像,則要求256Kbit數(shù)據(jù)量;如果要處理30幀/s的視頻圖像,則每秒要求處理500Kbit~。(2) 占用頻帶較寬。如電視圖像的帶寬約56MHz,而語音帶寬僅為4KHz左右。(3) 數(shù)字圖像中各個像素間的相關性強,壓縮潛力大。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素。因此,圖像處理中的信息壓縮潛力巨大。數(shù)字圖像處理后的圖像一般需要給人觀察和評價,而人的視覺系統(tǒng)很復雜,受環(huán)境條件、視覺性能、人的情緒、愛好以及知識狀況影響很大,因此評價結果受人的主觀因素影響較大。另外,計算機視覺是模仿人的視覺,人類的感知原理必然嚴重影響計算機視覺的研究。數(shù)字圖像處理技術中設計的基礎知識和專業(yè)技術相當廣泛,通常涉及通信技術、計算機技術、電子技術、電視技術以及更多的數(shù)學、物理等方面的基礎知識。此外,不少課題還需要更加專業(yè)的知識,如小波變換、神經(jīng)網(wǎng)絡、分形理論等。隨著電子技術和計算機技術的不斷提高和普及,數(shù)字圖像處理技術進入高速發(fā)展時期。將彩色圖像轉化成為灰度圖像的過程稱為圖像的灰度化處理。而灰度圖像是R、G、B三個分量相同的一種特殊的彩色圖像,一個像素點的變化范圍為255種,所以在數(shù)字圖像處理中一般先將各種格式的圖像轉變成灰度圖像以使后續(xù)的圖像的計算量變得少一些。圖像的灰度化處理可先求出每個像素點的R、G、B三個分量的平均值,然后將這個平均值賦予給這個像素的三個分量。即將256個亮度等級的灰度圖像通過適當?shù)拈y值選取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。