【正文】
的復(fù)制和修復(fù),運(yùn)動(dòng)員動(dòng)作分析和評(píng)分等等,現(xiàn)在已逐漸形成一門新的藝術(shù)——計(jì)算機(jī)美術(shù)。 在軍事方面圖像處理和識(shí)別主要用于導(dǎo)彈的精確末制導(dǎo),各種偵察照片的判讀,具有圖像傳輸、存儲(chǔ)和顯示的軍事自動(dòng)化指揮系統(tǒng),飛機(jī)、坦克和軍艦?zāi)M訓(xùn)練系統(tǒng)等;公安業(yè)務(wù)圖片的判讀分析,指紋識(shí)別,人臉鑒別,不完整圖片的復(fù)原,以及交通監(jiān)控、事故分析等。 在工業(yè)和工程領(lǐng)域中圖像處理技術(shù)有著廣泛的應(yīng)用,如自動(dòng)裝配線中檢測(cè)零件的質(zhì)量、并對(duì)零件進(jìn)行分類,印刷電路板疵病檢查,彈性力學(xué)照片的應(yīng)力分析,流體力學(xué)圖片的阻力和升力分析,郵政信件的自動(dòng)分揀,在一些有毒、放射性環(huán)境內(nèi)識(shí)別工件及物體的形狀和排列狀態(tài),先進(jìn)的設(shè)計(jì)和制造技術(shù)中采用工業(yè)視覺等等。在一定意義上講,編碼壓縮是這些技術(shù)成敗的關(guān)鍵。其中以圖像通信最為復(fù)雜和困難,因圖像的數(shù)據(jù)量十分巨大,如傳送彩色電視信號(hào)的速率達(dá)100Mbit/s以上。 當(dāng)前通信的主要發(fā)展方向是聲音、文字、圖像和數(shù)據(jù)結(jié)合的多媒體通信。除了上面介紹的CT技術(shù)之外,還有一類是對(duì)醫(yī)用顯微圖像的處理分析,如紅細(xì)胞、白細(xì)胞分類,染色體分析,癌細(xì)胞識(shí)別等。在氣象預(yù)報(bào)和對(duì)太空其它星球研究方面,數(shù)字圖像處理技術(shù)也發(fā)揮了相當(dāng)大的作用?,F(xiàn)在世界各國(guó)都在利用陸地衛(wèi)星所獲取的圖像進(jìn)行資源調(diào)查(如森林調(diào)查、海洋泥沙和漁業(yè)調(diào)查、水資源調(diào)查等),災(zāi)害檢測(cè)(如病蟲害檢測(cè)、水火檢測(cè)、環(huán)境污染檢測(cè)等),資源勘察(如石油勘查、礦產(chǎn)量探測(cè)、大型工程地理位置勘探分析等),農(nóng)業(yè)規(guī)劃(如土壤營(yíng)養(yǎng)、水分和農(nóng)作物生長(zhǎng)、產(chǎn)量的估算等),城市規(guī)劃(如地質(zhì)結(jié)構(gòu)、水源及環(huán)境分析等)。這些圖像在空中先處理(數(shù)字化,編碼)成數(shù)字信號(hào)存入磁帶中,在衛(wèi)星經(jīng)過地面站上空時(shí),再高速傳送下來(lái),然后由處理中心分析判讀。因此,以如此昂貴的代價(jià)進(jìn)行簡(jiǎn)單直觀的判讀來(lái)獲取圖像是不合算的,而必須采用數(shù)字圖像處理技術(shù)。對(duì)由此得來(lái)的照片進(jìn)行處理分析,以前需要雇用幾千人,而現(xiàn)在改用配備有高級(jí)計(jì)算機(jī)的圖像處理系統(tǒng)來(lái)判讀分析,既節(jié)省人力,又加快了速度,還可以從照片中提取人工所不能發(fā)現(xiàn)的大量有用情報(bào)。 數(shù)字圖像處理技術(shù)在航天和航空技術(shù)方面的應(yīng)用,除了上面介紹的JPL對(duì)月球、火星照片的處理之外,另一方面的應(yīng)用是在飛機(jī)遙感和衛(wèi)星遙感技術(shù)中。圖像是人類獲取和交換信息的主要來(lái)源,因此,圖像處理的應(yīng)用領(lǐng)域必然涉及到人類生活和工作的方方面面。由于圖像的光學(xué)處理從原理上講只能進(jìn)行線性運(yùn)算,這極大地限制了光學(xué)圖像處理能實(shí)現(xiàn)的目標(biāo)。即只要針對(duì)不同的圖像信息源,采取相應(yīng)的圖像信息采集措施,圖像的數(shù)字處理方法適用于任何一種圖像。從圖像反映的客觀實(shí)體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠(yuǎn)鏡圖像。回想一下圖像的模擬處理,為了要把處理精度提高一個(gè)數(shù)量級(jí),就要大幅度地改進(jìn)處理裝置,這在經(jīng)濟(jì)上是極不合算的。對(duì)計(jì)算機(jī)而言,不論數(shù)組大小,也不論每個(gè)像素的位數(shù)多少,其處理程序幾乎是一樣的。 按目前的技術(shù),幾乎可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,這主要取決于圖像數(shù)字化設(shè)備的能力。 數(shù)字圖像處理與模擬圖像處理的根本不同在于,它不會(huì)因圖像的存儲(chǔ)、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化。另一方面,計(jì)算機(jī)視覺是模仿人的視覺,人的感知機(jī)理必然影響著計(jì)算機(jī)視覺的研究。在理解三維景物時(shí)需要知識(shí)導(dǎo)引,這也是人工智能中正在致力解決的知識(shí)工程問題。 由于圖像是三維景物的二維投影,一幅圖像本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來(lái)的。就電視畫面而言,同一行中相鄰兩個(gè)像素或相鄰兩行間的像素,而相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性一般說(shuō)還要大些。所以在成像、傳輸、存儲(chǔ)、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本亦高,這就對(duì)頻帶壓縮技術(shù)提出了更高的要求。與語(yǔ)言信息相比,占用的頻帶要大幾個(gè)數(shù)量級(jí)。) 46參考文獻(xiàn) 48致 謝 49附 錄 50第一章 緒論,處理信息量很大如一幅256256低分辨率黑白圖像,要求約64kbit的數(shù)據(jù)量;對(duì)高分辨率彩色512512圖像,則要求768kbit數(shù)據(jù)量;如果要處理30幀/秒的電視圖像序列,則每秒要求500kbit~。與此同時(shí)本文還分析了圖像分割技術(shù)研究的方向。而閾值分割技術(shù)的關(guān)鍵在于閾值的確定,只有閾值確定好了才能有效的劃分物體與背景,但這種方法只對(duì)于那些灰度分布明顯,背景與物體差別大的圖像的分割效果才明顯。摘 要本文從原理和應(yīng)用效果上對(duì)經(jīng)典的圖像分割方法如邊緣檢測(cè)、閾值分割技術(shù)和區(qū)域增長(zhǎng)等進(jìn)行了分析。對(duì)梯度算法中的Roberts算子、Sobel算子、Prewitt算子、拉普拉斯(Laplacian)算子、LoG(LaplacianGauss)算子、坎尼(Canny)算子的分割步驟、分割方式、分割準(zhǔn)則相互比較可以看出根據(jù)坎尼(Canny)邊緣算子的3個(gè)準(zhǔn)則得出的邊緣檢測(cè)結(jié)果最滿意。區(qū)域增長(zhǎng)的基本思想是將具有相似性質(zhì)的像素集合起來(lái)構(gòu)成新區(qū)域。關(guān)鍵詞:圖像處理 圖像分割 AbstractThis article analyses the application effect to the classics image segmentation method like the edge examination, territory value division technology, and the region growth and so paring the Roberts operator, Sobel operator, Prewitt operator, the operator of Laplacian and the operator of LoG(LaplacianGauss),Canny operator in gradient algorithm,the step, the way and the standard of the image segmentation,we can find out the three standard of Canny edge operator the edge detection result of reaching most satisfy. And the key point of threshold segmentation lie in fixing the threshold value, it is good to have only threshold value to determine it then can be effective to divide object and background,but this kind of method is good to those gray scales,the big difference image effect between the background and obiect. The basic idea of area is to form the new region from similar also, this paper analyses the research direction of image segmentation technology at the same time.Key words: image processing image segmentation operator目 錄(一般目錄要求最多是三級(jí)目錄,不要出現(xiàn)四級(jí)目錄)第一章 緒論 1 1,處理信息量很大(三級(jí)標(biāo)題有問題) 1 2,其相關(guān)性大 2 2 2 2 2 3 3 3 4 4 5 5 5 5 6 6 基于分形的圖像分割技術(shù) 6 基于神經(jīng)網(wǎng)絡(luò)的圖像分割技術(shù) 7 8第二章 數(shù)字圖像處理的處理方式 9 9 9 9 9 10(識(shí)別) 10第三章 MATLAB平臺(tái)及其開發(fā)環(huán)境 11 11 11 12 12 12 12 13 13 13,可擴(kuò)展性強(qiáng) 13,編程效率高 14,靈活且方便 14 14第四章 圖像分割概念及算法研究 16 16 16() 17 17 19 19 20 21 21(Laplacian)算子 22(LaplacianGauss)算子 24(Canny)算子 25 27 28 28 29 30 31 31 33 34 35 35 3步驟及流程圖 37 40 40 41 42 43第五章 總結(jié) 45 45 45 46(改進(jìn)可另外做為一章比如說(shuō)某某算法等的若干改進(jìn)等,不要放入總結(jié)一章中)(總結(jié)是對(duì)整篇文章的一個(gè)概述,應(yīng)該是寫比如得出些什么結(jié)論,一些算法間比較等相關(guān)問題。因此對(duì)計(jì)算機(jī)的計(jì)算速度、存儲(chǔ)容量等要求較高。而語(yǔ)音帶寬僅為4kHz左右。,其相關(guān)性大在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。因此,圖像處理中信息壓縮的潛力很大。因此,要分析和理解三維景物必須作合適的假定或附加新的測(cè)量,例如雙目圖像或多視點(diǎn)圖像。 由于人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、人的情緒愛好以及知識(shí)狀況影響很大,作為圖像質(zhì)量的評(píng)價(jià)還有待進(jìn)一步深入的研究。例如,什么是感知的初始基元,基元是如何組成的,局部與全局感知的關(guān)系,優(yōu)先敏感的結(jié)構(gòu)、屬性和時(shí)間特征等,這些都是心理學(xué)和神經(jīng)心理學(xué)正在著力研究的課題。只要圖像在數(shù)字化時(shí)準(zhǔn)確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)?,F(xiàn)代掃描儀可以把每個(gè)像素的灰度等級(jí)量化為16位甚至更高,這意味著圖像的數(shù)字化精度可以達(dá)到滿足任一應(yīng)用需求。換言之,從原理上講不論圖像的精度有多高,處理總是能實(shí)現(xiàn)的,只要在處理時(shí)改變程序中的數(shù)組參數(shù)就可以了。 圖像可以來(lái)自多種信息源,它們可以是可見光圖像,也可以是不可見的波譜圖像(例如X射線圖像、 射線圖像、超聲波圖像或紅外圖像等)。這些來(lái)自不同信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像(彩色圖像也是由灰度圖像組合成的,例如RGB圖像由紅、綠、藍(lán)三個(gè)灰度圖像組合而成)組合而成,因而均可用計(jì)算機(jī)來(lái)處理。 圖像處理大體上可分為圖像的像質(zhì)改善、圖像分析和圖像重建三大部分,每一部分均包含豐富的內(nèi)容。而數(shù)字圖像處理不僅能完成線性運(yùn)算,而且能實(shí)現(xiàn)非線性處理,即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來(lái)表達(dá)的一切運(yùn)算均可用數(shù)字圖像處理實(shí)現(xiàn)。隨著人類活動(dòng)范圍的不斷擴(kuò)大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴(kuò)大。許多國(guó)家每天派出很多偵察飛機(jī)對(duì)地球上有興趣的地區(qū)進(jìn)行大量的空中攝影。從60年代末以來(lái),美國(guó)及一些國(guó)際組織發(fā)射了資源遙感衛(wèi)星(如LANDSAT系列)和天空實(shí)驗(yàn)室(如SKYLAB),由于成像條件受飛行器位置、姿態(tài)、環(huán)境條件等影響,圖像質(zhì)量總不是很高。如LANDSAT系列陸地衛(wèi)星,采用多波段掃描器(MSS),在900km高空對(duì)地球每一個(gè)地區(qū)以18天為一周期進(jìn)行掃描成像,其圖像分辨率大致相當(dāng)于地面上十幾米或100米左右(如1983年發(fā)射的LANDSAT4,分辨率為30m)。這些圖像無(wú)論是在成像、存儲(chǔ)、傳輸過程中,還是在判讀分析中,都必須采用很多數(shù)字圖像處理方法。我國(guó)也陸續(xù)開展了以上諸方面的一些實(shí)際應(yīng)用,并獲得了良好的效果。 數(shù)字圖像處理在生物醫(yī)學(xué)工程方面的應(yīng)用十分廣泛,而且很有成效。此外,在X光肺部圖像增析、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學(xué)診斷方面都廣泛地應(yīng)用圖像處理技術(shù)。具體地講是將電話、電視和計(jì)算機(jī)以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸。要將這樣高速率的數(shù)據(jù)實(shí)時(shí)傳送出去,必須采用編碼技術(shù)來(lái)壓縮信息的比特量。除了已應(yīng)用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國(guó)內(nèi)外正在大力開發(fā)研究新的編碼方法,如分行編碼、自適應(yīng)網(wǎng)絡(luò)編碼、小波變換圖像壓縮編碼等。其中值得一提的是研制具備視覺、聽覺和觸覺功能的智能機(jī)器人,將會(huì)給工農(nóng)業(yè)生產(chǎn)帶來(lái)新的激勵(lì),目前已在工業(yè)生產(chǎn)中的噴漆、焊接、裝配中得到有效的利用。目前已投入運(yùn)行的高速公路不停車自動(dòng)收費(fèi)系統(tǒng)中的車輛和車牌的自動(dòng)識(shí)別都是圖像處理技術(shù)成功應(yīng)用的例子。利用計(jì)算機(jī)進(jìn)行圖像處理有兩個(gè)目的:一是產(chǎn)生適合人觀察和識(shí)別的圖像,二是希望能由計(jì)算機(jī)自動(dòng)識(shí)別和理解圖像。分割的最終結(jié)果是圖像被分解成一些具有某種特征的最小成分,稱為圖像的基元。圖像特征是指圖像中可用作標(biāo)志的屬性,它可以氛圍圖像的統(tǒng)計(jì)特性和圖像的視覺特征兩類。利用這兩類特征把圖像分解成一系列有意義的目標(biāo)或區(qū)域的過程稱為圖像的分割。特征提取是圖像分割最重要的問題之一,能否抽取出有效的特征值對(duì)分割結(jié)果有很大的影響,如果沒有好的特征值,分類方法再好也無(wú)法獲得理想的結(jié)果?;谔卣鞯姆椒ň褪菍ふ揖哂邢嗤匦缘膮^(qū)域或區(qū)域邊界,基于模型的方法就是假設(shè)一個(gè)基本的隨機(jī)過程并用過程參數(shù)作為特征。結(jié)構(gòu)特征基于假設(shè)圖像中有可檢測(cè)的基本結(jié)構(gòu)元素并按一定的規(guī)則排列。分形函數(shù)近年來(lái)受到越來(lái)越多的重視。Mandelbrot給分形的定義為:設(shè)的豪斯道夫維數(shù)是D,如果這個(gè)維數(shù)恒大于集合A的拓?fù)渚S數(shù)Dt,則稱集合A是分形集,簡(jiǎn)稱分形。1986年,Mandelbrot又給出了分形的第二個(gè)定義:組成部分與整體以某種相似的形叫做分形。簡(jiǎn)單地說(shuō)分形就是一個(gè)維數(shù)大于拓?fù)渚S數(shù)的集合。分形幾何學(xué)已經(jīng)廣泛應(yīng)用于圖像壓縮和圖像編碼,并且取得了較好的效果。分形維數(shù)特征對(duì)圖像尺度變換不敏感,與人對(duì)物體表面粗糙度的判斷有很大的相關(guān)性,由于許多自然紋理都具有線形對(duì)數(shù)功率譜,而分形維數(shù)就對(duì)應(yīng)于這種線形對(duì)數(shù)功率譜斜率的估計(jì)值,因而用分形維數(shù)描述自然紋理有一定的合理性。Blanz and Gish使用一個(gè)多層前向神經(jīng)網(wǎng)絡(luò)用于圖像分割,輸入層神經(jīng)元的數(shù)目取決于輸入特征數(shù),而輸出層神經(jīng)元的數(shù)目等同于分類的數(shù)目。Babaguchi等使用多層BP神經(jīng)網(wǎng)絡(luò),用于閾值分割圖像,輸入是統(tǒng)計(jì)直方圖,輸出是想要的閾值。但在實(shí)際應(yīng)用中,要獲得大量的樣本圖像是十分困難的。這種方法能夠分割低信噪比條件