【正文】
e at which the image brightness changes sharply or more formally has point and line detection certainly are important in any discussion on segmentation,edge dectection is by far the most mon approach for detecting meaningful discounties in gray level. Although certain literature has considered the detection of ideal step edges, the edges obtained from natural images are usually not at all ideal step edges. Instead they are normally affected by one or several of the following effects: blur caused by a finite depthoffield and finite point spread function。 視覺(jué)是人類(lèi)最高級(jí)的感知器官,所以,毫無(wú)疑問(wèn)圖像在人類(lèi)感知中扮演著最重要的角色。另一方面,有些領(lǐng)域(如計(jì)算機(jī)視覺(jué))研究的最高目標(biāo)是用計(jì)算機(jī)去模擬人類(lèi) 視覺(jué),包括理解和推理并根據(jù)視覺(jué)輸入采取行動(dòng)等。中級(jí)圖像處理是以輸入為圖像,但輸出是從這些圖像中提取的特征(如邊緣、輪廓及不同物體的標(biāo)識(shí)等)為特點(diǎn)的。 數(shù)字圖像處理的應(yīng)用領(lǐng)域多種多樣,所以文本在內(nèi)容組織上盡量達(dá)到該技術(shù)應(yīng)用領(lǐng)域的廣度。 圖像獲取是第一步處理。然而,不像增強(qiáng),圖像增強(qiáng)是主觀(guān)的,而圖像復(fù)原是客觀(guān)的。在這里,圖像被成功地細(xì)分 為較小的區(qū)域。復(fù)雜的分割過(guò)程導(dǎo)致成功解決要求物體被分別識(shí)別出來(lái)的成像問(wèn)題需要大量處理工作。則某些應(yīng)用中,這些表示方法是互補(bǔ)的。這一知識(shí)可能如圖像細(xì)節(jié)區(qū)域那樣簡(jiǎn)單,在這里,感興趣的信息被定位,這樣,限制性的搜索就被引導(dǎo)到尋找的信息處。相反,它們通常受到一個(gè)或多個(gè)下面所列因素的影響: 場(chǎng)景深度 帶來(lái)的聚焦模糊; 半影模糊 ; 陰影 ; 邊緣附近的局部 鏡面反射 或者 漫反射 。而且,甚至可以認(rèn)為這個(gè)例子中存在多個(gè)邊緣。與此相反,一個(gè)高的閾值將會(huì)遺失細(xì)的或者短的線(xiàn)段。這 種方法假設(shè)邊緣是連續(xù)的界線(xiàn),并且我們能夠跟蹤前面所看到的邊緣的模糊部分,而不會(huì)將圖像中的噪聲點(diǎn)標(biāo)記為邊緣。為了找到這些邊線(xiàn),我們可以在圖像亮度梯度的二階導(dǎo)數(shù)中尋找過(guò)零點(diǎn)。應(yīng)注意,這些定義并不能保證在一幅圖像中成功地找到邊緣,它們只是給了我們一個(gè)尋找邊緣的形式體系。術(shù)語(yǔ)“邊緣線(xiàn)段”一般在邊緣與圖像的尺寸比起來(lái)很短時(shí)才使用。在理想的連續(xù)變 化情況下,在二階導(dǎo)數(shù)中檢測(cè)過(guò)零點(diǎn)將得到梯度中的局部最大值。 一個(gè)常用的這種方法是帶有 滯后作用 的 閾值選擇 。基于零交叉的方法找到由圖像得到的二階導(dǎo)數(shù)的零交叉點(diǎn)來(lái)定位邊緣。如果將邊緣認(rèn)為是一定數(shù)量點(diǎn)亮度發(fā)生變化的地方,那么邊緣檢測(cè)大體上就是計(jì)算這個(gè)亮度變化的導(dǎo)數(shù)。相反單頭箭頭連接處理模塊。 識(shí)別是基于目標(biāo)的描述給目標(biāo)賦以符號(hào)的過(guò)程。無(wú)論哪種情況,把數(shù)據(jù)轉(zhuǎn)換成適合計(jì)算機(jī)處理的形式都是必要的。 形態(tài)學(xué)處理設(shè)計(jì)提取圖像元素的工具,它在表現(xiàn)和描述形狀方面非常有用。就使得在彩色模型、數(shù)字域的彩色處理方面涵蓋了大量基本概念?;旧?,增強(qiáng)技術(shù)后面的思 路是顯現(xiàn)那些被模糊了的細(xì)節(jié),或簡(jiǎn)單地突出一幅圖像中感興趣的特征。 建立在電磁波譜輻射基礎(chǔ)上的圖像是最熟悉的,特別是 X 射線(xiàn)和可見(jiàn)光譜圖像。舉一個(gè)簡(jiǎn)單的文本自動(dòng)分析方面的例子來(lái)具體說(shuō)明這一概念。然而,在這個(gè)連續(xù)的統(tǒng)一體中可以考慮三種典型的計(jì)算處理(即低級(jí)、中級(jí)和高級(jí)處理)來(lái)區(qū)分其中的各個(gè)學(xué)科。 圖像處理涉及的范疇或其他相關(guān)領(lǐng)域(例如,圖像分析和計(jì)算機(jī)視覺(jué))的界定在初創(chuàng)人之間并沒(méi)有一致的看法。 一幅圖像可定義為一個(gè)二維函數(shù) f(x,y),這里 x 和 y 是空間坐標(biāo),而在任何一對(duì)空間坐標(biāo)( x,y)上的幅值 f 稱(chēng)為該點(diǎn)圖像的強(qiáng)度或灰度。 blur caused by shadows created by light sources of nonzero radius。然而,人類(lèi)感知只限于電磁波譜的視覺(jué)波段,成像機(jī)器則可覆蓋幾乎全部電磁波譜,從伽馬射線(xiàn)到無(wú)線(xiàn)電波。這一領(lǐng)域本身是人工智能的分支,其目的是模仿人類(lèi)智能。最后,高級(jí)處理涉及在圖像分析中被識(shí)別物體的總體理解,以及執(zhí)行與視覺(jué)相關(guān)的識(shí)別函數(shù)(處在連續(xù)統(tǒng)一體邊緣)等。闡述 數(shù)字圖像處理應(yīng)用范圍最簡(jiǎn)單的一種方法是根據(jù)信息源來(lái)分類(lèi)(如可見(jiàn)光、 X 射線(xiàn),等等)。注意到獲取與給出一幅數(shù)字形式的圖像一樣簡(jiǎn)單。在某種意義上說(shuō),復(fù)原技術(shù)傾向于以圖像退化的數(shù)學(xué)或概率模型為基礎(chǔ)。 壓縮,正如其名稱(chēng)所指的意思,所涉及的技術(shù)是減少圖像的存儲(chǔ)量,或者在傳輸圖像時(shí)降低頻帶。另一方面,不健壯且不穩(wěn)定的分割算法幾乎總是會(huì)導(dǎo)致最終失敗。選擇一種表現(xiàn)方式僅是解決把原始數(shù)據(jù)轉(zhuǎn)換為適合計(jì)算機(jī)后續(xù)處理的形式的一部分。知識(shí)庫(kù)也可能相當(dāng)復(fù)雜,如材料檢測(cè)問(wèn)題中所有主要缺陷的相關(guān)列表或者圖像數(shù)據(jù)庫(kù)(該庫(kù)包含變化檢測(cè)應(yīng)用相關(guān)區(qū)域的高分辨率衛(wèi)星圖像)。 一個(gè)典型的邊界可能是(例如)一塊紅色和一塊黃色之間的邊界;與之相反的是 邊線(xiàn) , 可能是在另外一種不變的背景上的少數(shù)不同顏色的點(diǎn)。除非場(chǎng)景中的物體非常簡(jiǎn)單并且照明條件得到了很好的控制,否則確定一個(gè)用來(lái)判斷兩個(gè)相鄰點(diǎn)之間有多大的亮度變化才算是有邊界的閾值,并不是一件容易的事。 如果邊緣閾值應(yīng)用于正確的的梯度幅度圖像,生成的邊緣一般會(huì) 較厚,某些形式的邊緣變薄處理是必要的。 但是,我們 仍然存在 選擇適當(dāng)?shù)拈撝祬?shù) 的問(wèn)題 , 而且不同圖像的 閾值 差別也很大 。 總之,為了對(duì)有意義的邊緣點(diǎn)進(jìn)行分類(lèi),與這個(gè)點(diǎn)相聯(lián)系的灰度級(jí)變換必須比在這一點(diǎn)的背景上變換更為有效。圖像中的一階導(dǎo)數(shù)用梯度計(jì)算,二階導(dǎo)數(shù)使用拉普拉斯算子得到。因此,如果一個(gè)點(diǎn)的二維一階導(dǎo)數(shù)比指定的門(mén)限大,我們就定義圖像中的此點(diǎn)是一個(gè)邊緣點(diǎn)。這實(shí)質(zhì)上是亮度梯度的 變化率 。在一個(gè)離散矩陣中,非最大抑制階梯能夠通過(guò)一種方法來(lái)實(shí)現(xiàn),首先預(yù)測(cè)一階導(dǎo)數(shù)方向、然后把它近似到45 度的倍數(shù)、最后在預(yù)測(cè)的梯度方向比較梯度幅度。 有許多用于邊緣檢測(cè)的方法,它們大致可分為 兩類(lèi):基于搜索和基于 零交叉 .基于搜索的邊緣檢測(cè)方法首先計(jì)算邊緣強(qiáng)度,通常用一階導(dǎo)數(shù)表示,例如 梯度 模;然后,用計(jì)算估計(jì)邊緣 的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值。 在對(duì)數(shù)字圖像的處理中,邊緣檢測(cè)是一項(xiàng)非常重要的工作。這一特性上面圖 2 中的處理模塊和知識(shí)庫(kù)間用雙箭頭表示。描述也叫特征選擇,涉及提取特征,該特征是某些感興趣的定量信息或是區(qū)分一組目標(biāo)與其他目標(biāo)的基礎(chǔ)。 表示和描述幾乎總是跟隨在分割步驟的輸后邊,通常這一輸出是未加工的數(shù)據(jù),其構(gòu)成不是區(qū)域的邊緣(區(qū)分一個(gè)圖像區(qū)域和另一個(gè)區(qū)域的像素集)就是其區(qū)域本身的所有點(diǎn)。圖像壓縮技術(shù)對(duì)應(yīng)的圖像文件擴(kuò)展名對(duì)大多數(shù)計(jì)算機(jī)用戶(hù)是很熟悉的(也許沒(méi)注意),如 JPG 文件擴(kuò)展名用于 JPEG(聯(lián)合圖片專(zhuān)家組)圖像壓縮標(biāo)準(zhǔn)。 彩色圖像處理已經(jīng)成為一個(gè)重要領(lǐng)域,因?yàn)榛诨ヂ?lián)網(wǎng)的圖像處理應(yīng)用在不斷增長(zhǎng)。 圖像增強(qiáng)是數(shù)字圖像處理最簡(jiǎn)單和最有吸引力的領(lǐng)域。建模和可視化應(yīng)用中的合成圖像由計(jì)算機(jī)產(chǎn)生。這樣,在研究中,我們界定數(shù)字圖像處理包括輸入和輸出均是圖像的處理,同時(shí)也包括從 圖像中提取特征及識(shí)別特定物體的處理。 從圖像處理到計(jì)算機(jī)視覺(jué)這個(gè)連續(xù)的統(tǒng)一體內(nèi)并沒(méi)有明確的界線(xiàn)。因此,數(shù)字圖像處理涉及各種各樣的應(yīng)用領(lǐng)域。 specularities or interreflections in the vicinity of object edges. A typical edge might for instance be the border between a block of red color and a block of yellow. In contrast a line (as can be extracted by a ridge detector) can be a small number of pixels of a different color on an otherwise unchanging background. For a line, there ma y therefore usually be one edge on each side of the line. To illustrate why edge detection is not a trivial task, let us consider the problem of detecting edges in the following onedimensional signal. Here, we may intuitively say that there should be an edge between the 4th and 5th pixels. 5 7 6 4 152 148 149 If the intensity difference were smaller between the 4th and the 5th pixels and if the intensity differences between the adjacent neighbouring pixels were higher, it would not be as easy to say that there should be an edge in the corresponding region. Moreover, one could argue that this case is one in which there are several , to firmly state a specific threshold on how large the intensity change between two neighbouring pixels must be for us to say that there should be an edge between these pixels is not always a simple problem. Indeed, this is one of the reasons why edge detection may be a nontrivial problem unless the objects in the scene are particularly simple and the illumination conditions can be well controlled. There are many methods for edge detection, but most of them can be grouped into two categories,searchbased and zerocrossing based. The searchbased methods detect edges by first puting a measure of edge strength, usually a firstorder derivative expression such as the gradient magnitude, and then searching for local directional maxima of the gradient magnitude using