【正文】
圖像中的一階導(dǎo)數(shù)用梯度計(jì)算,二階導(dǎo)數(shù)使用拉普拉斯算子得到。此時(shí),邊緣的定義同上面講過(guò)的定義是一樣的。分割的關(guān)鍵問(wèn)題是如何將邊緣線段組合成更長(zhǎng)的邊緣。因此,如果一個(gè)點(diǎn)的二維一階導(dǎo)數(shù)比指定的門限大,我們就定義圖像中的此點(diǎn)是一個(gè)邊緣點(diǎn)。 總之,為了對(duì)有意義的邊緣點(diǎn)進(jìn)行分類,與這個(gè)點(diǎn)相聯(lián)系的灰度級(jí)變換必須比在這一點(diǎn)的背景上變換更為有效。這樣如果圖像中有邊線出現(xiàn)的話我們就能在亮度梯度上看到非常大的變化。另一方面,二階導(dǎo)數(shù)中的峰值檢測(cè)是邊線檢測(cè),只要圖像操作使用一個(gè)合適的尺度表示。這實(shí)質(zhì)上是亮度梯度的 變化率 。 但是,我們 仍然存在 選擇適當(dāng)?shù)拈撝祬?shù) 的問(wèn)題 , 而且不同圖像的 閾值 差別也很大 。一旦找到了一個(gè)開(kāi)始點(diǎn),我們?cè)趫D像上逐點(diǎn)跟蹤邊緣路徑,當(dāng)大于門檻下限時(shí)一直紀(jì)錄邊緣位置,直到數(shù)值小于下限之后才停止紀(jì)錄。這個(gè)方法使用不同的閾值去尋找邊緣。在一個(gè)離散矩陣中,非最大抑制階梯能夠通過(guò)一種方法來(lái)實(shí)現(xiàn),首先預(yù)測(cè)一階導(dǎo)數(shù)方向、然后把它近似到45 度的倍數(shù)、最后在預(yù)測(cè)的梯度方向比較梯度幅度。 如果邊緣閾值應(yīng)用于正確的的梯度幅度圖像,生成的邊緣一般會(huì) 較厚,某些形式的邊緣變薄處理是必要的。閾值越低,能夠檢測(cè)出的邊線越多,結(jié)果也就越容易受到 圖片噪聲 的影響,并且越 容易從圖像中挑出不相關(guān)的特性。通常用 拉普拉斯算子 或 非線性微分方程 的零交叉點(diǎn),我們將在后面的小節(jié)中描述 .濾波 做為邊緣檢測(cè)的預(yù)處理通常是必要的,通常采用 高斯濾波 。 有許多用于邊緣檢測(cè)的方法,它們大致可分為 兩類:基于搜索和基于 零交叉 .基于搜索的邊緣檢測(cè)方法首先計(jì)算邊緣強(qiáng)度,通常用一階導(dǎo)數(shù)表示,例如 梯度 模;然后,用計(jì)算估計(jì)邊緣 的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值。除非場(chǎng)景中的物體非常簡(jiǎn)單并且照明條件得到了很好的控制,否則確定一個(gè)用來(lái)判斷兩個(gè)相鄰點(diǎn)之間有多大的亮度變化才算是有邊界的閾值,并不是一件容易的事。例如,在下面的 1 維數(shù)據(jù)中 我們可以直觀地說(shuō)在第 4 與第 5 個(gè)點(diǎn)之間有一個(gè)邊界: 5 7 6 4 152 148 149 如果光強(qiáng)度差別比第四個(gè)和第五個(gè)點(diǎn)之間小,或者說(shuō)相鄰的像素點(diǎn)之間光強(qiáng)度差更高,就不能簡(jiǎn)單地說(shuō)相應(yīng)區(qū)域存在邊緣。為簡(jiǎn)化起見(jiàn),我們可以先在一維空間分析邊緣檢測(cè)。 在對(duì)數(shù)字圖像的處理中,邊緣檢測(cè)是一項(xiàng)非常重要的工作。 一個(gè)典型的邊界可能是(例如)一塊紅色和一塊黃色之間的邊界;與之相反的是 邊線 , 可能是在另外一種不變的背景上的少數(shù)不同顏色的點(diǎn)。 雖然某些文獻(xiàn)提過(guò)理想的邊緣檢測(cè)步驟,但自然界圖像的邊緣并不總是理想的階梯邊緣。 邊 緣檢測(cè) 邊緣檢測(cè) 是 圖像處理 和 計(jì)算機(jī)視覺(jué) 中的術(shù)語(yǔ),尤其在特征檢測(cè)和特征抽取領(lǐng)域,是一種用來(lái)識(shí)別數(shù)字圖像亮度驟變點(diǎn)即不連續(xù)點(diǎn) 的算法。這一特性上面圖 2 中的處理模塊和知識(shí)庫(kù)間用雙箭頭表示。知識(shí)庫(kù)也可能相當(dāng)復(fù)雜,如材料檢測(cè)問(wèn)題中所有主要缺陷的相關(guān)列表或者圖像數(shù)據(jù)庫(kù)(該庫(kù)包含變化檢測(cè)應(yīng)用相關(guān)區(qū)域的高分辨率衛(wèi)星圖像)。關(guān)于問(wèn)題域的知識(shí)以知識(shí)庫(kù)的形式被編碼裝入一個(gè)圖像處理系統(tǒng)。如上文詳細(xì)討論的那樣,我們用識(shí)別個(gè)別目標(biāo)方法的開(kāi)發(fā)推出數(shù)字圖像處理的覆蓋范圍。描述也叫特征選擇,涉及提取特征,該特征是某些感興趣的定量信息或是區(qū)分一組目標(biāo)與其他目標(biāo)的基礎(chǔ)。選擇一種表現(xiàn)方式僅是解決把原始數(shù)據(jù)轉(zhuǎn)換為適合計(jì)算機(jī)后續(xù)處理的形式的一部分。當(dāng)注意的焦點(diǎn)是內(nèi)部特性(如紋理或骨骼形狀)時(shí),則區(qū)域表示是合適的。首先,必須確定數(shù)據(jù)是應(yīng)該被表現(xiàn)為邊界還是整個(gè)區(qū)域。 表示和描述幾乎總是跟隨在分割步驟的輸后邊,通常這一輸出是未加工的數(shù)據(jù),其構(gòu)成不是區(qū)域的邊緣(區(qū)分一個(gè)圖像區(qū)域和另一個(gè)區(qū)域的像素集)就是其區(qū)域本身的所有點(diǎn)。另一方面,不健壯且不穩(wěn)定的分割算法幾乎總是會(huì)導(dǎo)致最終失敗。通常,自主分割是數(shù)字圖像處理中最為困難的任務(wù)之一。這一章的材料將從輸出圖像處理到輸出圖像特征處理的轉(zhuǎn)換開(kāi)始。圖像壓縮技術(shù)對(duì)應(yīng)的圖像文件擴(kuò)展名對(duì)大多數(shù)計(jì)算機(jī)用戶是很熟悉的(也許沒(méi)注意),如 JPG 文件擴(kuò)展名用于 JPEG(聯(lián)合圖片專家組)圖像壓縮標(biāo)準(zhǔn)。 壓縮,正如其名稱所指的意思,所涉及的技術(shù)是減少圖像的存儲(chǔ)量,或者在傳輸圖像時(shí)降低頻帶。特別是在應(yīng)用中,這些理論被用于圖像數(shù)據(jù)壓縮及金字塔描述方法。在后續(xù)發(fā)展,彩色還是圖像中感興趣特征被提取的基礎(chǔ)。 彩色圖像處理已經(jīng)成為一個(gè)重要領(lǐng)域,因?yàn)榛诨ヂ?lián)網(wǎng)的圖像處理應(yīng)用在不斷增長(zhǎng)。在某種意義上說(shuō),復(fù)原技術(shù)傾向于以圖像退化的數(shù)學(xué)或概率模型為基礎(chǔ)。 圖像復(fù)原也是 改進(jìn)圖像外貌的一個(gè)處理領(lǐng)域。一個(gè)圖像增強(qiáng)的例子是增強(qiáng)圖像的對(duì)比度,使其看起來(lái)好一些。 圖像增強(qiáng)是數(shù)字圖像處理最簡(jiǎn)單和最有吸引力的領(lǐng)域。注意到獲取與給出一幅數(shù)字形式的圖像一樣簡(jiǎn)單。如圖所示的加底紋的條帶表達(dá)了這樣一個(gè)事實(shí),即電磁波譜的各波段間并沒(méi)有明確的界線,而是由一個(gè)波段平滑地過(guò)渡到另一個(gè)波段。電磁波可定義為以各種波長(zhǎng)傳播的正弦波,或者認(rèn)為是一種粒子流,每個(gè)粒子包含一定(一束)能量,每束能量成為一個(gè)光子。建模和可視化應(yīng)用中的合成圖像由計(jì)算機(jī)產(chǎn)生。闡述 數(shù)字圖像處理應(yīng)用范圍最簡(jiǎn)單的一種方法是根據(jù)信息源來(lái)分類(如可見(jiàn)光、 X 射線,等等)。這樣,我們定義的數(shù)字圖像處理的概念將在有特殊社會(huì)和經(jīng)濟(jì)價(jià)值的領(lǐng)域內(nèi)通用。在自動(dòng)分析文本時(shí)首先獲取一幅包含文本的圖像,對(duì)該圖像進(jìn)行預(yù)處理,提?。ǚ指睿┳址?,然后以適合計(jì)算機(jī)處理 的形式描述這些字符,最后識(shí)別這些字符,而所有這些操作都在本文界定的數(shù)字圖像處理的范圍內(nèi)。這樣,在研究中,我們界定數(shù)字圖像處理包括輸入和輸出均是圖像的處理,同時(shí)也包括從 圖像中提取特征及識(shí)別特定物體的處理。最后,高級(jí)處理涉及在圖像分析中被識(shí)別物體的總體理解,以及執(zhí)行與視覺(jué)相關(guān)的識(shí)別函數(shù)(處在連續(xù)統(tǒng)一體邊緣)等。中 級(jí)處理涉及分割(把圖像分為不同區(qū)域或目標(biāo)物)以及縮減對(duì)目標(biāo)物的描述,以使其更適合計(jì)算機(jī)處理及對(duì)不同目標(biāo)的分類(識(shí)別)。 低級(jí)處理涉及初級(jí)操作,如降低噪聲的圖像預(yù)處理,對(duì)比度增強(qiáng)和圖像尖銳化。 從圖像處理到計(jì)算機(jī)視覺(jué)這個(gè)連續(xù)的統(tǒng)一體內(nèi)并沒(méi)有明確的界線。這一領(lǐng)域本身是人工智能的分支,其目的是模仿人類智能。例如,在這個(gè)定義下,甚至最普通的計(jì)算一幅圖像灰度平均值的工作都不能算做是圖像處理。有時(shí)用處理的輸入和輸出內(nèi)容都是圖像這一特點(diǎn)來(lái)界定圖像處理的范圍。因此,數(shù)字圖像處理涉及各種各樣的應(yīng)用領(lǐng)域。然而,人類感知只限于電磁波譜的視覺(jué)波段,成像機(jī)器則可覆蓋幾乎全部電磁波譜,從伽馬射線到無(wú)線電波。像素是廣泛用于表示數(shù)字圖像元素的詞匯。當(dāng) x,y 和幅值 f 為有限的、離散的數(shù)值時(shí),稱該圖像為數(shù)字圖像。 specularities or interreflections in the vicinity of object edges. A typical edge might for instance be the border between a block of red color and a block of yellow. In contrast a line (as can be extracted by a ridge detector) can be a small number of pixels of a different color on an otherwise unchanging background. For a line, there ma y therefore usually be one edge on each side of the line. To illustrate why edge detection is not a trivial task, let us consider the problem of detecting edges in the following onedimensional signal. Here, we may intuitively say that there should be an edge between the 4th and 5th pixels. 5 7 6 4 152 148 149 If the intensity difference were smaller between the 4th and the 5th pixels and if the intensity differences between the adjacent neighbouring pixels were higher, it would not be as easy to say that there should be an edge in the corresponding region. Moreover, one could argue that this case is one in which there are several , to firmly state a specific threshold on how large the intensity change between two neighbouring pixels must be for us to say that there should be an edge between these pixels is not always a simple problem. Indeed, this is one of the reasons why edge detection may be a nontrivial problem unless the objects in the scene are particularly simple and the illumination conditions can be well controlled. There are many methods for edge detection, but most of them can be grouped into two categories,searchbased and zerocrossing based. The searchbased methods detect edges by first puting a measure of edge strength, usually a firstorder derivative expression such as the gradient magnitude, and then searching for local directional maxima of the gradient magnitude using a puted estimate of the local orientation of the edge, usually the gradient direction. The zerocrossing based methods search for zero crossings in a secondorder derivative expression puted from the image in order to find edges, usually the zerocrossings of the Laplacian or the zerocrossings of a nonlinear differential expression, as will be described in the section on differential edge detection following below. As a preprocess