【正文】
如果我們選擇使用二階導(dǎo)數(shù),則另一個(gè)可用的定義是將圖像中的邊緣點(diǎn)定義為它的二階導(dǎo)數(shù)的零交叉點(diǎn)。如上所述,邊線是雙重邊緣,這樣我們就可以在邊線的一邊看到一個(gè)亮度梯度,而在另一邊看到相反的梯度。首先使用一個(gè)閾值上限去尋找邊線開(kāi)始的地方。 已發(fā)表的邊緣檢測(cè)方法應(yīng)用計(jì)算邊界強(qiáng)度的度量, 這與平滑濾波有本質(zhì)的不同 . 正如許多邊緣檢測(cè)方法依賴于圖像梯度的計(jì)算, 他們用不同種類的濾波器來(lái)估計(jì) x方向和 y方向的梯度 . 一旦我們計(jì)算出導(dǎo)數(shù)之后,下一步要做的就是給出一個(gè)閾值來(lái)確定哪里是邊緣位置。在這個(gè)例子中,我們的數(shù)據(jù)是一行不同點(diǎn)亮度的數(shù)據(jù)。盡管在任何關(guān)于分割的討論中,點(diǎn)和線檢測(cè)都是很重要的,但是邊緣檢測(cè)對(duì)于灰度級(jí)間斷的檢測(cè)是最為普遍的檢測(cè)方法。 到目 前為止,還沒(méi)有談到上面圖 2 中關(guān)于先驗(yàn)知識(shí)及知識(shí)庫(kù)與處理模塊之間的交互這部分內(nèi)容。當(dāng)注意的 焦點(diǎn)是外部形狀特性(如拐角和曲線)時(shí),則邊界表示是合適的。 分割過(guò)程將一幅圖 像劃分為組成部分或目標(biāo)物。 小波是在各種分辨率下描述圖像的基礎(chǔ)。應(yīng)記住,增強(qiáng)是圖像處理中非常主觀的領(lǐng)域,這一點(diǎn)很重要。如果光譜波段根據(jù)光譜能量進(jìn)行分組,我們會(huì)得到下圖 1 所示的伽馬射線(最高能量)到無(wú)線電波( 最低能量)的光譜。理解一頁(yè)的內(nèi)容可能要根據(jù)理解的復(fù)雜度從圖像分析或計(jì)算機(jī)視覺(jué)領(lǐng)域考慮問(wèn)題。低級(jí)處理是以輸入、輸出都是圖像為特點(diǎn)的處理。我們認(rèn)為這一定義僅是人為界定和限制。數(shù)字圖像處理是指借用數(shù)字計(jì)算機(jī)處理數(shù)字圖像,值得提及的是數(shù)字圖像是由有限的元素組成的,每一個(gè)元素都有一個(gè)特定的位置和幅值,這些元素稱為圖像元素、畫面元素或像素。 Digital Image Processing and Edge Detection Digital Image Processing Interest in digital image processing methods stems from two principal applica tion areas: improvement of pictorial information for human interpretation。像素是廣泛用于表示數(shù)字圖像元素的詞匯。例如,在這個(gè)定義下,甚至最普通的計(jì)算一幅圖像灰度平均值的工作都不能算做是圖像處理。中 級(jí)處理涉及分割(把圖像分為不同區(qū)域或目標(biāo)物)以及縮減對(duì)目標(biāo)物的描述,以使其更適合計(jì)算機(jī)處理及對(duì)不同目標(biāo)的分類(識(shí)別)。這樣,我們定義的數(shù)字圖像處理的概念將在有特殊社會(huì)和經(jīng)濟(jì)價(jià)值的領(lǐng)域內(nèi)通用。如圖所示的加底紋的條帶表達(dá)了這樣一個(gè)事實(shí),即電磁波譜的各波段間并沒(méi)有明確的界線,而是由一個(gè)波段平滑地過(guò)渡到另一個(gè)波段。 圖像復(fù)原也是 改進(jìn)圖像外貌的一個(gè)處理領(lǐng)域。特別是在應(yīng)用中,這些理論被用于圖像數(shù)據(jù)壓縮及金字塔描述方法。通常,自主分割是數(shù)字圖像處理中最為困難的任務(wù)之一。當(dāng)注意的焦點(diǎn)是內(nèi)部特性(如紋理或骨骼形狀)時(shí),則區(qū)域表示是合適的。關(guān)于問(wèn)題域的知識(shí)以知識(shí)庫(kù)的形式被編碼裝入一個(gè)圖像處理系統(tǒng)。 雖然某些文獻(xiàn)提過(guò)理想的邊緣檢測(cè)步驟,但自然界圖像的邊緣并不總是理想的階梯邊緣。例如,在下面的 1 維數(shù)據(jù)中 我們可以直觀地說(shuō)在第 4 與第 5 個(gè)點(diǎn)之間有一個(gè)邊界: 5 7 6 4 152 148 149 如果光強(qiáng)度差別比第四個(gè)和第五個(gè)點(diǎn)之間小,或者說(shuō)相鄰的像素點(diǎn)之間光強(qiáng)度差更高,就不能簡(jiǎn)單地說(shuō)相應(yīng)區(qū)域存在邊緣。閾值越低,能夠檢測(cè)出的邊線越多,結(jié)果也就越容易受到 圖片噪聲 的影響,并且越 容易從圖像中挑出不相關(guān)的特性。一旦找到了一個(gè)開(kāi)始點(diǎn),我們?cè)趫D像上逐點(diǎn)跟蹤邊緣路徑,當(dāng)大于門檻下限時(shí)一直紀(jì)錄邊緣位置,直到數(shù)值小于下限之后才停止紀(jì)錄。這樣如果圖像中有邊線出現(xiàn)的話我們就能在亮度梯度上看到非常大的變化。此時(shí),邊緣的定義同上面講過(guò)的定義是一樣的。分割的關(guān)鍵問(wèn)題是如何將邊緣線段組合成更長(zhǎng)的邊緣。另一方面,二階導(dǎo)數(shù)中的峰值檢測(cè)是邊線檢測(cè),只要圖像操作使用一個(gè)合適的尺度表示。這個(gè)方法使用不同的閾值去尋找邊緣。通常用 拉普拉斯算子 或 非線性微分方程 的零交叉點(diǎn),我們將在后面的小節(jié)中描述 .濾波 做為邊緣檢測(cè)的預(yù)處理通常是必要的,通常采用 高斯濾波 。為簡(jiǎn)化起見(jiàn),我們可以先在一維空間分析邊緣檢測(cè)。 邊 緣檢測(cè) 邊緣檢測(cè) 是 圖像處理 和 計(jì)算機(jī)視覺(jué) 中的術(shù)語(yǔ),尤其在特征檢測(cè)和特征抽取領(lǐng)域,是一種用來(lái)識(shí)別數(shù)字圖像亮度驟變點(diǎn)即不連續(xù)點(diǎn) 的算法。如上文詳細(xì)討論的那樣,我們用識(shí)別個(gè)別目標(biāo)方法的開(kāi)發(fā)推出數(shù)字圖像處理的覆蓋范圍。首先,必須確定數(shù)據(jù)是應(yīng)該被表現(xiàn)為邊界還是整個(gè)區(qū)域。這一章的材料將從輸出圖像處理到輸出圖像特征處理的轉(zhuǎn)換開(kāi)始。在后續(xù)發(fā)展,彩色還是圖像中感興趣特征被提取的基礎(chǔ)。一個(gè)圖像增強(qiáng)的例子是增強(qiáng)圖像的對(duì)比度,使其看起來(lái)好一些。電磁波可定義為以各種波長(zhǎng)傳播的正弦波,或者認(rèn)為是一種粒子流,每個(gè)粒子包含一定(一束)能量,每束能量成為一個(gè)光子。在自動(dòng)分析文本時(shí)首先獲取一幅包含文本的圖像,對(duì)該圖像進(jìn)行預(yù)處理,提?。ǚ指睿┳址缓笠赃m合計(jì)算機(jī)處理 的形式描述這些字符,最后識(shí)別這些字符,而所有這些操作都在本文界定的數(shù)字圖像處理的范圍內(nèi)。 低級(jí)處理涉及初級(jí)操作,如降低噪聲的圖像預(yù)處理,對(duì)比度增強(qiáng)和圖像尖銳化。有時(shí)用處理的輸入和輸出內(nèi)容都是圖像這一特點(diǎn)來(lái)界定圖像處理的范圍。當(dāng) x,y 和幅值 f 為有限的、離散的數(shù)值時(shí),稱該圖像為數(shù)字圖像。 and processing of image data for storage, transmission, and representation for au tonomous machine perception. An image may be defined as a twodimensional function, f(x, y), where x and y are spatial (plane) coordinates, and the amplitude of f at any pair of coordinates (x, y) is called the intensity or gray level of the image at that point. When x, y, and the amplitude values of f are all finite, discrete quantities, we call the image a digital image. The field of digital image processing refers to processing digital images by means of a digital puter. Note that a digital image is posed of a finite number of elements, each of which has a particular location and value. These elements are referred to as picture elements, image elements, pels, and pixels. Pixel is the term most widely used to denote the elements of a digital image. Vision is the most advanced of our senses, so it is not surprising that images play the single most important role in human perception. However, unlike humans, who are limited to the visual band of the electromagic (EM) spec trum, imaging machines cover almost the entire EM spectrum, ranging from gamma to radio waves. They can operate on images generated by sources that humans are not accustomed to associating with images. These include ultra sound, electron microscopy, and putergenerated images. Thus, digital image processing enpasses a wide and varied field of applications. There is no general agreement among authors regarding where image processing stops and other related areas, such as image analysis and puter vi sion, start. Sometimes a distinction is made by defining image processing as a discipline in which both the input and output of a process are images. We believe this to be a limiting and somewhat artificial boundary. For example, under this definition, even the trivial task of puting the average intensity of an image (which yields a single number) would not be considered an image processing operation. On the other hand, there are fields such as puter vision whose ultimate goal is to use puters to emulate human vision, including learning and being able to make inferences and take actions based on visual inputs. This area itself is a branch of artificial intelligence (AI) whose objective is to emulate human intelligence. The field of AI is in its earliest stages of infancy in terms of development, with progress having been much slower than originally anticipated. The area of image analysis (also called image understanding) is in be tween image processing and puter vision. There are no clearcut boundaries in the continuum from image processing at on