【正文】
ntially captures the rate of change in the intensity gradient. Thus, in the ideal continuous case, detection of zerocrossings in the second derivative captures local maxima in the gradient. We can e to a conclusion that,to be classified as a meaningful edge point,the transition in gray level associated with that point has to be significantly stronger than the background at that we are dealing with local putations,the method of choice to determine whether a value is “significant” or not id to use a we define a point in an image as being as being an edge point if its twodimensional firstorder derivative is greater than a specified criterion of connectedness is by definition an term edge segment generally is used if the edge is short in relation to the dimensions of the key problem in segmentation is to assemble edge segments into longer alternate definition if we elect to use the secondderivative is simply to define the edge ponits in an image as the zero crossings of its second definition of an edge in this case is the same as is important to note that these definitions do not guarantee success in finding edge in an simply give us a formalism to look for derivatives in an image are puted using the derivatives are obtained using the Laplacian. 數(shù)字圖像處理與邊緣檢測 數(shù)字圖像處理 數(shù)字圖像處理方法的研究源于兩個主要應(yīng)用領(lǐng)域:其一是為了便于人們分析而對圖像信息進行改進:其二是為使機器自動理解而對圖像數(shù)據(jù)進行存儲、傳輸及顯示。 從圖像處理到計算機視覺這個連續(xù)的統(tǒng)一體內(nèi)并沒有明確的界線。建模和可視化應(yīng)用中的合成圖像由計算機產(chǎn)生。 彩色圖像處理已經(jīng)成為一個重要領(lǐng)域,因為基于互聯(lián)網(wǎng)的圖像處理應(yīng)用在不斷增長。 表示和描述幾乎總是跟隨在分割步驟的輸后邊,通常這一輸出是未加工的數(shù)據(jù),其構(gòu)成不是區(qū)域的邊緣(區(qū)分一個圖像區(qū)域和另一個區(qū)域的像素集)就是其區(qū)域本身的所有點。這一特性上面圖 2 中的處理模塊和知識庫間用雙箭頭表示。 有許多用于邊緣檢測的方法,它們大致可分為 兩類:基于搜索和基于 零交叉 .基于搜索的邊緣檢測方法首先計算邊緣強度,通常用一階導(dǎo)數(shù)表示,例如 梯度 模;然后,用計算估計邊緣 的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值。這實質(zhì)上是亮度梯度的 變化率 。圖像中的一階導(dǎo)數(shù)用梯度計算,二階導(dǎo)數(shù)使用拉普拉斯算子得到。 但是,我們 仍然存在 選擇適當(dāng)?shù)拈撝祬?shù) 的問題 , 而且不同圖像的 閾值 差別也很大 。除非場景中的物體非常簡單并且照明條件得到了很好的控制,否則確定一個用來判斷兩個相鄰點之間有多大的亮度變化才算是有邊界的閾值,并不是一件容易的事。知識庫也可能相當(dāng)復(fù)雜,如材料檢測問題中所有主要缺陷的相關(guān)列表或者圖像數(shù)據(jù)庫(該庫包含變化檢測應(yīng)用相關(guān)區(qū)域的高分辨率衛(wèi)星圖像)。另一方面,不健壯且不穩(wěn)定的分割算法幾乎總是會導(dǎo)致最終失敗。在某種意義上說,復(fù)原技術(shù)傾向于以圖像退化的數(shù)學(xué)或概率模型為基礎(chǔ)。闡述 數(shù)字圖像處理應(yīng)用范圍最簡單的一種方法是根據(jù)信息源來分類(如可見光、 X 射線,等等)。這一領(lǐng)域本身是人工智能的分支,其目的是模仿人類智能。 blur caused by shadows created by light sources of nonzero radius。 圖像處理涉及的范疇或其他相關(guān)領(lǐng)域(例如,圖像分析和計算機視覺)的界定在初創(chuàng)人之間并沒有一致的看法。舉一個簡單的文本自動分析方面的例子來具體說明這一概念。基本上,增強技術(shù)后面的思 路是顯現(xiàn)那些被模糊了的細節(jié),或簡單地突出一幅圖像中感興趣的特征。 形態(tài)學(xué)處理設(shè)計提取圖像元素的工具,它在表現(xiàn)和描述形狀方面非常有用。 識別是基于目標的描述給目標賦以符號的過程。如果將邊緣認為是一定數(shù)量點亮度發(fā)生變化的地方,那么邊緣檢測大體上就是計算這個亮度變化的導(dǎo)數(shù)。 一個常用的這種方法是帶有 滯后作用 的 閾值選擇 。術(shù)語“邊緣線段”一般在邊緣與圖像的尺寸比起來很短時才使用。為了找到這些邊線,我們可以在圖像亮度梯度的二階導(dǎo)數(shù)中尋找過零點。與此相反,一個高的閾值將會遺失細的或者短的線段。相反,它們通常受到一個或多個下面所列因素的影響: 場景深度 帶來的聚焦模糊; 半影模糊 ; 陰影 ; 邊緣附近的局部 鏡面反射 或者 漫反射 。則某些應(yīng)用中,這些表示方法是互補的。在這里,圖像被成功地細分 為較小的區(qū)域。 圖像獲取是第一步處理。中級圖像處理是以輸入為圖像,但輸出是從這些圖像中提取的特征(如邊緣、輪廓及不同物體的標識等)為特點的。 視覺是人類最高級的感知器官,所以,毫無疑問圖像在人類感知中扮演著最重要的角色。當(dāng) x,y 和幅值 f 為有限的、離散的數(shù)值時,稱該圖像為數(shù)字圖像。 低級處理涉及初級操作,如降低噪聲的圖像預(yù)處理,對比度增強和圖像尖銳化。電磁波可定義為以各種波長傳播的正弦波,或者認為是一種粒子流,每個粒子包含一定(一束)能量,每束能量成為一個光子。在后續(xù)發(fā)展,彩色還是圖像中感興趣特征被提取的基礎(chǔ)。首先,必須確定數(shù)據(jù)是應(yīng)該被表現(xiàn)為邊界還是整個區(qū)域。 邊 緣檢測 邊緣檢測 是 圖像處理 和 計算機視覺 中的術(shù)語,尤其在特征檢測和特征抽取領(lǐng)域,是一種用來識別數(shù)字圖像亮度驟變點即不連續(xù)點 的算法。通常用 拉普拉斯算子 或 非線性微分方程 的零交叉點,我們將在后面的小節(jié)中描述 .濾波 做為邊緣檢測的預(yù)處理通常是必要的,通常采用 高斯濾波 。另一方面,二階導(dǎo)數(shù)中的峰值檢測是邊線檢測,只要圖像操作使用一個合適的尺度表示。此時,邊緣的定義同上面講過的定義是一樣的。一旦找到了一個開始點,我們在圖像上逐點跟蹤邊緣路徑,當(dāng)大于門檻下限時一直紀錄邊緣位置,直到數(shù)值小于下限之后才停止紀錄。例如,在下面的 1 維數(shù)據(jù)中 我們可以直觀地說在第 4 與第 5 個點之間有一個邊界: 5 7 6 4 152 148 149 如果光強度差別比第四個和第五個點之間小,或者說相鄰的像素點之間光強度差更高,就不能簡單地說相應(yīng)區(qū)域存在邊緣。關(guān)于問題域的知識以知識庫的形式被編碼裝入一個圖像處理系統(tǒng)。通常,自主分割是數(shù)字圖像處理中最為困難的任務(wù)之一。 圖像復(fù)原也是 改進圖像外貌的一個處理領(lǐng)域。這樣,我們定義的數(shù)字圖像處理的概念將在有特殊社會和經(jīng)濟價值的領(lǐng)域內(nèi)通用。例如,在這個定義下,甚至最普通的計算一幅圖像灰度平均值的工作都不能算做是圖像處理。 Digital Image Processing and Edge Detection Digital Image Processing Interest in digital image processing methods stems from two principal applica tion areas: improvement of pictorial information for human interpretation。我們認為這一定義僅是人為界定和限制。理解一頁的內(nèi)容可能要根據(jù)理解的復(fù)雜度從圖像分析或計算機視覺領(lǐng)域考慮問題。應(yīng)記住,增強是圖像處理中非常主觀的領(lǐng)域,這一點很重要。 分割過程將一幅圖 像劃分為組成部分或目標物。 到目 前為止,還沒有談到上面圖 2 中關(guān)于先驗知識及知識庫與處理模塊之間的交互這部分內(nèi)容。在這個例子中,我們的數(shù)據(jù)是一行不同點亮度的數(shù)據(jù)。首先使用一個閾值上限去尋找邊線開始的地方。如果我們選擇使用二階導(dǎo)數(shù),則另一個可用的定義是將圖像中的邊緣點定義為它的二階導(dǎo)數(shù)的零交叉點。如上所述,邊線是雙重邊緣,這樣我們就可以在邊線的一邊看到一個亮度梯度,而在另一邊看到相反的梯度。 已發(fā)表的邊緣檢測方法應(yīng)用計算邊界強度的度量, 這與平滑濾波有本質(zhì)的不同 . 正如許多邊緣檢測方法依賴于圖像梯度的計算, 他們用不同種類的濾波器來估計 x方向和 y方向的梯度 . 一旦我們計算出導(dǎo)數(shù)之后,下一步要做的就是給出一個閾值來確定哪里是邊緣位置。盡管在任何關(guān)于分割的討論中,點和線檢測都是很重要的,但是邊緣檢測對于灰度級間斷的檢測是最為普遍的檢測方法。當(dāng)注意的 焦點是外部形狀特性(如拐角和曲線)時,則邊界表示是合適的。 小波是在各種分辨率下描述圖像的基礎(chǔ)。如果光譜波段根據(jù)光譜能量進行分組,我們會得到下圖 1 所示的伽馬射線(最高能量)到無線電波( 最低能量)的光譜。低級處理是以輸入、輸出都是圖像為特點的處理。數(shù)字圖像處理是指借用數(shù)字計算機處理數(shù)字圖像,值得提及的是數(shù)字圖像是由有限的元素組成的,每一個元素都有一個特定的位置和幅值,這些元素稱為圖像元素、畫面元素或像素。像素是廣泛用于表示數(shù)字圖像元素的詞匯。中 級處理涉及分割(把圖像分為不同區(qū)域或目標物)以及縮減對目標物的描述,以使其更適合計算機處理及對不同目標的分類(識別)。如圖所示的加底紋的條帶表達了這樣一個事實,即電磁波譜的各波段間并沒有明確的界線,而是由一個波段平滑地過渡到另一個波段。特別是在應(yīng)用中,這些理論被用于圖像數(shù)據(jù)壓縮及金字塔描述方法。當(dāng)注意的焦點是內(nèi)部特性(如紋理或骨骼形狀)時,則區(qū)域表示是合適的。 雖然某些文獻提過理想的邊緣檢測步驟,但自然界圖像的邊緣并不總是理想的階梯邊緣。閾值越低,能夠檢測出的邊線越多,結(jié)果也就越容易受到 圖片噪聲 的影響,并且越 容易從圖像中挑出不相關(guān)的特性。這樣如果圖像中有邊線出現(xiàn)的話我們就能在亮度梯度上看到非常大的變化。分割的關(guān)鍵問題是如何將邊緣線段組合成更長的邊緣。這個方法使用不同的閾值去尋找邊緣。為簡化起見,我們可以先在一維空間分析邊緣檢測。如上文詳細討論的那樣,我們用識別個別目標方法的開發(fā)推出數(shù)字圖像處理的覆蓋范圍。這一章的材料將從輸出圖像處理到輸出圖像特征處理的轉(zhuǎn)換開始。一個圖像增強的例子是增強圖像的對比度,使其看起來好一些。在自動分析文本時首先獲取一幅包含文本的圖像,對該圖像進行預(yù)處理,提?。ǚ指睿┳址?,然后以適合計算機處理 的形式描述這些字符,最后識別這些字符,而所有這些操作都在本文界定的數(shù)字