【正文】
文本輸入框內(nèi)可以輸入待檢索圖像的 名稱,本實驗中的輸入范圍為 0到 999 共 1000 幅數(shù)據(jù)庫圖像,點擊“開始檢索”按鈕后, axes31 顯示待檢索圖像, 開始檢索與帶檢索圖像相關的圖像并輸出在 axes1到 axes30 中,最后的完整界面如圖 (b)所示。 對于紋理特征,我計算其距離公式為 () 同理,其中 i 為( 1,1000)中的整數(shù), 為待檢索圖像的特征矩陣, 為特征庫中第 i 幅圖像的特征矩陣,最后得到的 越小說明第 i 幅圖像與待檢索圖像相似性越高。最后,圖像總體的方向性可以通過計算直方圖中峰值的尖銳程度獲得,表示如下 : () 上式中的 p 代表直方圖中的峰值, 為直方圖中所有的峰值。 ? 對比度 對比度是通過對像素強度分布情況的統(tǒng)計得到的 。其中,前三個分量對于圖像檢索尤其重要。 首 先我將前文自動提取出來的感興趣物體 每點的像素值從 RGB顏色空間 轉(zhuǎn)化到HSV顏色空間計算, 因為 HSV顏色空間更接近于人們對顏色的主觀認識,它的三個分量分別 代表色彩( Hue)、飽和度( Saturation)和值( Value), 每點的像素值在0~ 255之間, 從 RGB空間到 HSV空間的轉(zhuǎn)化公式如下所示: 30 基于視覺感知的圖像檢索 v=max(r,g,b) s=[vmin(r,g,b)]/v () r’=[vr]/[vmin(r,g,b)] g’=[vg]/[vmin(r,g,b)] b’=[vb]/[vmin(r,g,b)] 其中 r, g, b∈ [0 … 1], h ∈ [0 … 6], and s, v ∈ [0 … 1]。而在本文中我 只考慮通用的視覺特征。因此,我們簡單地假定每 幅 圖像 中的感興趣物體數(shù)目為兩個。否則, 不 能歸入。在一般的 圖像 分割應用中,相似性條件大多為顏色一致性,而對于感興趣物體提取來 說,既要滿足顏色一致性同時也要滿足一定的注意度條件。該方法有兩個優(yōu)點 :其一,它簡單、快速、魯棒性好 。在度量 圖像 間的相似性時,依據(jù) 圖像 中感興趣物體受關注程度對應地進行匹配。模型使用的三個特征通道是亮度對比度、顏色對比度和方位朝向?qū)Ρ榷取? 模型使用高斯差分函數(shù)進行局部迭代,模擬了人腦視皮層的中央自激勵 、領域范圍內(nèi)抑制的長程連接 (longrange Connections)組織方式,從而避免了只能檢測到一個突出的顯著目標的情況,從生物角度考慮具有合理性。 表示拋棄負值 。表示使用 Gabor 濾波器對亮度金字塔進行四個方向濾波 6張,顏色特征圖 2 6張,局部方向圖 4 6張,總共 42 張?zhí)卣鲌D。 , s 表示周邊尺度, ∈ {3, 4}, I 表示亮度。 第 三 章 視覺感知技術和 Itti 視覺注意模型 17 圖 多方向多尺度 Gabor濾波器和測試圖片濾波結果 多特征圖的計算與合并 對顏色、亮度和方向多維特征,在其圖像金字塔上,應用中央周邊差操作(Center Surround Difference)。方向濾波結果灰度亮度最高,表示該區(qū)域在 45176。 },得到局部方向高斯金字塔圖 。將不同通道的信號之和與高斯低通濾波器進行卷積,獲得濾波結果并以 2為步長進行橫行和縱向的減抽樣操作,建立高斯金字塔。輸入一幅彩色圖像,首先使用線性濾波器將圖像分解為多個特征通道,提取顏色、亮度和方向等多個維度的特征 。自底向上的基于顯著度的空間視覺注意模型能夠很好地解決這一問題。這就為視覺注意計算模型的應用提供了科學的依據(jù) 。首先,12 基于視覺感知的圖像檢索 融合 圖像 的一些低層視覺特征生成關注度圖 (Saliency map)【 23】 ,然后使用一個動態(tài)的神經(jīng)網(wǎng)絡 (Dynamic neural work)按照顯著度遞減的順序依次發(fā)現(xiàn) 圖像 中的注意 點。從本質(zhì)上講,視覺注意是屬于神經(jīng)生物學范疇的概念,它意味著人具有精神或者觀察能量能夠集中的技能。 排序值評測法 10 基于視覺感知的圖像檢索 設 Q 為一幅查詢 圖像 , , ,??, 為 圖像 檢索算法輸出與 Q 相關的一且從主觀上認為相似的 圖像 (等同于上公式中的 ), ( ), i=1, 2,??, n 是它們在檢索結果中對應的排序值,則有兩個指標可以衡量檢索算法的性能 : () () 其中,第一個指標定義了所有相關 圖像 在檢索結果中的平均排序,顯然,此指標越小,檢索算法的準確率越高。 ? 準確率 (Precision rate)和回想率 (Recall rate): 對于一幅查詢 圖像 Q,其準確率和回想率分別定義為 : PR=n/T RR=n/N 其中 : N:人眼主觀從 圖像 庫中找出域 圖像 Q相似的 圖像 數(shù)目 。 ? 加權 Euclidean 距離: () 加權 Euclidean 距離考慮不同維分量的重要性,而一般的 系統(tǒng)抽取的特 征的重要性是不同的,因此此距離應用范圍很廣。 ? 幾何方法 :將紋理看作是紋理基元按照一定的幾何規(guī)則排列的組合。 ? 包含空間信息的顏色描述方法 (Spatial color):顏色直方圖的缺點是失去了象素點的位置信息 ,為了克服此缺點,許多方法在描述顏色的同時考慮了空間信息。第 三 節(jié)介紹圖像 檢索算法的評價方法。本文的方法具有以下兩個較大的 特點 : ( 1)提出了一種 圖像 檢索的新思路,即 :并不是 圖像 中的所有區(qū)域都對檢索有貢獻,真正起作用的應該是能夠引起用戶興趣的物體。目前,己經(jīng)出現(xiàn)了一些基于區(qū)域的 圖像 檢索方法,這類方法大致的思路是 :利用經(jīng)典的 圖像分割技術,首先將 圖像 分成不同的區(qū)域,然后對于每一個區(qū)域提取一些特征,如 :顏色、紋理、形狀等,并且結合基于區(qū)域的視覺特征與區(qū)域的位置等約束條件生成特征矢量,最后進行基于區(qū)域的特征匹配,輸出最為相似的 圖像 集合。它突破了傳統(tǒng)的基于文本檢索的局限,從媒體內(nèi)容中提取信息線索,實現(xiàn)了自動化、智能化圖像檢索和管理方式,便于快速、準確的查找。在如此之多的信息中,人們很容易就迷失方向,所以如何從中發(fā)現(xiàn)有用的信息是一個嚴峻的問題,對多媒體數(shù)據(jù)進行高效的管理、存取、檢索已經(jīng)成為一種比較迫切的需求。45 第一章 緒論 1 第一 章 緒論 近年來,由于圖像、視頻和音頻采集設備的廣泛應用,計算、存儲設備的性能的飛速提升,以及互聯(lián)網(wǎng)絡的興起和迅速普及,人們正在快速地進入信息化 的社會。30 相似性度量 29 Tamura 紋理特征提取 25 基于感興趣物體的特征提取與表達 24 種子區(qū)域增長和圖像分割 24 關注度圖的生成 11 視覺注意機制 5 圖像檢索中常用的低層特征描述方法 1 第一章 緒論 關鍵詞:基于內(nèi)容圖像檢索 高斯金字塔 種子區(qū)域增長算法 感興趣區(qū) ABSTRACT ABSTRACT With the development of multimedia technology, the application of Inter and the rapid increment of multimedia database, we have more and more digital images. In order to manage and retrieve those information, the CBIR(ContentBased Image Retrieval) has came into being and emerged to be one of the hot research areas in digital image domain. As the CBIR technology improved, visual perceptionbased image retrieval technology gradually became activity. It is retrieved based on human visual attention mechanism characteristics. So it can enhance the accuracy of image retrieval .This paper focus on image retrieval based on visual perception .And proposes a method to make it e true. These paper use Itti’s visual attention model to get the attentiondegree of the whole image which shows the level of individual attention to every parts of the image. On the base of the concern degree map ,I extract the interested objects in the image automatically with seed region growing technique .And different with the general image segmentation technologies, the process of seed points selection and regional growth bines the information of individual visual attention degree. At the end of the paper, I make a GUI search interface with the MATLAB graphical user interface. And make the search platform based on the visual perception of the image e true. Key words: contentbased image retrieval Gaussian pyramid seed region growing algorithm regions of interest 目錄 i 目 錄 摘要 摘要 摘 要 多媒體技術的快速發(fā)展與互聯(lián)網(wǎng)技術的日益普及, 使 我 們擁有越來越多的數(shù)字圖像數(shù)據(jù) 。5 圖像檢索中的相似性度量方法 23 感興趣物體的自動提取算法 各種多媒體信息層出不窮、數(shù)據(jù)量急劇增加,成為了人們獲取信息的重要來源,其形式包括:圖像、圖形、動畫、視頻、文本以及音頻等。所以面對大量的各式各樣的圖像數(shù)據(jù)庫,對圖像數(shù)據(jù)庫的管理工作成了一個迫在眉睫的研究課題,圖像檢索技術就是其中的核心技術之一。 CBIR與傳統(tǒng)的基于文本的檢索方法相比 ,克服了人工描述的各種缺點,減少了工作量,適用于現(xiàn)在大規(guī)模的圖像數(shù)據(jù)的檢索。 然而,現(xiàn)有的這些基于區(qū)域的 圖像 檢索方法仍然具有以下幾個沒有解決的問題 : ( 1)由于 圖像 分割仍然是 圖像 處理和計算機視覺領域一個相當困難的課題,目前的技術還無法保證準確地提取到 圖像 中的物體 : ( 2)用戶對多數(shù)提取出的區(qū)域不感興趣,因此使用用戶不感興趣的區(qū)域進行檢索不但無法體現(xiàn)用戶的檢索目的,而且,這些無關的區(qū)域往往難以正確 的匹配,導致檢索準確率的降低。所以,本文的算法首先提取 圖像 中用戶感興趣的物體,用它們來代表 圖像 特征,進而檢索 圖像 。 圖像 檢索中常用的低層特征描述方法 目前,用于 圖像 檢索的低層視覺特征主要有三種 :顏色、形狀和紋理 【 3】【 4】【 5】 。 Huang 提出了一種 Color correlogram 的描述子,它的本質(zhì)是用顏色對相對于距離的分布來描述顏色信息