【正文】
中文圖書分類號: TP391 密 級:公開 UDC: 39 學 校 代 碼: 10005 碩 士 學 位 論 文 MASTERAL DISSERTATION 論 文 題 目: 基于圖像 自動標注算法研究及系統(tǒng)實現(xiàn) 論 文 作 者: 安震 學 科: 電路與系統(tǒng) 指 導 教 師: 賈克斌 論文 提交 日期: 2021 年 4 月 UDC: 39 學校代碼: 10005 中文圖書分類號: TP391 學 號: S202102021 密 級: 公開 北京工業(yè)大學工學碩士學位論文 題 目 : 基于圖像 自動標注算法 研究 及系統(tǒng)實現(xiàn) 英 文 題 目 : RESEARCH OF AUTOMATIC IMAGE ANNOTATION ALGORITHM AND THE IMPLEMENTATION OF SYSTEM 論 文 作 者 : 安震 學科 : 電路與系統(tǒng) 研 究 方 向 : 數(shù)字多媒體信息處理 申 請 學 位 : 工學碩士 指 導 教 師 : 賈克斌 教授 所 在 單 位 : 電子信息與控制工程學院 答 辯 日 期 : 2021 年 6 月 授 予 學位 單位 : 北京工業(yè)大學 獨 創(chuàng) 性 聲 明 本人聲明所呈交的論文是我個人在導師指導下進行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標注和致謝的地方外,論文中不包 含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得北京工業(yè)大學或其它教育機構(gòu)的學位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。 簽 名: 安震 日 期: 202153 關(guān)于論文使用授權(quán)的說明 本人完全了解北京工業(yè)大學有關(guān)保留、使用學位論文的規(guī)定,即:學校有權(quán)保留送交論文的復印件,允許論文被查閱和借閱;學校可以公布論文的全部或部分內(nèi)容,可以采用影印、縮印或其他復制手段保存論文。 (保密的論文在解密后應遵守 此規(guī)定) 簽 名: 安震 導師簽名: 賈克斌 日 期: 202153 Abstract ??III? 摘 要 隨著互聯(lián)網(wǎng) 技術(shù) 和數(shù)字圖像技術(shù)的迅猛發(fā)展, 數(shù)字圖像信息成幾何級數(shù)增長。 網(wǎng)絡已經(jīng)成為數(shù)字圖像信息展示的重要途徑。 圖像資料直觀逼真、生動形象,既與其他類型資源相互補充,更是一種獨立的信息載體。網(wǎng)絡上數(shù)以億計的圖像信息遠未被人們所充分利用。 如何 能夠快速、準確、有效地從海量 數(shù)字圖像 數(shù)據(jù)信息 中尋找到感興趣的圖像已經(jīng)成為當今圖像處理領域的重要研究題。 目前 雖然出現(xiàn)了很多基于內(nèi)容的圖像檢索 技術(shù),并開發(fā)了相應的檢索系統(tǒng)如 WebSEEK、QBIC、 Photobook、 Chabot等 , 但是 基于內(nèi)容的圖像檢索 , 結(jié)果往往不盡如人意。另一種 圖像檢索技術(shù) 是目前互聯(lián)網(wǎng)上所有主流圖像搜索引擎均采用的基于文本標注的檢索方法?;谖谋緲俗⒌姆绞酵ǔP枰止し绞竭M行圖像的語義標注,標注工作量大,基于文本的手工標注方式根本無法滿足海量圖像標注的需求。因此,基于圖像語義 的自動標注算法的研究成為圖像檢索領域中一個十分重要和關(guān)鍵的技術(shù),并 具有很好的研究意義和應用前景。 本文重點 分析 了當前 自動圖像標注 的相關(guān)技術(shù) , 以 聯(lián)合媒體相 關(guān)模型 圖像標注算法為基礎, 深入分析、研究了圖像標注 中應用到的關(guān)鍵技術(shù),如圖像分割、圖像聚類、詞間相關(guān)性的獲取等。 在此基礎上, 設計了并構(gòu)建了一個 自動圖像標注及檢索系統(tǒng)。論文完成的主要工作包括以下幾個方面: 1)實現(xiàn)了一種改進的基于 普擴散理論的 圖像分割算法。 該 算法以普擴散理論為依據(jù),通過在 輸入節(jié)點集合附近 尋找特征方程的最優(yōu)解,實現(xiàn)對圖像的準確 分割。作為圖像自動分割方法的一種輔助分割手段,能夠有效地提高針對復雜圖像的分割精度 。 2)提出了基于 區(qū)域密度的 RPCL圖像聚類改進算法 。 該算法最大的優(yōu)勢是不僅能夠自動確定聚 類個數(shù) ,而且能夠自動調(diào)整 RPCL中次勝單元的學習率, 進一步優(yōu)化了圖像聚類效果。 3)提出了 語義相似語言模型 和 CMRM 相結(jié)合 的圖像自動標注改進算法。該算法將語言模型引入到 CMRM 當中, 進一步優(yōu)化了圖像自動標注效果。 4) 設計并實現(xiàn)了圖像自動標注及檢索系統(tǒng)。 該 系統(tǒng)可以實現(xiàn)對未標注圖像進行自動標注以及基于內(nèi)容的圖像檢索。 關(guān)鍵詞 : 語言模型 ; 圖像 自動標注 ; CMRM; 圖像分割 ; 圖像聚類 ; RPCL Abstract With the rapid development of inter technology and digital imaging technology, digital image information have increased geometrically. At the same time work has bee an important approach to display digital image information. Image materials are Intuitive, lifelike and vivid, which not only plement other types of resources by each other, but also are independent carriers. Millions of image information on the work is far from being fully utilized. How to search the interesting images from the massive digital image data information quickly and accurately has bee the important research topic in the field of image processing. Now there39。s been a lot of contentbased image retrieval technology, and the corresponding retrieval systems such as WebSEEK, QBIC, Photobook, Chabot have been ing into sight, but the results of contentbased image retrieval are often unsatisfactory. Another image retrieval technology is text annotation based image retrieval which is used by all major image search engines on the inter at present. Text annotation based methods usually require semantic annotation of images manually, which bring marking heavy workload and the manual way can not meet the huge demand for image annotation. Therefore, the research on automatic annotation algorithm based on image semantic has bee extremely important and crucial in the field of image retrieval which has excellent research and application prospects. This article focuses on analyzing the related automatic image annotation technology, based on the bined mediarelated model image annotation algorithm. With deep analysis of the key technologies applied to image annotation, such as image segmentation, image clustering, correlation derivation between words and so on, an automatic image annotation and retrieval system based on semantic models is designed and built. The main work of the paper includes: 1) An improved image segmentation algorithm based on general theory of spectral relaxation is proposed in this paper. The algorithm is based on the general theory of spectral relaxation, by finding optimal solutions of the characteristic equation near the input node set, to achieve an accurate segmentation of images. As a secondary segmentation of image segmentation method, it can effectively improve the accuracy of plex image segmentation. 2) An improved RPCL image clustering algorithm bsed on region density is proposed, and the maximum advantage of the algorithm is not only to be able to automatically determine the number of clusters, but also can automatically adjust the delearning rate in RPCL. This algorithm further optimized the image clustering effect. Abstract ??V? 3) An improved semantic similarity language model based algorithm for automatic image annotation is proposed. This algorithm brings the language model to CMRM, and further optimizes the effect of image annotation. 4) An automatic image annotation and retrieval system is also designed in this paper. In this system auto annotation and contentbased image retrieval can be processed to unannotated images. Keywords: language model , image automatic annotation , CMRM , image segmentation, image clustering, RPCL目 錄 I 目 錄 摘 要 .......................................................................................................................... III ABSTRACT ..................................................................