freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

軟件工程畢業(yè)設(shè)計-圖像檢索系統(tǒng)的設(shè)計與實現(xiàn)-閱讀頁

2024-12-24 09:43本頁面
  

【正文】 信息來源:通過分析 HTML 文檔找到圖片和相關(guān)的文字 提取方法:不能確知網(wǎng)頁作者組織信息的方法,將最可能與某圖片相關(guān)的位置的文字作為圖片的文字描述信息 常用提取模式: 1 img標記 從 src 獲取圖片來源 從 alt, title 獲取相關(guān)文字信息 獲得 width 和 height,用于以后的過濾 2 網(wǎng)頁的標題 圖片與所在網(wǎng)頁相關(guān),因此和網(wǎng)頁的標題相關(guān) 提取 title下的文字。有時 title使用缺省的名字(如 new page 或者 Untitled Document) ,需要 過濾 3 網(wǎng)頁的 meta 標記 也是對網(wǎng)頁內(nèi)容的描述 可以提取其中的 keywords 和 description 的值 無用圖片過濾: 1文件尺寸比較小(包括長寬和大?。? 利用 HTML 提取到的 width 和 height,以及實際圖片的 width 和 height 2長寬比例較大 3同一網(wǎng)頁內(nèi)有多個 img引用它 重要的圖片不會在一頁內(nèi)出現(xiàn)多次 出現(xiàn)多次的通常是裝飾圖片 4 GIF 和 JPG圖片的區(qū)別 GIF 只有 256 色,但可動態(tài),通常用于裝飾性圖片和廣告 JPG 壓縮比高,常用于存儲大尺寸文件 通常情況下, JPG 圖片有意義的比例要大大高于 GIF 天津大學 2021屆本科生畢業(yè)設(shè)計(論文) 16 圖片信息提取方法的實現(xiàn) 在第 2章中我們抓取了大量的網(wǎng)頁及圖片。 Extractor 類,定義文件的輸入,輸出路徑等成員變量及其構(gòu)造方法,并定義圖片拷貝函數(shù) boolean copyImage(),返回一個布爾量,通過對從HTML 解析出的圖片 URL 可在 mirror 目錄下對應(yīng)位置找到相應(yīng)的圖片,且圖片大小足夠大(為有效圖片)則為 True,如果在 mirror 目錄下對應(yīng)位置圖片沒有找到或找到了圖片但圖片不符合要求(圖片太小等)則為 False 2 繼承 Extractor 類,并添加 3個主要函數(shù): ( 1) void getNetInfo() 獲取網(wǎng)頁 title中的文本信息 獲 取含 description 元素的 meta標簽下的文本信息 獲取含 keywords 元素的 meta標簽下的文本信息 NodeFilter title_filter=new TagNameFilter(title)。 NodeFilter description_filter=new AndFilter( new TagNameFilter(meta),new OrFilter( new HasAttributeFilter(name,Description), new HasAttributeFilter(name,description)))。 先是通過 TagNameFilter獲得標簽名為 title的標簽節(jié)點,然后調(diào)用 getProp函數(shù)匹配一個正則表達式獲得 title 中的文本信息。 同理可獲得標簽名為 meta且含 keywords元素 的標簽節(jié)點,然后調(diào)用 getProp函數(shù)匹配相應(yīng)的正則表達式獲得其相應(yīng)文本。 調(diào)用 copyImage(imge_src,new_image_file),如果返回 True 將得到的img標簽中的 ,title,width,height 以及網(wǎng)頁 title標簽中的內(nèi)容 ,及 meta標簽 description 和 keywords 的內(nèi)容寫入輸出文件中。在2021 年 1 月 16 號被 Sun 公司收購。對于 Mysql的前途,沒有任何人抱樂觀的態(tài)度。由于其體積小、速度快、總體擁有成本低,尤其是開放源碼這一特點,許多中小型網(wǎng)站為了降低網(wǎng) 站總體擁有成本而選擇了 MySQL 作為網(wǎng)站數(shù)據(jù)庫。 Hibernate 可以應(yīng)用在任何使用 JDBC 的場合,既可以在 Java 的客戶端程序使用,也可以在 Servlet/JSP 的 Web 應(yīng)用中使用,最具革命意義的是,Hibernate 可以在應(yīng)用 EJB 的 J2EE 架構(gòu)中取代 CMP,完成數(shù)據(jù)持久化的重任。 天津大學 2021屆本科生畢業(yè)設(shè)計(論文) 19 目前的主流數(shù)據(jù)庫依然是關(guān)系數(shù)據(jù)庫,而 Java 語言則是面向?qū)ο蟮木幊陶Z言,當把二者結(jié)合在一起使用是相當麻煩,而 Hibernate 則減少了這個問題的困擾,他完成對象模型和基于 SQL 的關(guān)系模型的影射關(guān)系。 ORM 可理解成一種規(guī)范,他概述了這類框架的基本特征:完成面向?qū)ο蟮木幊陶Z言到關(guān)系數(shù)據(jù)庫的映射。因此,我們可把 ORM框架當成應(yīng)用程序和數(shù)據(jù)庫的橋梁。比如: ? 大量數(shù)據(jù)查找,排序。 ? 數(shù)據(jù)庫訪問的并發(fā),事物。 面對著用面向?qū)ο笳Z言與關(guān)系數(shù)據(jù)庫系統(tǒng)并存的局面,采用 ORM就變成一種必然。當我們采用 ORM 框架之后,應(yīng)用程序不再直接訪問底層數(shù)據(jù)庫,而是以面向?qū)ο蟮姆绞絹聿僮鞒志没瘜ο螅ɡ鐒?chuàng)建,修改,刪除等),而 ORM 框架則將這些面向?qū)ο蟮牟僮鬓D(zhuǎn)化成底層的 SQL 操作。由此課件在 ORM 框架中,持久化對象是一種中間媒介,應(yīng)用程序只需操作持久化對象, ORM框架則負責將這種操作轉(zhuǎn)換為底層數(shù)據(jù)庫操作 —— 這種轉(zhuǎn)換對開發(fā)者透明,無需開發(fā)正關(guān)心。 首先,建立 ImgK類,定義 name, keyW,url 等成員變量機器 get,set 方法。實際上, Hibernate 直接采用了 POJO(普通,傳統(tǒng) Java 對象 )作為 PO(Persistent Object,持久化對象 ),這就是 Hibernate 被稱為低侵入式設(shè)計的原因, Hibernate不要求持久化類繼承任何父類,或者實現(xiàn)任何借口,這樣可保證代碼不被污染。 PO=POJO+映射文件 然后建立一個連接數(shù)據(jù)庫的持久化操作類 HibernateUtil ? 獲取 Configuration ? 獲取 SessionFactory ? 獲取 Session,打開事務(wù) ? 用面向?qū)ο蟮姆绞讲僮鲾?shù)據(jù)庫 ? 關(guān)閉事務(wù) 接著通過 MySQL 建立一個空的數(shù)據(jù)庫 img_search,運行該持久化操作類,然后就可發(fā)現(xiàn) img_search 數(shù)據(jù)庫中多了一個新表 imgK 天津大學 2021屆本科生畢業(yè)設(shè)計(論文) 21 然后建立一個插入每一條數(shù)據(jù)的類 dbInsert 其為代碼如下: 1判斷 1個文件是否是文件夾 2 如果是,則讀取目錄下的每一個文件 3 如果不是,則判斷 是否為 .txt 文件 4 如果是,則讀取里面的內(nèi)容分別按 Name,keyW,url 存入數(shù)據(jù)庫 5繼續(xù)第一步 運行后,就會將第三章中得到的文本文件中的信息提取插入數(shù)據(jù)庫中。 數(shù)據(jù)庫結(jié)果如圖: 圖 43 數(shù)據(jù)庫記錄展示 系統(tǒng)實現(xiàn)的框架和結(jié)構(gòu) 在數(shù)據(jù)庫建立好之后就要建立基本的 JSP 頁面和相應(yīng)的操作邏輯。 ( 2) 如果需要以 POST 方式提交請求,則定義包含表單數(shù)據(jù)的 JSP 頁面。 ( 3) 定義處理用戶請求的 Action 類。指定請求對應(yīng)的 Action 處理方法。 Struts2 流程圖: 圖 44 Struts2流程圖 工程建立簡要步驟: 1 建立分頁用的 javaBean 類 定義相關(guān)成員函數(shù)及變量(當前頁,總頁數(shù),總記錄數(shù),當前記錄數(shù)等) 2 建立基本的 Action類 跳轉(zhuǎn)頁面要傳遞的信息變量及主要的邏輯函數(shù) String jumpPage(),其中調(diào)用Service類中 findImageByKey(PAGE_SIZE,page,keyW)方法查詢一定數(shù)量(一個分頁頁面要顯示的數(shù)量)的符合匹配關(guān)鍵詞條件的圖片。然后建立 文件繼承 PageBreakService,并添加一個 findImageByKey()方法執(zhí)行關(guān)鍵詞查找的 HQL語句 . String hql=from ImgK where keyW like 39。 這樣,這個圖像檢索系統(tǒng)的基本文件已經(jīng)建立好了,接下來打開網(wǎng)頁輸入本地網(wǎng)址及相應(yīng)端口號和工程名及 JSP頁面 / 天津大學 2021屆本科生畢業(yè)設(shè)計(論文) 23 圖 45 圖像檢索系統(tǒng) HomePageUI 其中高級是一個空連接,為以后的基于語義的圖像檢索的開發(fā)做一個接口 輸入關(guān)鍵字,點擊“搜一下”,即可按關(guān)鍵詞從數(shù)據(jù)庫中查詢結(jié)果。人們正快速進入一個信息化的社會。如何組織,表達,存儲,管理,查詢和檢索這些海量的數(shù)據(jù),是對傳統(tǒng)數(shù)據(jù)庫技術(shù)的一個重大挑戰(zhàn),如果沒有對圖像及視頻數(shù)據(jù)的自動和有效的描述,大量信息將淹沒在信息的海洋之中,無法在需要的時候被檢索出來,因此,如何將數(shù)字圖像處理,模式識別技術(shù),計算機視覺技術(shù)與傳統(tǒng)的數(shù)據(jù)庫技術(shù)結(jié)合起來,建立高效的圖像檢索機制就成為目前迫切需要解決的問題,而基于內(nèi)容的圖像檢索技術(shù)便是解決這一問題的關(guān)鍵。但本文還存在一些不足。在對大量的實驗結(jié)果分析中表明仍有一些應(yīng)過濾的信息沒有過濾掉。只能將覆蓋面縮小,以求盡可能準確,但放掉了部分有用信息。本文只是實現(xiàn)了圖像檢索技術(shù)中傳統(tǒng)的基于文本的部分。 總之,在未來的后續(xù)工作中, 如何更好的對網(wǎng)頁進行解析和 如何較好的利用圖像的物理和語義特征描述圖像 ,獲得更全面的文字信息 及圖像語義特征,構(gòu)建更完善的圖像檢索系統(tǒng)是未來的努力方向。 天津大學 2021屆本科生畢業(yè)設(shè)計(論文) 26 參考文獻 [1] Ritendra Datta, Dhiraj Joshi, Jia Li et al. Image Retrieval: Ideas, Influences, and Trends of the New Age[J].ACM Comput. Surv. 40, 2, Article 5 .April 2021. [2] 李曉明,閆宏飛,王繼民 . 搜索引擎 原理 ,技術(shù)與系統(tǒng) [M].北京:科學出版社 ,2021. [3] 馬自萍 .形狀和顏色特征的混合圖像檢索 [D].銀川:北方民族大學 ,. [4] 陳劍雄,張蓓.簡析圖像檢索中的 CBIR技術(shù) [J].情報探索(第 7期) ,. [5] 邱哲,符滔滔,王學松.開發(fā)自己的搜索引擎 Lucene + Heritrix[M].北京:人民郵電出版社 ,202101. [6] 李剛 .輕量級 J2EE企業(yè)應(yīng)用實戰(zhàn) [M].北京:電子工業(yè)出版社 ,. [7] 周明全,耿國華,韋娜 .基于內(nèi)容圖像檢索技術(shù) [M].北京:清華大學出版社, . [8] 沈蘭蓀,張箐,李曉 光。基于 HTMLParser的網(wǎng)頁信息提取 [J] .兵工自動化 (第 7期 ), 2021, 7. 外文資料 Image Retrieval: Ideas, Influences, and Trends of the New Age RITENDRA DATTA, DHIRAJ JOSHI, JIA LI, and JAMES Z. WANG The Pennsylvania State University 天津大學 2021屆本科生畢業(yè)設(shè)計(論文) 1 中文譯文 圖像檢 索:思想,影響,以及新時代的趨勢 當尼爾斯玻爾亨里克大衛(wèi)說:“沒有人能用語言將你所想的表達得更清楚”時,每個人都在猜測這究竟意味著什么。舉個實例,希望從集合找到一個完美的圖像。從某種意義上說,比起使用文本描述。 我們組織東西是與生俱來的。數(shù)百年 來,不同語言的文本已被設(shè)置為了有效檢索,無論是古代圖像或是現(xiàn)代數(shù)字圖像。原因之一,造成這一區(qū)別的是,文字是人類的創(chuàng)造,而典型的圖像是一個單純的人類制造物,這些都是比較難以實現(xiàn)的具體描述。當然,我們所看到的解釋是很難的,更難教一臺機器。 基于內(nèi)容的圖像檢索( CBIR 的),正如我們今 天看到的,是幫住組織其視頻內(nèi)容的數(shù)字圖片技術(shù),按照這個定義,任何東西,從相似的功能包括圖像到充滿活力的形象注解發(fā)動機屬于職權(quán)范圍內(nèi)的圖像檢索。雖然我們在繼續(xù)努力解決問題,我們也看到來自不同領(lǐng)域的成就,例如,計算機視覺,機器學習,信息檢索,人機交互,數(shù)據(jù)庫系統(tǒng), Web 和數(shù)據(jù)挖掘,信息,人員理論,統(tǒng)計學,心理學,為圖像檢索做出共獻 [Wang et al. 2021]。同樣,我們今天看到的是一些跨領(lǐng)域在可預(yù)見的未來很可能成為新的研究領(lǐng)域。 一,早期圖像檢索 在 19942021 年可以被看作是研究和開發(fā)的初期階段的圖像檢索的內(nèi)容。 [2021],這已經(jīng)對在當前十年取得進展及有明確的影響,并無疑將繼續(xù)影響未來的工作。為了做到這一點,我們首先介紹有關(guān) 各種定義和相關(guān)的大多數(shù)問題。 雖然前者使得從圖像內(nèi)容識別挑戰(zhàn)由于在錄音的限制,后者本質(zhì)上是如何捕捉他們的視覺內(nèi)容中的圖片和用戶 ??的解釋問題。圖像搜索領(lǐng)域被歸類為狹義和廣義,這仍然是一個用于系統(tǒng)設(shè)計的目的非常重要的區(qū)別。另一方面,廣泛的領(lǐng)域
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1