freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于lucene的全文搜索引擎設(shè)計-資料下載頁

2025-08-07 15:00本頁面
  

【正文】 4到10行是產(chǎn)品的參數(shù),第11行是分隔符,第12行是產(chǎn)品對應(yīng)的圖片。圖36 提取后的產(chǎn)品圖片 建立索引和初始化數(shù)據(jù)庫 。圖37 索引文件圖38 數(shù)據(jù)庫數(shù)據(jù) 搜索(1)進入主頁面圖39 主頁面(2)輸入“張某某”進行搜索測試圖40 搜索測試——沒有結(jié)果(3)輸入“三星”作為關(guān)鍵字進行搜索測試圖41 搜索結(jié)果(4)點擊型號為E1125的產(chǎn)品鏈接圖42 產(chǎn)品原始頁面6 總結(jié) 系統(tǒng)存在的問題 衡量一個搜索引擎性能優(yōu)越與否很大程度上依賴于索引的建立和分詞的準(zhǔn)確性。眾所周知,中文是世界上最復(fù)雜的語言之一。要想對中文進行完全精確的分詞,能夠正確表達其內(nèi)在的含義,幾乎是不大可能的。這是因為當(dāng)漢字的排列組合不同的時候,相同漢字就會出現(xiàn)不用的詞性和不同的詞義;另外,還要考慮到漢字所處的上下文語境。因此,想讓計算機理解并正確分析中文是非常困難的。 本檢索系統(tǒng)采用的分詞技術(shù)為JE分詞。JE分詞是一套由Java編寫的分詞軟件。JE分詞具有支持分詞粒度控制,支持Lucene分詞接口等眾多功能。另外,JE分詞最讓人驚喜的就是它還提供了API,可以添加新詞。如下代碼:/** * 初始化方法,實例化了一個JE分詞的Analyzer 然后把詞庫加載入分詞器的詞庫中 * * @throws Exception */ @SuppressWarnings(staticaccess) private void initialize() throws Exception { analyzer = new MMAnalyzer()。 FileReader reader = new FileReader(dictionary_file)。 //添加自定義詞組 ((MMAnalyzer) analyzer).addDictionary(reader)。 writer = new IndexWriter(indexPath, analyzer, true)。 }盡管使用JE分詞,但是還是存在一定程度上缺陷。比如要搜索型號為“C3010”的手機信息,當(dāng)我們輸入c3010的時候是搜索不到結(jié)果,而輸入3010就可以搜索的到。希望系統(tǒng)能夠進一步地完善,采用更好的分詞技術(shù),提供更為準(zhǔn)確的搜索功能。 在搜索范圍方面,本檢索系統(tǒng)目前只能根據(jù)產(chǎn)品的品牌和型號進行搜索,因此系統(tǒng)的功能還是比較單一。暫時還沒有提供更為高級的搜索。比如能夠根據(jù)產(chǎn)品的相關(guān)參數(shù)進行比較精確的搜索。 開發(fā)過程出現(xiàn)的問題 在開發(fā)前期使用Heritrix抓取網(wǎng)頁,由于初次接觸搜索方面的技術(shù)對此很不了解,所以使用Heritrix的時候是頻頻出錯。由于沒有正確理解Heritrix的核心配置,導(dǎo)致每次開始的抓取的時候總是出現(xiàn)類型轉(zhuǎn)換異常。 在系統(tǒng)進行單元測試的時候也遇上了一些比較低級的錯誤。由于使用Spring來管理系統(tǒng)的Bean,包括建立索引的Bean。而當(dāng)索引的Bean進行初始化的時候就會初始化一個IndexWriter,一旦沒有進行關(guān)閉就會刪除已經(jīng)建立好的索引文件。所以在進行搜索單元測試的時候,每次都找不到索引文件。經(jīng)過分析才發(fā)現(xiàn)以上問題,并順利解決。Bean配置如下:! Product操作接口 bean id=productDao class= property name=sessionFactory ref=sessionFactory / /bean ! 搜索接口 bean id=searchDao class=/bean ! 建立索引的Bean bean id=productTextFileProcessor class= property name=productDao ref=productDao/property /bean ! 系統(tǒng)業(yè)務(wù)接口 bean id=searchService class= property name=productDao ref=productDao/property property name=searchDao ref=searchDao/property /bean 心得體會 一直以來對搜索引擎有一種想去探個究竟的想法,所以才會選擇開發(fā)一個全文檢索系統(tǒng)作為自己的畢業(yè)設(shè)計。這對自己不僅僅是完成自己大學(xué)期間的最后一個實驗任務(wù),還是使自己去了解和掌握一門新的技術(shù),更是以一種探究的態(tài)度去學(xué)習(xí)搜索引擎的運作方式。即使這個系統(tǒng)并不能代表搜索引擎的全部,但是至少能夠作為一個精簡版本的搜索引擎。 開始畢業(yè)設(shè)計之前對Lucene,Heritrix等東西一點也不了解。為了能夠順利的完成此次畢業(yè)設(shè)計,自己也是歷經(jīng)波折地找資料學(xué)習(xí)相關(guān)的知識。所以剛開始設(shè)計時自己也走了不少的彎路,遇到一些比較困難的問題時甚至想棄而改做其他類型的系統(tǒng),系統(tǒng)開發(fā)過程也不是說一直持續(xù)順利的走下去,而是斷斷續(xù)續(xù)的。隨著時間的推移,時間也越來越緊迫,自己對相關(guān)技術(shù)的了解也逐漸深入,隨著系統(tǒng)核心問題的解決,也就有了今天的成果。 系統(tǒng)中用到的很多技術(shù)點也都是自己現(xiàn)學(xué)現(xiàn)賣的。比如Lucene,Heritrix,Extjs。之前對這三個開源軟件是一點也不了解,都是通過看書自己去學(xué)習(xí),然后嘗試去使用它們,從使用的過程中獲取經(jīng)驗,逐步地了解掌握。參 考 文 獻[1] 邱哲,.[M]. 北京:人民郵電出版社,2007[2](美)高斯帕那,(美) in action.[M].美國:Manning Publications [3](美)Jeff Heaton .網(wǎng)絡(luò)機器人Java編程指南.[M]. 北京:電子工業(yè)出版社,2002[4] 夏昕,曹曉剛,.[M]. 北京:電子工業(yè)出版社,2005[5] 周平Lucene全文檢索引擎技術(shù)及應(yīng)用[N]. 重慶工學(xué)院學(xué)報,[6] 陳慶偉,劉軍 基于Lucene的網(wǎng)站全文搜索的設(shè)計與實現(xiàn)[J] 科技情報開發(fā)與經(jīng)濟, 2005[7] 孔伯煊,李祥 基于Lucene \XML技術(shù)的Web搜索引擎設(shè)計與實現(xiàn)[J]. 航空計算技術(shù),2006[8] 嚴(yán)蔚敏,.[M].北京:清華大學(xué)出版社,2006[9] 趙汀,孟祥武基于LuceneAPI的中文全文數(shù)據(jù)庫設(shè)計與實現(xiàn)[J]. 計算機工程與應(yīng)用,2003[10] 余艷 搜索引擎原理剖析及其技術(shù)發(fā)展[J]. 圖書館學(xué)刊,2004[11] 彭建榮, 羅永會 搜索引擎的基本原理及發(fā)展趨勢[N]. 電腦知識與技術(shù),2005[12] 徐會生,何其偉,康愛媛 《深入淺出Ext JS》[M]. 人民郵電出版社,2009[13] .[M].北京:清華大學(xué)出版社,2008[14] (美)Craig Walls,Ryan in .[M].北京:人民郵電出版,2008[15] ,Hibernate,Spring集成開發(fā)寶典.[M].北京:電子工業(yè)出版社,2007[16] 王珊,.[M].北京:高等教育出版社,2006[17] .[M].北京:清華大學(xué)出版社,2007[18] (澳)Ian Roughley. 精通Struts 2:Web .[M].北京:人民郵電出版社,2009[19] 林康司,.[M].北京:電子工業(yè)出版社,2004[20] .[M].北京:電子工業(yè)出版社,2006[21] .[M].北京:電子工業(yè)出版社,2009 A Fulltext Search Engine Based On LuceneZhang Hanguo(College of Computer Science and Engineering , Zhongkai University of Agriculture and Technology, Guangzhou 510225, China)Abstract: Web search engine technology is a hot and difficult issue in nowadays’ network information processing field. Web can be regarded as a vast distributed network database. For such a rapid growing database, it will be a huge project if we search and classify the whole Web artificially. Fortunately, search engine technology can help us obtain required information easier.This paper presents the principle, design and realization process of a fulltext retrieval system. The system works on JavaWeb which is a platform framework based on B/S mode, using MySQL as system database. Meanwhile, Heritrix and Lucene are used, which are excellent open source framework to search information about mobile phone on certain webpage. To realize the decoupling algorithm of the system, some popular Java development framework and interfaceoriented programming are applied, such as Struts, Hibermate and Spring. Having stronger UI expressing function, Extjs is used at front end as a auxiliary to realize the application of Ajax.This paper introduces backgrounds of this subject first, and then explains the details of relevant technologies the system involved. Finally, it presents how to realize the system’s function according to development method of software engineering.Key Words: Web Search mobile Ajax Framework Lucene
點擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1