freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于java語(yǔ)言的搜索引擎開(kāi)發(fā)論文-資料下載頁(yè)

2024-11-17 21:54本頁(yè)面

【導(dǎo)讀】且準(zhǔn)確的信息成為人們?cè)絹?lái)越關(guān)注的問(wèn)題。搜索引擎的出現(xiàn)為人們?cè)诰W(wǎng)絡(luò)中查找信息提供了極大的。因此,網(wǎng)絡(luò)搜索引擎的開(kāi)發(fā)及相關(guān)技術(shù)的研究有著重要的意義。本畢業(yè)設(shè)計(jì)利用JAVA語(yǔ)言開(kāi)。該搜索引擎能根據(jù)輸入的關(guān)鍵字查詢(xún)所需要。網(wǎng)頁(yè)連接,能較好地完成一般的搜索任務(wù)。闡述了本次畢業(yè)設(shè)計(jì)所完成的基于機(jī)器人和全文索引技術(shù)的搜索引擎的開(kāi)發(fā)過(guò)程。息更新速度也日益提高。擎開(kāi)發(fā)技術(shù)得以快速地發(fā)展。統(tǒng)的性能參數(shù)——召回率和精度同樣可以衡量一個(gè)搜索引擎的性能。對(duì)于一個(gè)檢索系統(tǒng)來(lái)講,召回率和精度不可能兩全其美:召回率高。時(shí),精度低;精度高時(shí),召回率低。ALIWEB不使用“機(jī)器人”程序,而是靠網(wǎng)站主動(dòng)提交信息來(lái)。而RBSE是第一個(gè)在搜索結(jié)果排列中引入關(guān)。達(dá)數(shù)百家,其檢索的信息量也與從前不可同日而語(yǔ)。數(shù)據(jù)庫(kù)中存放的網(wǎng)頁(yè)已達(dá)30億之巨!爬行,依據(jù)一定的網(wǎng)絡(luò)協(xié)議在互聯(lián)網(wǎng)中發(fā)現(xiàn)、加工、整理信息,并為用戶(hù)提供檢索服務(wù)。提高智能化程度和準(zhǔn)確度。以實(shí)現(xiàn)對(duì)目標(biāo)信息的檢索。

  

【正文】 g temp = null。 if (str != null) { try { temp = new String((GBK))。 } catch (Exception e) { (HTMLParser:Catch Exception,e)。 } } return temp。 } } index 文件的生成 最后的核心部分完成的功能是當(dāng)全部鏈接索引工作任務(wù)完成后,調(diào)用 Searcher 的close()方法完成釋放資源并生成 index 文件。代碼如下: ( 1)相應(yīng)類(lèi)包的引入: package 。 import 。 import 。 import 。 import 。 import 。 import 。 import 。 import 。 import 。 import 。 import 。 import 。 ( 2)信息的引入: public class Index { Index() throws Exception { } ( 3)釋放資源并生成 index: 19 void AddNews(String url, String title) throws Exception { //創(chuàng)建一個(gè)文檔對(duì)象 Document _doc = new Document()。 //將獲得的連接 url 和鏈接標(biāo)題信息放入到 doc 文檔中并建立索引和非索引字段 ((title, title))。 ((url, url))。 HTTPSocket = new HTTPSocket()。 (url, null)。 Reader _read = new StringReader(( (GBK)))。 ((contents,_read))。 //利用搜索工具的索引輸出對(duì)象輸出索引文檔信息 (_doc)。 } } 編譯過(guò)程 安裝 JDK 首先需要使用 JDK, 語(yǔ)言的基本工具包,是個(gè)免費(fèi)開(kāi)發(fā)運(yùn)行 JAVA 程序的基本軟件,由一個(gè)標(biāo)準(zhǔn)類(lèi)庫(kù)和一組 編譯工具所 建立,測(cè)試及建立文檔的 Java 實(shí)用程序組成。 先安 裝 ( 先從 SUN 的官方站點(diǎn) 下載 Windows 版,目前最新的是 ,然后運(yùn)行 安裝 )。 使用 JDK 是必須注意環(huán)境變量設(shè)置 的 問(wèn)題。下面的圖 和圖 是展示環(huán)境變量的設(shè)置: 圖 環(huán)境變量的設(shè)置 20 Step1:打開(kāi) 系統(tǒng)屬性 對(duì)話框選中“高級(jí)” Tab 頁(yè) 圖 環(huán)境變量的改變 Step2:在環(huán)境變量的對(duì)話框中的 用戶(hù)變量 中,增加一個(gè) CATALINA_HOME(它的值就是Tomcat 的安裝目錄 ),再增加一個(gè) JAVA_HOME(它的值就是 JDK 的安裝目錄 )。 Step3:編譯 源代碼,形成 .class 文件。 其中的 Splider 文件為機(jī)器人搜索引擎 \Splider |News\ |index\ 此目錄保存了所有網(wǎng)頁(yè)的 Index,是搜索頁(yè)面所需要的信息。 | | | | 此文件是運(yùn)行這個(gè)機(jī)器人的關(guān)鍵文件,直接雙擊即可。 | | 此文件是機(jī)器人運(yùn)行留下的日志記錄 21 搜索引擎的使用 現(xiàn)在要注意 Splider 文件中 和 ,它們將在搜索引擎的使用 中 起到重 要的作用。 ( 1) Splider 文件中 包含一個(gè) ,如圖 所示: 圖 的路徑 ( 2) Splider 文件中另外還包含一個(gè) :,如圖 所示: 圖 路徑說(shuō)明 為了存儲(chǔ)方便 ,所以把編譯形成的 .CLASS 文件壓縮 ,使用時(shí)將 luceneweb 文件夾放 22 入 Tomcat 安裝到目錄的子目錄 webapps 下 下圖 為 luceneweb 目錄結(jié)構(gòu)說(shuō)明: 圖 luceneweb 目錄結(jié)構(gòu) 使用說(shuō)明 : 運(yùn)行 Splider 目錄下的 (double Click),當(dāng)看到日志文件 中有“ Spider has no work”時(shí),將路徑 Splider\News\index\下的所有文件拷貝到 “ luceneweb \opt\index\”下 . 此時(shí)啟動(dòng) Tomcat 服務(wù)器,服務(wù)器啟動(dòng)后,打開(kāi)一個(gè)瀏覽器。在地址欄中輸入 即可。 此時(shí)可以看到一個(gè)界面,如圖 所示: 23 圖 搜索引擎主界面 只要在輸入框中輸 入“ d”,點(diǎn)擊 搜索 按鈕,就可看到如下圖 所示: 圖 使用舉例圖 至此,本課題所設(shè)計(jì)的網(wǎng)絡(luò)搜索引擎就可以使用了,并能實(shí)現(xiàn)預(yù)想的功能。 24 5. 展望與結(jié)論 目前搜索引擎是網(wǎng)絡(luò)上被使用頻率最高的服務(wù)項(xiàng)目之一。隨著 Inter 的強(qiáng)勢(shì)發(fā)展,網(wǎng)上龐大的數(shù)字化信息和人們獲取所需信息能力之間的矛盾日益突出。國(guó)際數(shù)據(jù)公司( IDC)曾公布的一份報(bào)告表明,被大肆宣傳為 “使用 簡(jiǎn)單方便 ,搜索結(jié)果豐富 ”的搜索引擎技術(shù)正在被信息更集中的局域網(wǎng)取代,因?yàn)榇蠖鄶?shù)搜索系統(tǒng)的表現(xiàn)與用戶(hù)的期望值相差太大,諸如數(shù)據(jù)量高 速增長(zhǎng)的視頻、音頻等多媒體信息的檢索,現(xiàn)在仍然是無(wú)法突破的難題。搜索引擎越來(lái)越不能滿(mǎn)足挑剔的網(wǎng)民們的各種信息需求,這表現(xiàn)在以下幾個(gè)方面: 收集的網(wǎng)頁(yè)數(shù)量和其數(shù)據(jù)庫(kù)的更新速度存在著不可調(diào)和的矛盾。用戶(hù)經(jīng)常無(wú)法打開(kāi)查詢(xún)的結(jié)果。網(wǎng)絡(luò)信息時(shí)刻變動(dòng),實(shí)時(shí)搜索幾乎不可能。就是剛剛瀏覽過(guò)的網(wǎng)頁(yè),也隨時(shí)都有更新、過(guò)期、刪除的可能。網(wǎng)絡(luò)信息收集與整理是搜索引擎工作的重要一部分。搜索引擎需要定期不斷地訪問(wèn)網(wǎng)絡(luò)資源。目前網(wǎng)絡(luò)帶寬不足,網(wǎng)絡(luò)速度不夠理想,遍歷如此龐雜的網(wǎng)絡(luò)花費(fèi) 的 時(shí)間 是非常龐大的,這就是不能實(shí)時(shí)搜索的原因。 對(duì)多媒體 內(nèi)容的處理尚不成熟。迄今為止,搜索對(duì)象主要是文本?;谡Z(yǔ)義的多媒體搜索技術(shù)還不成熟,比如搜索圖片時(shí)還只能通過(guò)周?chē)嚓P(guān)的文字進(jìn)行判斷,而無(wú)法根據(jù)圖片本身的信息提供檢索。多媒體技術(shù)的發(fā)展,對(duì)搜索引擎提出了更多的要求。人們期望引擎不僅能挑出自己需要的文章,還能挑出自己所關(guān)心的圖片、電影、音樂(lè)等。 搜索引擎的 “智能 ” 有待提高。一般的公共搜索引擎只能查到 HTML 格式,主要的原因是搜索引擎的自動(dòng)排序軟件 Spiders 蜘蛛程序,只能接受這種格式的網(wǎng)頁(yè)。 搜索引擎應(yīng)更好地支持動(dòng)態(tài)網(wǎng)頁(yè),許多蜘蛛軟件不敢去碰動(dòng)態(tài)網(wǎng)頁(yè),怕被變 化無(wú)窮的動(dòng)態(tài)系統(tǒng)黑洞吸進(jìn)去出不來(lái)。然而,網(wǎng)站使用動(dòng)態(tài)網(wǎng)頁(yè)生成工具乃是大事所趨,解決動(dòng)態(tài)網(wǎng)頁(yè)查找的問(wèn)題已經(jīng)迫在眉睫。 如何解決這些難題已成為第三代搜索引擎探索的方向。一個(gè)好的搜索引擎不再僅憑借數(shù)據(jù)庫(kù)大小、更新頻率、檢索速度、對(duì)多語(yǔ)言的支持這幾個(gè)基本特性來(lái)衡量,隨著數(shù)據(jù)庫(kù)容量的不斷膨脹,如何從龐大的資料庫(kù)中精確地找到正確的資料,被公認(rèn)為是下一代搜索技術(shù)的競(jìng)爭(zhēng)要點(diǎn)。 而本畢業(yè)設(shè)計(jì)的搜索引擎能完成比較簡(jiǎn)單的信息查詢(xún),基本能 達(dá)到根據(jù)輸入的關(guān)鍵字查詢(xún)需要的網(wǎng)頁(yè)連接的功能。希望通過(guò) 完成本課題所 總結(jié) 的 經(jīng)驗(yàn)和教訓(xùn), 能夠編寫(xiě)出功能更加完善,搜索能力更強(qiáng)的搜索引擎。 25 致謝 本文是在老師精心指導(dǎo)和大力支持下完成的。老師以其嚴(yán)謹(jǐn)求實(shí)的治學(xué)態(tài)度、高度的敬業(yè)精神、兢兢業(yè)業(yè)、孜孜以求的工作作風(fēng)和大膽創(chuàng)新的進(jìn)取精神對(duì)我產(chǎn)生重要影響。她淵博的知識(shí)、開(kāi)闊的視野和敏銳的思維給了我深深的啟迪。同時(shí),在此次畢業(yè)設(shè)計(jì)過(guò)程中我也學(xué)到了許多了關(guān)于微生物發(fā)酵方面的知識(shí),實(shí)驗(yàn)技能有了很大的提高。 另外,我還要特別感謝 我的朋友沈智文 對(duì)我實(shí)驗(yàn)以及論文寫(xiě)作的指導(dǎo),她為我完成這篇論文提供了巨大的幫助。還要感謝 一個(gè)寢室的 同學(xué)對(duì)我的無(wú)私幫助,使我得以 順利完成論文。在此我衷心的感謝他 們 。 最后,再次對(duì)關(guān)心、幫助我的老師和同學(xué)表示衷心地感謝 。 參考文獻(xiàn) [1] 陳華 ,羅昶 ,王建勇 ,段暉 ,薛明 .基于 Web 的百萬(wàn)級(jí) FTP 搜索引擎的設(shè)計(jì)與實(shí)現(xiàn) [J].計(jì)算機(jī)應(yīng)用 ,2020,(9) [2] 雷鳴 ,劉建國(guó) ,王建勇 ,陳葆玨 .一種基于詞典的搜索引擎系統(tǒng)動(dòng)態(tài)更新模型 [J].計(jì)算機(jī)研究與發(fā)展 ,2020,(10). [3] 陳華 ,羅昶 ,王建勇 ,段暉 ,薛明 .基于 Web 的百 萬(wàn)級(jí) FTP 搜索引擎的設(shè)計(jì)與實(shí)現(xiàn) [J].計(jì)算機(jī)應(yīng)用 ,2020,(9). [4] 雷鳴 ,劉建國(guó) ,王建勇 ,陳葆玨 .一種基于詞典的搜索引擎系統(tǒng)動(dòng)態(tài)更新模型 [J].計(jì)算機(jī)研究與發(fā)展 ,2020,(10). [5] 黃素珍 .并行多元搜索引擎的研究與設(shè)計(jì) [D].廣西大學(xué) ,2020. [6] 徐建華 .網(wǎng)絡(luò)搜索引擎原理、特性分析及未來(lái)發(fā)展趨勢(shì) [J]. 圖書(shū)情報(bào)工作 , 2020,( 8)。 [7] 李明霞 .信息海洋中的航標(biāo) —— 陳葆玨教授與劉建國(guó)副教授談搜索引擎技術(shù) [J].微電腦世界 ,1998,(49). [8] 馮飛燕 .搜索引擎 :穿透 Inter 的動(dòng)力 —— 搜索引擎能做什么 [J].電子與電腦 ,1996,(2). [9] 章琳 ,張保明 .WWW檢索工具比較研究 [J].情報(bào)學(xué)報(bào) ,1998,(4). [10] 殷雪松 ,徐斌 .WWW網(wǎng)絡(luò)搜索引擎介紹 [J].大學(xué)圖書(shū)館學(xué)報(bào) ,1998,(4).
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1