freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于java語言的搜索引擎開發(fā)論文-閱讀頁

2024-12-07 21:54本頁面
  

【正文】 在 JAVA 編程中經(jīng)常要使用各式各樣的類 /接口,它們是 JAVA 程序的連接和實(shí)現(xiàn)的主要方法,下圖 為該搜索引擎的主要的類 /接口的關(guān)系圖: 13 圖 主要的類 /接口的關(guān)系圖 由上圖可以看出,該搜索引擎的核心由 程序的入口 MAIN 函數(shù) ; Searcher 類利用Spider 類的方法搜索網(wǎng)絡(luò)的鏈接,并回調(diào)自己實(shí)現(xiàn)的方法 processPage(HTTP ),來處理搜索到的頁面內(nèi)容,并利用 HTMLParser 對象分析鏈接所對應(yīng) 的 頁面 , HTMLParesr 對象將頁面中的所有連接信息分別用 Index 索引類來保存;當(dāng)全部鏈接索引工作任務(wù)完成后,調(diào)用 Searcher 的 close()方法完成釋放資源并生成 index 文件。 package 。 import 。 14 import 。 import 。 import 。 import 。 import 。 import 。 import 。 import .*。 ( 2)定義 index 索引輸出流對象,并完成引入入口 MAIN,開始構(gòu)造機(jī)器人程序: public class Searcher implements ISpiderReportable { public static IndexWriter _writer = null。 Searcher _searcher = new Searcher()。 //設(shè)置日志級別 ()。 (false)。 //構(gòu)建一個(gè)網(wǎng)絡(luò)機(jī)器人分析器 Spider _spider = new Spider(_searcher, args[0], new HTTPSocket(), 200, wl)。 15 ()。 } } /** 發(fā)現(xiàn)內(nèi)部連接時(shí)調(diào)用, url 表示程序發(fā)現(xiàn)的 URL,若返回 true 則加入作業(yè)中,否則不加入。 // HTTP _=new HTTPSocket()。 // processPage(_)。 } /** 發(fā)現(xiàn)外部連接時(shí)調(diào)用, url 表示程序所發(fā)現(xiàn)的 URL,若返回 true 則把加 入作業(yè)中,否則不加入。 // try { // (url,null)。 // } catch (HTTPException e) { // } catch (UnknownHostException e) { // } catch (IOException e) { // }catch(Exception e){ // } return false。其他連接指的是非 HTML 網(wǎng)頁,可能是Email 或者 FTP */ public boolean foundOtherLink(String url) { return false。 */ public void processPage(HTTP ) { //將搜索到的 HTTP 對象放入頁面解析類 (HTMLParser)中去建立索引信息 new HTMLParser().start()。 */ public void pletePage(HTTP , boolean error) { // (用來請求一個(gè)被處理的網(wǎng)頁 )。如果隊(duì)列中的字符串應(yīng)當(dāng)刪除,方法返回真。 return true。 */ public void spiderComplete() { // (當(dāng) Spider 程序沒有剩余的工作時(shí)調(diào)用這個(gè)方法 )。 } catch (Exception e) { // TODO Autogenerated catch block ()。 ()。 Searcher 類實(shí)現(xiàn)接口實(shí)現(xiàn) 下面介紹利用 Searcher 類實(shí)現(xiàn) . ISpiderReportable 接口的方法。 17 HTMLParesr 對象將頁面中的所有連接信息分別用 Index 索引類來保存。 import 。 import 。 import 。 ( 2)解析 HTML 頁面: public class HTMLParser{ HTTP _ = null。 } ( 3)對 Web 頁面進(jìn)行解析后建立索引: public void start() { try { //構(gòu)建一個(gè) HTML 頁面對象 . HTMLPage _page = new HTMLPage(_)。 //獲得頁面中所有的超鏈接列表數(shù)據(jù) . Vector _links = ()。 //構(gòu)建一個(gè)頁面連接的迭代器 Iterator _it = ()。 //得到連接對象中的 href 屬性值 .(a href= String _herf = input(().trim())。 //將得到的信息放入索引對象中 (_herf, _title)。 } catch (Exception ex) { (HTMLParser:Catch Exception,ex)。 if (str != null) { try { temp = new String((GBK))。 } } return temp。代碼如下: ( 1)相應(yīng)類包的引入: package 。 import 。 import 。 import 。 import 。 import 。 import 。 //將獲得的連接 url 和鏈接標(biāo)題信息放入到 doc 文檔中并建立索引和非索引字段 ((title, title))。 HTTPSocket = new HTTPSocket()。 Reader _read = new StringReader(( (GBK)))。 //利用搜索工具的索引輸出對象輸出索引文檔信息 (_doc)。 先安 裝 ( 先從 SUN 的官方站點(diǎn) 下載 Windows 版,目前最新的是 ,然后運(yùn)行 安裝 )。下面的圖 和圖 是展示環(huán)境變量的設(shè)置: 圖 環(huán)境變量的設(shè)置 20 Step1:打開 系統(tǒng)屬性 對話框選中“高級” Tab 頁 圖 環(huán)境變量的改變 Step2:在環(huán)境變量的對話框中的 用戶變量 中,增加一個(gè) CATALINA_HOME(它的值就是Tomcat 的安裝目錄 ),再增加一個(gè) JAVA_HOME(它的值就是 JDK 的安裝目錄 )。 其中的 Splider 文件為機(jī)器人搜索引擎 \Splider |News\ |index\ 此目錄保存了所有網(wǎng)頁的 Index,是搜索頁面所需要的信息。 | | 此文件是機(jī)器人運(yùn)行留下的日志記錄 21 搜索引擎的使用 現(xiàn)在要注意 Splider 文件中 和 ,它們將在搜索引擎的使用 中 起到重 要的作用。在地址欄中輸入 即可。 24 5. 展望與結(jié)論 目前搜索引擎是網(wǎng)絡(luò)上被使用頻率最高的服務(wù)項(xiàng)目之一。國際數(shù)據(jù)公司( IDC)曾公布的一份報(bào)告表明,被大肆宣傳為 “使用 簡單方便 ,搜索結(jié)果豐富 ”的搜索引擎技術(shù)正在被信息更集中的局域網(wǎng)取代,因?yàn)榇蠖鄶?shù)搜索系統(tǒng)的表現(xiàn)與用戶的期望值相差太大,諸如數(shù)據(jù)量高 速增長的視頻、音頻等多媒體信息的檢索,現(xiàn)在仍然是無法突破的難題。用戶經(jīng)常無法打開查詢的結(jié)果。就是剛剛瀏覽過的網(wǎng)頁,也隨時(shí)都有更新、過期、刪除的可能。搜索引擎需要定期不斷地訪問網(wǎng)絡(luò)資源。 對多媒體 內(nèi)容的處理尚不成熟?;谡Z義的多媒體搜索技術(shù)還不成熟,比如搜索圖片時(shí)還只能通過周圍相關(guān)的文字進(jìn)行判斷,而無法根據(jù)圖片本身的信息提供檢索。人們期望引擎不僅能挑出自己需要的文章,還能挑出自己所關(guān)心的圖片、電影、音樂等。一般的公共搜索引擎只能查到 HTML 格式,主要的原因是搜索引擎的自動(dòng)排序軟件 Spiders 蜘蛛程序,只能接受這種格式的網(wǎng)頁。然而,網(wǎng)站使用動(dòng)態(tài)網(wǎng)頁生成工具乃是大事所趨,解決動(dòng)態(tài)網(wǎng)頁查找的問題已經(jīng)迫在眉睫。一個(gè)好的搜索引擎不再僅憑借數(shù)據(jù)庫大小、更新頻率、檢索速度、對多語言的支持這幾個(gè)基本特性來衡量,隨著數(shù)據(jù)庫容量的不斷膨脹,如何從龐大的資料庫中精確地找到正確的資料,被公認(rèn)為是下一代搜索技術(shù)的競爭要點(diǎn)。希望通過 完成本課題所 總結(jié) 的 經(jīng)驗(yàn)和教訓(xùn), 能夠編寫出功能更加完善,搜索能力更強(qiáng)的搜索引擎。老師以其嚴(yán)謹(jǐn)求實(shí)的治學(xué)態(tài)度、高度的敬業(yè)精神、兢兢業(yè)業(yè)、孜孜以求的工作作風(fēng)和大膽創(chuàng)新的進(jìn)取精神對我產(chǎn)生重要影響。同時(shí),在此次畢業(yè)設(shè)計(jì)過程中我也學(xué)到了許多了關(guān)于微生物發(fā)酵方面的知識,實(shí)驗(yàn)技能有了很大的提高。還要感謝 一個(gè)寢室的 同學(xué)對我的無私幫助,使我得以 順利完成論文。 最后,再次對關(guān)心、幫助我的老師和同學(xué)表示衷心地感謝 。 [7] 李明霞 .信息海洋中的航標(biāo) —— 陳葆玨教授與劉建國副教授談搜索引擎技術(shù) [J].微電腦世界 ,1998,(49). [8] 馮飛燕 .搜索引擎 :穿透 Inter 的動(dòng)力 —— 搜索引擎能做什么 [J].電子與電腦 ,1996,(2). [9] 章琳 ,張保明 .WWW檢索工具比較研究 [J].情報(bào)學(xué)報(bào) ,1998,(4). [10] 殷雪松 ,徐斌 .WWW網(wǎng)絡(luò)搜索引擎介紹 [J].大學(xué)圖書館學(xué)報(bào) ,1998,(4).
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1