freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計-基于ajaxlucene構(gòu)建搜索引擎的設(shè)計和實現(xiàn)-論文-wenkub.com

2024-08-31 11:23 本頁面
   

【正文】 除非另有科研合同和其他法律文書的制約,本論文的科研成果屬于成都信息工程學(xué)院。(2)學(xué)校可以采用影印、縮印或其他復(fù)制方式保存學(xué)位論文。在此向他表示我最衷心的感謝!在論文完成過程中,本人還得到了其他老師和許多同學(xué)的熱心幫助,本人向他們表示深深的謝意!最后向在百忙之中評審本文的各位專家、老師表示衷心的感謝!作者簡介:姓 名:閆秋云 性別:女出生年月:1984年10月 民族:漢Email:qiuyuny聲 明本論文的工作是2007年2月至2007年6月在成都信息工程學(xué)院網(wǎng)絡(luò)工程系完成的。[5] 方睿,刁仁宏,[M].成都:四川大學(xué)出版社,2005。參考文獻(xiàn)[1] 李剛,宋偉,邱哲.征服Ajax和Lucene構(gòu)建搜索引擎[M].北京:人民郵電出版社,2006。在現(xiàn)有水平和條件的限制下,本系統(tǒng)距離商業(yè)應(yīng)用的研究水平還差較多。,使用Lucene工具包完成搜索引擎的基本功能,同時輔助Ajax技術(shù)優(yōu)化頁面體驗。Ajax技術(shù)解決了數(shù)據(jù)與服務(wù)器的異步交互問題,在前臺不再出現(xiàn)整個頁面的重新加載。該系統(tǒng)引入了當(dāng)前用于構(gòu)建搜索引擎的Lucene工具包,,充分利用Lucene所提供的工具,完成搜索引擎的基本功能。運(yùn)行spider爬蟲,抓取網(wǎng)頁。 (tr class=+c+)。content=(keywords,font color=red+keywords+/font)。 i endNum。(trtd結(jié)果數(shù):+result+amp。在程序中注冊后,在html里就可以使用Javascript來調(diào)用后臺的程序。(doc)。((mata,row[mata].ToString()))。}使用Lucene提供的方法對數(shù)據(jù)庫中的每條記錄建立索引實現(xiàn)如下:Document doc = new Document()。int docNum = ()。(iDexDir,true)。 在創(chuàng)建索引庫時,會合并多個Segments文件。 ()。i。 } urlArr=().Split(39。+mata+39。+Content+39。amp。 //得到去了HTML標(biāo)簽的網(wǎng)頁文本 URL=url。 urlList = GetHttpUrl(PageString)。 return。 Client=new ()。 String mata=。再下步就是對獲取到的標(biāo)題、網(wǎng)頁內(nèi)容、鏈接等信息調(diào)用數(shù)據(jù)庫操作通用類DAI保存到數(shù)據(jù)庫里,這就實現(xiàn)了一個網(wǎng)頁的抓取。下面對各部分關(guān)鍵代碼進(jìn)行詳解。數(shù)據(jù)庫選擇:根據(jù)需求分析選擇了MSSQL Server 2000。通過查詢頁面,輸入關(guān)鍵字,提交給系統(tǒng),程序就開始處理,最后把結(jié)果以列表的形式顯示出來。Analyzer類是一個抽象類,它有多個實現(xiàn)。為了對文檔進(jìn)行索引,Lucene提供了五個基礎(chǔ)的類,他們分別是Document,F(xiàn)ield,IndexWriter,Analyzer,Directory Document是用來描述文檔的,這里的文檔可以指一個HTML頁面,一封電子郵件,或者是一個文本文件。然后通過正則表達(dá)式,去掉多余的HTML標(biāo)簽。這條件可以是限定的謀個域名空間、或者是限定的網(wǎng)頁抓取級數(shù)。系統(tǒng)的功能流程()。查詢部分有Ajax、后臺處理、前臺界面模塊。4 方案設(shè)計結(jié)合前面的同步原理,以及需求的介紹,下面給出同步的方案設(shè)計。處理:去前后空格,關(guān)鍵字,查詢索引庫。收集數(shù)據(jù)時不能夠出現(xiàn)無響應(yīng)的等待。8. 實現(xiàn)無刷新的顯示搜索結(jié)果,對搜索用時的計算、顯示,關(guān)鍵字高亮顯示等。4. 網(wǎng)站信息庫中的信息會不斷的變動,對收集到的數(shù)據(jù)需要定期的自動維護(hù),做到定期的刪除、從新收集。3 需求分析 同步環(huán)境本系統(tǒng)的同步環(huán)境如圖3:圖3 同步環(huán)境檢索服務(wù)器通過Internet檢索Web頁面。2. 使用異步方式與服務(wù)器通信,不需要打斷用戶的操作,具有更加迅速的響應(yīng)能力。從Ajax的角度看來,Web應(yīng)用應(yīng)由少量的頁面組成,其中每個頁面其實是一個更小型的Ajax應(yīng)用。頁面內(nèi)的JavaScript可以在不刷新頁面的情況下從服務(wù)器獲取數(shù)據(jù),或者向服務(wù)器提交數(shù)據(jù)。Ajax技術(shù)之中,核心的技術(shù)就是XMLHttpRequest,它最初的名稱叫做XMLHTTP,是微軟公司為了滿足開發(fā)者的需要。搜索引擎首先會對搜索的關(guān)鍵詞進(jìn)行解析,然后再在建立好的索引上面進(jìn)行查找,最終返回和用戶輸入的關(guān)鍵詞相關(guān)聯(lián)的文檔。反向索引就是說我們維護(hù)了一個詞/短語表,對于這個表中的每個詞/短語,都有一個鏈表描述了有哪些文檔包含了這個詞/短語。如圖1表示了搜索應(yīng)用程序和Lucene之間的關(guān)系,也反映了利用Lucene構(gòu)建搜索應(yīng)用程序的流程:圖1 應(yīng)用程序和Lucene 索引和搜索索引是現(xiàn)代搜索引擎的核心,建立索引是把數(shù)據(jù)源處理成非常方便查詢的索引文件的過程。和Java 。接下來在索引數(shù)據(jù)庫中搜索排序,當(dāng)用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁。我們平時看到的全文搜索引擎,實際上只是一個搜索引擎系統(tǒng)的檢索界面,當(dāng)你輸入關(guān)鍵詞進(jìn)行查詢時,搜索引擎會從龐大的數(shù)據(jù)庫中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁的索引,并按一定規(guī)則呈現(xiàn)給我們。 搜索引擎的工作原理搜索引擎的原理,可以看作三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁,建立索引數(shù)據(jù)庫,在索引數(shù)據(jù)庫中搜索。全文搜索引擎通過從互聯(lián)網(wǎng)上提取的各個網(wǎng)站的信息(以網(wǎng)頁文字為主)而建立的數(shù)據(jù)庫中,檢索與用戶查詢條件匹配的相關(guān)記錄,然后按一定的排列順序?qū)⒔Y(jié)果返回給用戶。真正意義上的搜索引擎,通常指的是收集了因特網(wǎng)上幾千萬到幾十億個網(wǎng)頁并對網(wǎng)頁中的每一個詞(即關(guān)鍵詞)進(jìn)行索引,建立索引數(shù)據(jù)庫的全文搜索引擎。 本課題的研究方法在本系統(tǒng)的開發(fā)過程中,首先分析了搜索引擎的相關(guān)功能,寫出需求分析;其次,綜合運(yùn)用以前所學(xué)的相關(guān)知識(數(shù)據(jù)庫,C#等),選擇所熟悉的開發(fā)工具進(jìn)行開發(fā)(本系統(tǒng)選擇了Microsoft Visual Studio .NET 2003作為開發(fā)平臺,開發(fā)語言選擇了C;數(shù)據(jù)庫采用Microsoft SQL Server 2000)。中國網(wǎng)民對智能化搜索需求也是顯而易見的。中文的意思多種多樣,是很難用程序處理的。但是翻譯僅僅是學(xué)術(shù)方面的應(yīng)用,更重要的是Google建立起來的海量搜索歷史記錄。無論搜索技術(shù)本身還是搜索范圍與深度,Google搜索總是所有搜索引擎的目標(biāo)。也是目前最為流行的基于Java開源全文檢索工具包。 Asynchronous update。論文詳細(xì)說明了系統(tǒng)開發(fā)的背景,開發(fā)環(huán)境,系統(tǒng)的需求分析,以及功能的設(shè)計與實現(xiàn)。畢業(yè)設(shè)計(論文)基于Ajax+Lucene構(gòu)建搜索引擎的設(shè)計與實現(xiàn)論文作者姓名:申請學(xué)位專業(yè):申請學(xué)位類別:指導(dǎo)教師姓名(職稱):論文提交日期:基于A
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1