【正文】
the way of constructing search engine. This system is based on the .Net platform using C. The database is MSSQL Server 2021. Main functions are grasping web pages with crawls, adding effective information to the database, establishing index with Lucene, searching through keywords, and displaying the results finally. This paper has showed the principle of search engine in the form of different modules, functions of this system, improving traditional web application model using Ajax. It shows explanation of the system’s background, development environment, system analysis of demanding, and functions of design. Key words: 。同時講述了 搜索引擎的原理, 系統(tǒng) 功能 ,并 探討使用 Ajax 與服務器進行數據異步 交互,從而 改善現有的 Web 應用模式。主要完成的功能有:用爬蟲抓取網頁;獲取有效信息放入數據 庫; 通過 Lucene 建立索引;對簡單關鍵字進行搜索;使用 Ajax 的局部刷新頁面展示結果。 畢業(yè)設計 ( 論文 ) 基于 Ajax+Lucene 構建搜索引擎的設計與實現 論文作者姓名: 申請學位專業(yè): 申請學位類別: 指導教師姓名(職稱): 論文提交日期: 基于 Ajax+Lucene 構建搜索引擎的設計與實現 摘 要 通過搜索引擎從 互聯(lián)網上 獲取有用信息 已經成為 人們生活的重要組成部分, Lucene 是構建搜索引擎的其中一種方式 。 搜索引擎 系統(tǒng) 是在 .Net 平臺上用C開發(fā)的 ,數據庫是 MSSQL Server 2021。 論文詳細說明了系統(tǒng)開發(fā)的背景,開發(fā)環(huán)境,系統(tǒng)的需求分析,以及功能的設計與實現。 關鍵詞 : ; 異步更新 ; Ajax; 搜索引擎 The Design and Implementation for Constructing the Search Engine with Ajax and Lucene Abstract Obtaining useful information from web by search engines has bee the important part of people39。 Asynchronous update。 Search engines 目 錄 論文總頁數: 19 頁 1 引言 ............................................................................................................................. 1 課題背景 ............................................................................................................ 1 國內外研究現狀 ................................................................................................. 1 本課題研究的意義 .............................................................................................. 1 本課題的研究方法 .............................................................................................. 1 2 構建搜索引擎原理 ......................................................................................... 2 全文搜索引擎 ..................................................................................................... 2 搜索引擎的分類 ........................................................................................ 2 搜索引擎的工作原理 ................................................................................. 2 LUCENE 與搜索引擎 ............................................................................................ 3 索引和搜索 ........................................................................................................ 4 AJAX技術 ............................................................................................................ 4 3 需求分析 ...................................................................................................................... 5 同步環(huán)境 ............................................................................................................ 5 ............................................................................................................ 6 性能需求 ............................................................................................................ 6 輸入輸出要求 ..................................................................................................... 7 運行需求 ............................................................................................................ 7 4 方案設計 ...................................................................................................................... 7 搜索引擎模型 ..................................................................................................... 7 數據庫的設計 ..................................................................................................... 7 模塊設計 ............................................................................................................ 8 5 系統(tǒng)實現 .................................................................................................................... 10 開發(fā)環(huán)境 .......................................................................................................... 10 關鍵代碼詳解 ................................................................................................... 10 代碼結構 ................................................................................................. 10 爬蟲部分 ................................................................................................. 10 索引生成 .................................................................................................. 12 頁面查詢 .................................................................................................. 13 6 測試 ........................................................................................................................... 14 功能測試 .......................................................................................................... 14 結 論 ........................................................................................................................ 16 參考文獻 ........................................................................................................................ 16 致 謝 ........................................................................................................................ 18 聲 明 ........................................................................................................................ 19 第 1 頁 共 19 頁 1 引言 課題背景 Lucene 是一個基于 Java 的全文信息檢索工具包,它為應用程序提供索引和搜索功能。也是目前最為 流行的基于 Java開源全文檢索工具包。 它只在命名方面采納了 .Net 的建議,主要目標傾向于和 Java Lucene 兼容:一個是索引格式兼容,達到可以共同工作的目的;一個是命名接近(只相差很少,比如大小寫等),目的是可以方便開發(fā)者使用 Java Lucene 相關的代碼和資料。 無論搜索技術本身還是搜索范圍與深度 , Google 搜索 總是所有搜索引擎的 目標 。 Google 在低層次的智能搜索方面已經開始研究很多年了,實際的成果就是翻譯方面。但是翻譯僅僅是學術方面的應用,更重要的是 Google 建立起來的