freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-文庫(kù)吧

2025-05-15 10:42 本頁(yè)面


【正文】 e amount of information is undoubtedly doubleedged sword, giving users a wealth of information, but also to provide the user a big problem, how to find a user wants information in this mass of information, especially when the user is offered a when information is not very clear set of phrases, how can speak clarity of useful information available to users, which further stimulated the development of the station search technology. This paper summarizes the station search function at the same time, in the study of the station search related technologies, based on the design and implementation of a simple site search engine, including the realization of the main functions of the search. Key words: Site Search。 .NET。 3 第 1 章 緒論 自從有了計(jì)算機(jī)以后,人類開(kāi)始用計(jì)算機(jī)保存信息,有保存就需要查找,于是出現(xiàn)了檢索技術(shù)。文本檢索技術(shù)的發(fā)展從最初的 SMART 文檔檢索系統(tǒng)到AltaVista 搜索引擎,到現(xiàn)在的搜索巨頭 Google,人們習(xí)慣在互聯(lián)網(wǎng)上搜索需要的信息 [1]。同時(shí)在同一個(gè)網(wǎng)站內(nèi)往往擁有大量的資源,怎樣在網(wǎng)站內(nèi)部使用戶能夠迅速的找到所需信息,已成為一個(gè)網(wǎng)站能夠吸引用戶的重要方面。隨著信息地快速增長(zhǎng),這一方面的需求越來(lái)越大,在很大程度上嚴(yán)重影響到 Web 站點(diǎn)的成功 [2]。因此,建立站內(nèi)搜索引擎成為必要。 所謂站內(nèi)搜索無(wú)非就是對(duì)數(shù)據(jù)庫(kù)信 息的檢索,當(dāng)然,數(shù)據(jù)庫(kù)通過(guò) SQL 查詢也在一定程度上提供了這樣的功能。但是,數(shù)據(jù)庫(kù)所提供的 Like’%keyword%’查詢,不但效率不高,尤其是在多字段查詢時(shí),而且所提供的僅僅是關(guān)鍵字的全信息匹配,所查詢到的內(nèi)容必須是 “ keyword” 的順序匹配,這對(duì)于大多數(shù)網(wǎng)站,尤其是大型網(wǎng)站來(lái)說(shuō),基于數(shù)據(jù)庫(kù)查詢的站內(nèi)搜索往往出現(xiàn)檢索數(shù)據(jù)不準(zhǔn)確、更新慢、無(wú)法控制檢索等問(wèn)題 [3]。那么,如何來(lái)解決這個(gè)問(wèn)題呢? 搜索引擎的出現(xiàn)給了人們帶來(lái)了一線希望。諸如 Google、 Baidu 等全文搜索引擎能夠提供一種基于全文信息的搜索 方式,并且能夠在所提供的一個(gè)或一組詞中分離出具有一定含義的詞,并以這些詞為關(guān)鍵字搜索并得到包含這些關(guān)鍵字的信息 [4]。 然而,我們無(wú)法做到在自己的網(wǎng)站中做出一個(gè)如 Baidu、 Google 那樣的搜索引擎。但是, Lucene 的出現(xiàn),使這種實(shí)現(xiàn)成為可能,它是一個(gè)開(kāi)放源代碼的全文檢索引擎工具包,利用 Lucene 建立的全文檢索系統(tǒng)可以通過(guò)其豐富的分析技術(shù)達(dá)到令人滿意的檢索效果 [5]。 課題的研究背景與意義 在以往 網(wǎng)站 建設(shè)、 企業(yè)信息系統(tǒng) 搭建過(guò)程中,由于信息結(jié)構(gòu)簡(jiǎn)單、內(nèi)容稀缺,站內(nèi)搜索乃至搜索都不是 網(wǎng)站系統(tǒng) 的必要裝備。但隨著 帶來(lái)的海量信息井噴式涌現(xiàn),企業(yè)自身對(duì)信息架構(gòu)、管理、發(fā)布的需求,以及用戶對(duì)信息的組織、查詢、可尋性的要求越來(lái)越高,于是站內(nèi)搜索出現(xiàn)了。 4 淘寶的出現(xiàn),電子商務(wù)井噴式的發(fā) 展,以及越來(lái)越多的社交網(wǎng)站、團(tuán)購(gòu)網(wǎng)站、專門類信息網(wǎng)站的出現(xiàn),海量的數(shù)據(jù)蘊(yùn)含在網(wǎng)站之內(nèi)。巨大的信息量無(wú)疑是把雙刃劍,在給用戶提供豐富信息的同時(shí),也給用戶提了一個(gè)大大的難題,如何在這海量信息中找到用戶想得到的信息,尤其是當(dāng)用戶提供的是一組信息不是十分明確的詞組時(shí),如何能講有用的信息條理清晰地提供給用戶,這進(jìn)一步刺激了站內(nèi)搜索技術(shù)的發(fā)展 [6]。 站內(nèi)搜索通俗來(lái)講是一個(gè)網(wǎng)站或 商城 的 “ 大門口 ” ,一般在形式上包括兩 個(gè)要件:搜索入口和搜索結(jié)果頁(yè)面,但在其 后臺(tái) 架構(gòu)上是比較復(fù)雜的,其核心要件包括:中文分詞技術(shù)、頁(yè)面抓取技術(shù)、建立索引、對(duì)搜索結(jié)果排序以及對(duì)搜索關(guān)鍵詞的統(tǒng)計(jì)、分析、關(guān)聯(lián)、推薦等 [7]。 研究現(xiàn)狀 站內(nèi)搜索主要提供的是全文搜索功能,常用的檢索技術(shù)分為如下兩種: ( 1)使用關(guān)系數(shù)據(jù)庫(kù)的 like ’%keyword%’查詢來(lái)代替全文檢索系統(tǒng)。這種方法在信息量比較小的情況下,檢索速度比較快,但是由于查詢語(yǔ)句 比較繁瑣,在面對(duì)海量信息的情況下,檢索速度會(huì)急劇降低,其性能也往往達(dá)不到要求,甚至影響數(shù)據(jù)庫(kù)的其他正常使用,尤其是在網(wǎng)絡(luò)狀態(tài)下,這方面的缺陷尤為明顯 [8]。 ( 2)使用通用的數(shù)據(jù)庫(kù)系統(tǒng)提供的全文檢索功能。一些信息化平臺(tái)雖稱實(shí)現(xiàn)了全文索引庫(kù),但其實(shí)質(zhì)是模擬的全文索引庫(kù),其通過(guò)先檢索放在關(guān)系數(shù)據(jù)庫(kù)里的結(jié)構(gòu)化數(shù)據(jù),如題目、摘要、內(nèi)容等,然后鏈接
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1