freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

站內(nèi)全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)-在線(xiàn)瀏覽

2025-08-07 10:42本頁(yè)面
  

【正文】 growing number of social working sites, group buying sites, the emergence of specialized class information website contains vast amounts of data within the website. A huge amount of information is undoubtedly doubleedged sword, giving users a wealth of information, but also to provide the user a big problem, how to find a user wants information in this mass of information, especially when the user is offered a when information is not very clear set of phrases, how can speak clarity of useful information available to users, which further stimulated the development of the station search technology. This paper summarizes the station search function at the same time, in the study of the station search related technologies, based on the design and implementation of a simple site search engine, including the realization of the main functions of the search. Key words: Site Search。 3 第 1 章 緒論 自從有了計(jì)算機(jī)以后,人類(lèi)開(kāi)始用計(jì)算機(jī)保存信息,有保存就需要查找,于是出現(xiàn)了檢索技術(shù)。同時(shí)在同一個(gè)網(wǎng)站內(nèi)往往擁有大量的資源,怎樣在網(wǎng)站內(nèi)部使用戶(hù)能夠迅速的找到所需信息,已成為一個(gè)網(wǎng)站能夠吸引用戶(hù)的重要方面。因此,建立站內(nèi)搜索引擎成為必要。但是,數(shù)據(jù)庫(kù)所提供的 Like’%keyword%’查詢(xún),不但效率不高,尤其是在多字段查詢(xún)時(shí),而且所提供的僅僅是關(guān)鍵字的全信息匹配,所查詢(xún)到的內(nèi)容必須是 “ keyword” 的順序匹配,這對(duì)于大多數(shù)網(wǎng)站,尤其是大型網(wǎng)站來(lái)說(shuō),基于數(shù)據(jù)庫(kù)查詢(xún)的站內(nèi)搜索往往出現(xiàn)檢索數(shù)據(jù)不準(zhǔn)確、更新慢、無(wú)法控制檢索等問(wèn)題 [3]。諸如 Google、 Baidu 等全文搜索引擎能夠提供一種基于全文信息的搜索 方式,并且能夠在所提供的一個(gè)或一組詞中分離出具有一定含義的詞,并以這些詞為關(guān)鍵字搜索并得到包含這些關(guān)鍵字的信息 [4]。但是, Lucene 的出現(xiàn),使這種實(shí)現(xiàn)成為可能,它是一個(gè)開(kāi)放源代碼的全文檢索引擎工具包,利用 Lucene 建立的全文檢索系統(tǒng)可以通過(guò)其豐富的分析技術(shù)達(dá)到令人滿(mǎn)意的檢索效果 [5]。但隨著 帶來(lái)的海量信息井噴式涌現(xiàn),企業(yè)自身對(duì)信息架構(gòu)、管理、發(fā)布的需求,以及用戶(hù)對(duì)信息的組織、查詢(xún)、可尋性的要求越來(lái)越高,于是站內(nèi)搜索出現(xiàn)了。巨大的信息量無(wú)疑是把雙刃劍,在給用戶(hù)提供豐富信息的同時(shí),也給用戶(hù)提了一個(gè)大大的難題,如何在這海量信息中找到用戶(hù)想得到的信息,尤其是當(dāng)用戶(hù)提供的是一組信息不是十分明確的詞組時(shí),如何能講有用的信息條理清晰地提供給用戶(hù),這進(jìn)一步刺激了站內(nèi)搜索技術(shù)的發(fā)展 [6]。 研究現(xiàn)狀 站內(nèi)搜索主要提供的是全文搜索功能,常用的檢索技術(shù)分為如下兩種: ( 1)使用關(guān)系數(shù)據(jù)庫(kù)的 like ’%keyword%’查詢(xún)來(lái)代替全文檢索系統(tǒng)。 ( 2)使用通用的數(shù)據(jù)庫(kù)系統(tǒng)提供的全文檢索功能。 本文的工作 本論文在研究了全文搜索相關(guān)文獻(xiàn)的基 礎(chǔ)上,分析了 框架,基于 .NET 平臺(tái),實(shí)現(xiàn)了一個(gè)簡(jiǎn)單的站內(nèi)搜索引擎,主要研究?jī)?nèi)容包括 [10]: ( 1) 全文檢索知識(shí)的研究。包括, .NET Framework 介紹, Visual Studio 開(kāi)發(fā)環(huán)境介紹; 5 ( 3) 分詞框架研究。 ( 4)設(shè)計(jì)并實(shí)現(xiàn)一個(gè)簡(jiǎn)單的站內(nèi)搜索引擎。全文檢索系統(tǒng) 是按照全文檢索理論建立起來(lái)的用于提供全文檢索服務(wù)的 軟件系統(tǒng) [11]。它可以根據(jù)需要獲得全文中有關(guān)章、節(jié)、段、句、詞等信息,也就 是說(shuō)類(lèi)似于給整本書(shū)的每個(gè)字詞添加一個(gè)標(biāo)簽,也可以進(jìn)行各種統(tǒng)計(jì)和分析。 全文搜索技術(shù)是指計(jì)算機(jī)索引程序通過(guò)掃描文章中的每一個(gè)詞,對(duì)每一個(gè)詞建立一個(gè)索引,指明該詞在文章中出現(xiàn)的次數(shù)和位置,當(dāng)用戶(hù)查詢(xún)時(shí),搜索程序就根據(jù)事先建立的索引進(jìn)行查找,并將查找的結(jié)果反饋給用戶(hù)的檢索方式。檢索主要分為按字檢索和按詞搜索兩種。對(duì)于各種不同的 語(yǔ)言而言,字有不同的含義,比如英文中字與詞實(shí)際上是合一的,而中文中字與詞有很大分別。英文等西方文字由于按照空白切分詞,因此實(shí)現(xiàn)上與按字處理類(lèi)似,添加同義處理也很容易。 全文搜索系統(tǒng)是按照全文檢索理論建立起來(lái)的用于提供全文檢索服務(wù)的全文搜索系統(tǒng)。功能上,全文搜索系統(tǒng),核心具有建立索
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1