【導(dǎo)讀】人們?cè)谙硎躀nter所帶來。Inter搜索引擎應(yīng)運(yùn)而生,而對(duì)搜索引擎的研究也理所當(dāng)然的成為了Inter技術(shù)中最熱門的領(lǐng)域。本文對(duì)搜索引擎的原理組成數(shù)據(jù)結(jié)構(gòu)工作流程等方面做了深入細(xì)致地研究與分析。未來發(fā)展方向是個(gè)性化智能化的。對(duì)于不同類型的用戶群搜索相同的內(nèi)容將得到不同的更適合用戶的。的查詢需求,并能對(duì)用戶進(jìn)行智能分類從而為搜索引擎的個(gè)性化提供依據(jù)。本文詳細(xì)地介紹了LUCENE. 的特點(diǎn)系統(tǒng)結(jié)構(gòu)及索引機(jī)制。LUCENE是Apache軟件基金會(huì)下的一個(gè)開源項(xiàng)目,完全支持JAVA技術(shù),適用于需要全文搜索能力的應(yīng)用程序,并具有很好的跨平臺(tái)能力。網(wǎng)絡(luò)蜘蛛部分采用了非遞歸爬行方式和JAVA的多線程機(jī)制,實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)的抓取。助LUCENE全文搜索引擎庫(kù)中的JAVA類庫(kù)進(jìn)行實(shí)現(xiàn)。最后采用JSP技術(shù)設(shè)計(jì)一個(gè)