【導(dǎo)讀】來越得到廣泛地使用。搜索引擎系統(tǒng)包括3個(gè)功能模塊:網(wǎng)頁獲取模塊,數(shù)據(jù)存儲(chǔ)模塊和檢索。本人在課題組中主要承擔(dān)工作有:系統(tǒng)整體設(shè)計(jì)、數(shù)據(jù)庫的設(shè)計(jì)實(shí)現(xiàn)以及中文分。本系統(tǒng)的整體設(shè)計(jì)突出操作簡(jiǎn)便、功能強(qiáng)大、人性化設(shè)置、并行處理可移植等特點(diǎn),其中中文分詞,各模塊的存儲(chǔ)流程是系統(tǒng)的設(shè)計(jì)亮點(diǎn)。本文中對(duì)搜索引擎的各種技術(shù)算。法進(jìn)行了介紹,而且根據(jù)系統(tǒng)的需要進(jìn)行了各功能模塊的設(shè)計(jì)。大容量存儲(chǔ)、高效檢索和簡(jiǎn)單查詢。索引數(shù)據(jù)庫以頁面信息表和詞庫表為核心,通過對(duì)。分割,使其分為單獨(dú)的詞或詞組。