【正文】
e (Pr[x]=2x ) ? Delta Code ? Golomb Code ? 字典方法 ? ZivLempel編碼 ? ?? ? ? ?1 2 l o g 1 l o g l o g21Pr [ ] 22 l o gxxxxx??? ? ? ?? ? ? ?? ? ? ?????? ? 1Pr [ ] 1 xx p p???實驗結果 本文貢獻 ? 設計了一個服務:如何利用寶貴的歷史網頁數據提供公共信息服務以充分發(fā)揮信息作為研究工作基礎設施的作用 ? 設計和實現了全文索引系統(tǒng):重點討論了利用壓縮技術減少全文索引的倒排文件索引的大小,為海量歷史網頁數據的檢索服務提供現實可行的基礎設施保障 謝謝!