【文章內(nèi)容簡介】
S truc ture dBrow sin g F la tF la tH y p e r te x tS truc ture G uide dH y p e r te x tL O G I CA L V I E W O F DO CU M E NT SUSERTASK 經(jīng)典模型 – 基本概念 ? 每篇文獻(xiàn)用關(guān)鍵詞或索引詞來代表 ? 索引詞是特定文獻(xiàn)中有意義的或代表文獻(xiàn)主題的詞 ? 通常索引詞為名詞,因?yàn)橹挥忻~自身才有意義 ? 然而搜索引擎將所有詞都進(jìn)行索引,成為全文索引 ? 但是并不是所有詞對于特定文獻(xiàn)都具有相等的代表性:低頻詞更能區(qū)分文獻(xiàn)(具有更小的命中文獻(xiàn)集合) ? 索引詞的重要性由賦予它的權(quán)重決定 ? 如 – ki 為一索引詞 – dj 為一文獻(xiàn) – wij 為 (ki,dj)的權(quán)重 ? 權(quán)重 wij 代表了索引詞 ki在文獻(xiàn) dj中的重要性 經(jīng)典模型 – 基本概念 – ki 為一索引詞 – dj 為一文獻(xiàn) – t 是檢索系統(tǒng)中文獻(xiàn)的總數(shù) – K = (k1, k2, …, kt) 索引詞集合 – wij = 0 是與 (ki,dj)相關(guān)的權(quán)重 – wij = 0 表示該詞不在某篇文獻(xiàn) dj中 – vec(dj) = (w1j, w2j, …, wtj) 是關(guān)于文獻(xiàn) dj的權(quán)重矢量 – gi(vec(dj)) = wij is 是返回關(guān)于 (ki,dj) 權(quán)重的函數(shù) 經(jīng)典模型 – 基本概念 數(shù)字圖書館中的情報(bào)檢索 ? 一般認(rèn)為數(shù)字圖書館是: – 數(shù)字對象的集合所構(gòu)成的資源庫 。 – 描述這些數(shù)字對象的元數(shù)據(jù)庫 。 – 實(shí)用這些數(shù)字對象的目標(biāo)用戶 。 – 提供各種服務(wù)(捕捉、標(biāo)引、編目、查詢、瀏覽、檢索、傳遞、存檔、長期保存等)的系統(tǒng) 數(shù)字圖書館與情報(bào)檢索 ? 情報(bào)檢索對于數(shù)字圖書館是至關(guān)重