【正文】
8 文本數(shù)據(jù)庫 文本 情報檢索流程 簡介 ? 情報檢索系統(tǒng)采用索引詞處理提問 (匹配 ) ? 索引詞 : – 關(guān)鍵詞或者規(guī)范詞 – 任意詞 ? 用到切分或截詞 : – connect: connecting, connection, connections ? 倒排檔用于查檢操作 Introduction 文件 信息需求 索引詞 文件 提問 排序 匹配 簡介 ? 排序是檢出文獻(xiàn)對于用戶提問的相關(guān)程度的順序 ? 以下原因造成問題: – 索引詞的匹配不太精確 – 用戶常常會不滿足 – 由于用戶沒有經(jīng)過提問式編寫的培訓(xùn),檢索效果會更糟 – Web上的情報檢索更是如此 – 相關(guān)性的測度成為匹配與排序的關(guān)鍵問題 情報檢索模型 非重疊列表 最近節(jié)點 結(jié)構(gòu)化模型 檢索 : 實際上是信息過濾 瀏覽 用戶目的 傳統(tǒng)模型 布爾模型 矢量模型 概率模型 集合論 模糊理論 擴(kuò)展的布爾邏輯 概率論 推理網(wǎng)絡(luò) 信任網(wǎng)絡(luò) 代數(shù)論 普通矢量 語義索引 神經(jīng)網(wǎng)絡(luò) 瀏覽 平面結(jié)構(gòu) 結(jié)構(gòu)指南 超文本 情報檢索模型 ? 情報檢索模型 , 文件的邏輯視圖 , 以及檢索任務(wù)是情報檢索的三個不同方面 In d e x Te r m s F u ll Tex t F u ll Tex t +S t r u c t u r eR e t r ie valCl a ssicS e t The or e ti cA lg e b r a icP r oba bili sti cCl a ssicS e t The or e ti cA lg e b r a icP r oba bili sti c