freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

《信息組織檢索二》ppt課件-全文預(yù)覽

2025-05-27 02:41 上一頁面

下一頁面
  

【正文】 、地點(diǎn)、做案者、襲擊目標(biāo)等。 ? 一種是通過將相似的文本歸為一組(聚類)的方法,把全體文檔集合分為若干類。在信息過濾系統(tǒng)中,把檢索需求稱為用戶描述,把不斷產(chǎn)生的新信息成為信息流。查詢向量 q 表示如下: ? q1 q = q2 q3 qm ? 檢索時(shí),找出與給定的查詢語句相似的文本,這是通過計(jì)算查詢向量 q 與各個(gè)文本向量 d J 間的相似度實(shí)現(xiàn)的。 ? 向量空間模型的最大特點(diǎn)是用多維向量表示文檔和查詢,通過計(jì)算向量間的相似度實(shí)現(xiàn)文檔的相似檢索。 ? 內(nèi)容檢索 —— 不必像全文檢索那樣進(jìn)行完全一致的匹配,而是著眼于找出與查詢語義相似的文本。 ? 一個(gè)信息檢索模型是將文檔表示、查詢以及它們之間的關(guān)系進(jìn)行建模的框架,它由一個(gè)三元組表示: F [ D, Q, R ( q i d j ) ] 其中, D是文檔的表示, Q是查詢的表示。檢索系統(tǒng)采用的查詢和文檔集內(nèi)部表示、相似匹配的方式?jīng)Q定所采用的檢索策略和模式,從而引出各種不同的信息檢索模型( information retrieval model)。 按照相似匹配度模式的不同可以分為 :全文 ( fulltext) 檢索 內(nèi)容 (contentbased)檢索 ? 全文檢索 —— 以從文本中找出與查詢表示的字符串完全一致的部分為目的,檢索結(jié)果為包含查詢字符串的文本及其位置。 內(nèi)容檢索的模型有: ? 向量空間模型( vector space model) 概率模型 (probabilistic model) 網(wǎng)絡(luò)模型 (work model) 向量空間模型: ? 向量空間模型是 Gerard Stalton等人在 SMART系統(tǒng)中采用的模型,在信息檢索領(lǐng)域?yàn)槿藗兯熘囊环N傳統(tǒng)的檢索模型。其中各列是表示 文本信息 的文本向量,各行是表示 索引項(xiàng)信息 的索引項(xiàng)向量(其中索引項(xiàng)是經(jīng)過權(quán)重處理的元素) d11 d12 … d 1n D = [ d1 d2 …d n] = d21 d22 … d 2n dm1 dm2 … d mn ? 查詢語句與文本相同也用索引項(xiàng)權(quán)重為元素的向量表示。 當(dāng)新的文檔加入到系統(tǒng)中時(shí),只提取符合用戶需求的信息,去除不符合的信息。 ? 大致分為兩種:一種是按照預(yù)先設(shè)定文本內(nèi)容的類別(如政治、經(jīng)濟(jì)、科學(xué)等),確定文本內(nèi)容屬于哪一類,將文本放到所屬的類別中。 3)信息抽取 ? 信息抽取系統(tǒng)的重要功能是從文檔中抽取出特定的事實(shí)信息。 ? 近年來,信息抽取的處理對象已經(jīng)擴(kuò)展到圖像、視頻、音頻等其他媒體類型的數(shù)據(jù)。 四、信息檢索的主要方法 常規(guī)法 回溯法 循環(huán)檢索法
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1