freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

現(xiàn)代信息檢索-全文預(yù)覽

2025-08-22 13:08 上一頁面

下一頁面
  

【正文】 用戶方面的屬性。據(jù)說谷歌用了上百種排名因子 75 4. 信息檢索與數(shù)據(jù)庫檢索 近年來,隨著 XML的出現(xiàn),兩種檢索已經(jīng)逐漸融合,邊界越來越不明顯。 79 本章小結(jié) 信息檢索是一門交叉學(xué)科,不僅僅是搜索 信息檢索中的用戶需求、查詢、文檔、文檔集、相關(guān)度概念的含義 作為學(xué)科的信息檢索的內(nèi)涵和外延 80 課后思考題 信息檢索的定義? 信息檢索中的用戶需求、查詢、相關(guān)度都是什么含義? 信息檢索和其他相關(guān)學(xué)科是什么關(guān)系? 信息檢索系統(tǒng)由哪些部分組成?各部分的功能是什么? 信息檢索的定義是什么?請(qǐng)列舉幾種信息檢索的應(yīng)用。文本可以用于描述其他媒體 其他媒體形式的檢索的方法往往借鑒自文本檢索。 相關(guān)度通常只有相對(duì)意義,對(duì)一個(gè) Q,不同文檔的相關(guān)度可以比較,而對(duì)于不同的 Q的相關(guān)度不便比較相關(guān)度的輸入信息可以更多,比如用戶的背景信息、用戶的查詢歷史等等 現(xiàn)代信息檢索中相關(guān)度不是唯一度量,如還有:重要度、權(quán)威度、新穎度等度量。系統(tǒng)角度相關(guān)并不和用戶脫節(jié)。也稱為 Repository, Corpus 72 4. 信息檢索的相關(guān)概念 (IR concepts) 相關(guān) (relevant、相關(guān)度 relevance) 相關(guān)取決于用戶的判斷,是一個(gè)主觀概念,不同用戶做出的判斷很難保證一致,即使是同一用戶在不同時(shí)期、不同環(huán)境下做出的判斷也不盡相同。 Query在 IR系統(tǒng)中往往還有內(nèi)部表示。 例 1:返回與信息檢索相關(guān)的網(wǎng)頁 ——搜索引擎 (Search Engine, SE) 例 2:毛澤東的生日是哪天 ——問答系統(tǒng) (Question Answering, QA) 例 3:返回聯(lián)想 PC的型號(hào)、配置、價(jià)格等 ——信息抽取 (Information Extraction, IE) 例 4:訂閱有關(guān) NBA的新聞 ——信息過濾 (Information Filtering)、信息推薦 (Information Remending) 狹義的 IR通常是指 Information Search,而廣義的IR包含非常多的內(nèi)容 (SE, QA, IE, …) 。以計(jì)算機(jī)為手段,處理信息對(duì)象,和語言學(xué)、認(rèn)知科學(xué)等其他學(xué)科融合。另一方面,人們?nèi)绾慰焖佟?zhǔn)確、全面地獲得自己所需要的信息非常困難!信息量太大,而且信息冗余度大、質(zhì)量良莠不齊、格式不一、位置分散、關(guān)聯(lián)復(fù)雜、語言繁多。 1998年,美國前副總統(tǒng)戈?duì)柼岢鰯?shù)字化地球的概念。其中紙質(zhì)信息僅占所有信息的 %...”(Lyman amp。通過一些 NLP方法來獲得文檔中的一個(gè)語言片斷(information extraction)。 55 3. 學(xué)科體系和相關(guān)研究領(lǐng)域 —外延 自然語言理解 (Natural Language Processing,NLP) NLP關(guān)注自然語言文本的語法 (syntactic) 、語義(semantic)及語用 (pragmatic)分析。 DM中不論是查詢還是數(shù)據(jù)都具有明確的語義。 近年來數(shù)字圖書館方面的工作使得 LIS和 IR日益融合。 語義網(wǎng)研究 ——這方面的研究項(xiàng)目有 面向自然語言處理的語法, 語義計(jì)算機(jī)模式的研究, 潛在的語義索引, 復(fù)合詞的分析模型研究, 自動(dòng)構(gòu)成多語種詞庫, 存取多語種信息, 用戶自適應(yīng)集合分類法研究, 知識(shí)共生現(xiàn)象研究, 網(wǎng)絡(luò)知識(shí)搜尋代理等 38 2. 研究歷史和現(xiàn)狀 — 研究前沿 信息檢索技術(shù) 前沿課題包括:元數(shù)據(jù)技術(shù)、語料庫技術(shù)、海量信息存儲(chǔ)與壓縮技術(shù)、信息可視化技術(shù)、圖像檢索技術(shù)、人機(jī)界面技術(shù)、多語言瀏覽器、跨語言信息檢索、自然語言理解、人工智能、大規(guī)模真實(shí)文本評(píng)測、自動(dòng)抽詞、自動(dòng)標(biāo)引、自動(dòng)分類、自動(dòng)文摘、概念分類( Ontology)、“云”檢索、信息安全和保護(hù)技術(shù)等。倫敦城市大學(xué)的Robertson及劍橋大學(xué)的 SparckJones是概率模型的倡導(dǎo)者。 1998斯坦福大學(xué)博士生開發(fā)的 Google,提出 PageRank計(jì)算公式。 1960- 70年代在建立文摘檢索系統(tǒng)中,產(chǎn)生了 布爾模型 (Boolean Model)、 向量空間模型 (Vector Space Model)和 概率檢索模型 (Probabilistic Model) 1980年代出現(xiàn)商用數(shù)據(jù)庫檢索系統(tǒng): Dialog,ORBIT, MEDLINE 16 2. 研究歷史和現(xiàn)狀 ——Inter出現(xiàn)以后 1986年 Inter正式形成。 李明珍 .十年來我國信息檢索研究述評(píng) .現(xiàn)代圖書情報(bào)技術(shù) ,2022,(12) 焦玉英 . 網(wǎng)絡(luò)環(huán)境中信息檢索理論與實(shí)踐的發(fā)展 .圖書情報(bào)知識(shí) ,2022,(01) 12 一些重要的工具 Lemur:包含各種 IR模型的實(shí)驗(yàn)平臺(tái), C++ SMART:向量空間模型工具 , C編寫 Weka:分類工具, Java編寫 Lucene:開源檢索工具,各種語言編寫的版本 Larbin:采集工具, C++ Firtex:檢索平臺(tái), C++,計(jì)算所開發(fā) 13 2. 研究歷史和現(xiàn)狀 歷史分段: 計(jì)算機(jī)出現(xiàn)以前 計(jì)算機(jī)出現(xiàn)以后 Inter出現(xiàn)以后 14 2. 研究歷史和現(xiàn)狀 ——計(jì)算機(jī)出現(xiàn)以前 約 4000年前,人類就開始有目的地組織信息,一個(gè)典型的例子就是圖書中的目錄。 B. RibeiroNeto. eds. Modern Information Retrieval. ACM Press, 1999 王知津等譯 . 現(xiàn)代信息檢索技術(shù) .機(jī)械工業(yè)出版社, 2022 蘇新寧 . 信息檢索理論與技術(shù) . 科學(xué)技術(shù)文獻(xiàn)出版社, 2022 焦玉英 .信息檢索進(jìn)展,科學(xué)出版社, 2022 林 培光等,面向 Web的個(gè)性化語義信息檢索技術(shù),中國財(cái)政經(jīng)濟(jì)出版社, 2022 解虹 ,數(shù)字化環(huán)境下交互式信息檢索,機(jī)械工業(yè)出版社, 2022 于 天恩,迅速搭建全文搜索平臺(tái),清華大學(xué)出版社, 2022 11 1. 課程概況 ——參考書籍及文獻(xiàn) 第一章 引言 吳慰慈 . 網(wǎng)絡(luò)環(huán)境下信息存儲(chǔ)與檢索技術(shù)的發(fā)展 .四川圖書館學(xué)報(bào) ,2022,(01) 王知津 。 15 2. 研究歷史和現(xiàn)狀 ——計(jì)算機(jī)出現(xiàn)以后 1948年 C. N. Mooers在其 MIT碩士論文中第一次使用了“ Information Retrieval”這個(gè)術(shù)語。 1995斯坦福大學(xué)博士生開發(fā) Yahoo。 19 2. 研究歷史和現(xiàn)狀 2022’s以來的其他重要事件: 多媒體 IR, Image,
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1