freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

現(xiàn)代信息檢索(完整版)

  

【正文】 Information Processing(TALIP) Information Processing amp。 1990’s第一個(gè)網(wǎng)絡(luò)搜索工具: 1990年加拿大蒙特利爾大學(xué)開(kāi)發(fā)的 FTP搜索工具 Archie?,F(xiàn)代信息檢索 陸銘 66134922 2 一、 引言 課程概況 研究歷史和現(xiàn)狀 學(xué)科框架 基本概念 3 1. 課程概況 (About the course) 設(shè)課目的 市場(chǎng)發(fā)展的需求 用戶(hù)需要信息檢索技術(shù) 互聯(lián)網(wǎng)的信息量太大,尋找信息非常不容易 公司需要信息檢索技術(shù) 信息檢索技術(shù)可以創(chuàng)造利潤(rùn),搜索引擎改變了很多傳統(tǒng)的生活方式, Yahoo、 Google、 Baidu,還有一些公司如 Microsoft、 Sina、Sohu都加入到搜索技術(shù)的競(jìng)爭(zhēng) 人才的競(jìng)爭(zhēng) 搜索的技術(shù)人才出現(xiàn)缺口 2022年的網(wǎng)絡(luò)和現(xiàn)在的互聯(lián)網(wǎng)有什么不同,搜索引擎在其中占什么位置? 4 數(shù)字化信息量舉例 音樂(lè)作品 (莫扎特 ):約 100MB 報(bào)紙 (華爾街雜志 ): 100MB/年 (文本 ) 卡片目錄 (美國(guó)國(guó)會(huì)圖書(shū)館 ): 17GB 廣播 (WABC) : 270GB/年 (未經(jīng)壓縮 ) 網(wǎng)絡(luò)論壇 (Netnews): 300GB/年 地區(qū)圖書(shū)館 (加州大學(xué)圖書(shū)館 ): (圖書(shū)掃描版 ) Inter出版 (WWW): 1997年約 4TB 電視 (CNN新聞 ): 1GB/1小時(shí) , 6TB/年 (經(jīng)壓縮 ) 錄像帶出租 (Blockbuster Video): 9TB 科研圖書(shū)館 (美國(guó)會(huì)圖書(shū)館 ):全部圖書(shū)館數(shù)字化 20TB 來(lái)源:美國(guó)伯克利加州大學(xué)教授 Peter Lyman和 Alex Inter公司總裁 Brewster Kahle所著 《 文化制品數(shù)字化存檔行動(dòng)綱要 》 5 信息檢索的問(wèn)題 信息超載 信息太多 , 需要過(guò)濾 檢索結(jié)果垃圾太多 , 有害信息太多 查找非結(jié)構(gòu)信息有困難 多數(shù)數(shù)據(jù)庫(kù)在結(jié)構(gòu)化字段上工作 多數(shù)商業(yè)信息是非結(jié)構(gòu)化的 . 報(bào)告、電子郵件、來(lái)往公函 ... 美國(guó)商業(yè)每年產(chǎn)生 4500億份文件 波音 747文件比飛機(jī)重量還重 標(biāo)引是主觀的 標(biāo)引者之間不一致 , 經(jīng)驗(yàn)統(tǒng)計(jì)表明標(biāo)引者之間僅 20% 相同 作者與標(biāo)引者之間、檢索者與用戶(hù)之間不一致 6 信息檢索的問(wèn)題 語(yǔ)言問(wèn)題 一詞多意 Bank: a river boundary or a savings and loans? DNA: microbiology or Digital Equipment Corporation’s Network Architecture? Free Rider: Economic game theory or urban transportation systems? 一意多詞 car, automobile, vehicle, sedan, horseless carriage... 7 1. 課程概況 (About the course) 課程性質(zhì) 圖書(shū)館學(xué)研究生的必修課程 課程內(nèi)容 本課程的教學(xué)目的是培養(yǎng)學(xué)生了解信息檢索工具的基本原理和技術(shù),使學(xué)生能夠進(jìn)行較深層的研究或應(yīng)用開(kāi)發(fā) 本課程不是一門(mén)講授使用信息檢索方法的課程,本課程是研究信息檢索的 技術(shù)實(shí)現(xiàn) 的一門(mén)基礎(chǔ)課程 8 1. 課程概況 ——課程內(nèi)容體系 引言 課程概況,研究歷史和現(xiàn)狀,學(xué)科框架,相關(guān)概念 檢索理論 IR模型的形式化表示和類(lèi)型,經(jīng)典模型 檢索語(yǔ)言,互操作,自然語(yǔ)言、本體論 文本檢索 經(jīng)典、現(xiàn)代文本處理和全文文本處理,分類(lèi)和聚合 網(wǎng)絡(luò)檢索 網(wǎng)絡(luò)檢索、 PageRank和 HITS算法 信息自動(dòng)處理和系統(tǒng)評(píng)價(jià) 可視化、自動(dòng)文摘、評(píng)價(jià) 多媒體檢索 模型與語(yǔ)言,標(biāo)引與檢索,并行與分布式檢索 數(shù)字圖書(shū)館 OPAC,文獻(xiàn)模型、表達(dá)與存取,元數(shù)據(jù),云數(shù)據(jù)庫(kù)檢索技能 9 1. 課程概況 (About the course) 授課方式 自學(xué)與課堂討論相結(jié)合 課堂講述和課后練習(xí)相結(jié)合 講授內(nèi)容既包含傳統(tǒng)內(nèi)容,也注意吸收最新研究成果 既考慮入門(mén),也兼顧研究 考核方式 課程論文 按發(fā)表要求寫(xiě)作,課程結(jié)束,論文錄用 成績(jī)構(gòu)成 平時(shí)成績(jī):課堂演講討論與 1篇小論文, 30% 考試: 1篇課程論文(約 5000字), 70% 10 1. 課程概況 ——參考書(shū)籍及文獻(xiàn) 詳見(jiàn)教學(xué)大綱 BaezaYates, R. amp。 第一個(gè) WEB搜索引擎: 1994年美國(guó) CMU開(kāi)發(fā)的 Lycos。 Management(IPamp。 DM主要面向關(guān)系表中的結(jié)構(gòu)化數(shù)據(jù)而非文本。NLP和 IR天生就是融合的。 Tom Landauer認(rèn)為人的大腦只能存儲(chǔ) 200M信息量,一輩子只能接觸 6G的信息量。 62 4. 信息檢索的相關(guān)概念 (IR concepts) 信息檢索 (Information Retrieval) Information Retrieval這個(gè)術(shù)語(yǔ)產(chǎn)生于 Calvin Mooers1948年在 MIT的碩士論文 Information Retrieval(IR) 從文檔集合中返回滿(mǎn)足用戶(hù)需求的相關(guān)信息的過(guò)程 作為一門(mén)學(xué)科,是研究信息的獲取 (acquisition)、表示(representation)、存儲(chǔ) (storage)、組織 (anization)和訪(fǎng)問(wèn) (access)的一門(mén)學(xué)問(wèn) 63 4. 信息檢索的相關(guān)概念 (IR concepts) 信息檢索可以看成計(jì)算機(jī)科學(xué) (Computer Science)和圖書(shū)情報(bào)學(xué) (Library amp。 65 Documents Stream User 1 Profile User 2 Profile Docs Filtered for User 2 Docs for User 1 4. 信息檢索的相關(guān)概念 (IR concepts) Filtering(過(guò)濾 : 用戶(hù)需求不變 ,push) 66 4. 信息檢索的相關(guān)概念 (IR concepts) 用戶(hù)需求 (User Need, UN):用戶(hù)需要獲得的信息 嚴(yán)格地說(shuō), UN只存在于用戶(hù)的內(nèi)心,但是通常用文本來(lái)描述,如查找與 2022世界杯相關(guān)的新聞,有時(shí)也稱(chēng)為主題 (Topic)。這種理解置用戶(hù)于被動(dòng)的地位,
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1