freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

信息檢索與分析講稿-全文預(yù)覽

2025-07-20 00:25 上一頁面

下一頁面
  

【正文】 有多種,按截?cái)嗟奈恢脕矸?,有后截?cái)唷⑶敖財(cái)?、中截?cái)嗳N類型,按截?cái)嗟淖址麛?shù)量來分,可分有限截?cái)嗪蜔o限截?cái)唷N魑臉?gòu)詞靈活,在詞干上加上不同性質(zhì)的前綴和后綴,就可以派生出很多新的詞匯,由于詞干相同,派生出來的詞在基本含義上是一致的,形態(tài)上的差別多半只具有語法上的意義。但是,使用NOT必須慎重。對(duì)此,一般原則是,如果檢索詞涉及到表達(dá)整體的概念,就要針對(duì)具體情況分別列出每一個(gè)表達(dá)部分概念的檢索詞,否則將出現(xiàn)漏檢。布爾算符使用正確但卻不能達(dá)到應(yīng)有檢索效果的例子很多。有的檢索工具直接把布爾邏輯隱含在菜單中,例如,Lycos以“match all terms”表示邏輯與,以“match any term”表示邏輯或。這表明,邏輯與“AND”可以縮小信息的檢索范圍,提高檢索的查準(zhǔn)率。 對(duì)于提問式“A OR B”,假設(shè)檢索詞A的所有命中信息有M條,檢索詞B的所有命中信息有N條,提問式的所有命中信息有 Q條,則:當(dāng)A和B有一定相關(guān)性時(shí),Q<M+N;當(dāng)A和B密切相關(guān)時(shí),Q=max(M,N);當(dāng)A和N不相關(guān)時(shí),Q=M+N;因此,一般說來有M+N≥Q≥max(M,N)。五、檢索技術(shù)布爾檢索:利用布爾邏輯算符進(jìn)行檢索詞語或代碼的邏輯組配,是現(xiàn)代檢索系統(tǒng)中最常使用的一種方法。(4).利用各種收藏目錄:在索取原始文獻(xiàn)過程中,要根據(jù)不同類型的文獻(xiàn)查找不同的聯(lián)合目錄、館藏目錄、聯(lián)機(jī)公共目錄等,查知其原文的收藏單位,再進(jìn)行借閱。它與漢語拼音的差別較大,如果遇到采用威妥瑪氏拼音時(shí),要首先利用《威妥瑪拼音與漢語拼音音節(jié)對(duì)照表》將其轉(zhuǎn)換成漢語拼音,再拼出漢字。(3).識(shí)別不同語系文字的音譯:在西文檢索工具中,俄文、中文、日文等的文獻(xiàn)作者、出版物名稱通常采用音譯法轉(zhuǎn)換成英文進(jìn)行著錄。2)根據(jù)刊名縮寫規(guī)則或利用有關(guān)的工具書查找。(2).將縮寫刊名恢復(fù)全稱:檢索工具中在文獻(xiàn)來源項(xiàng)的著錄中,常常將期刊名稱按一定的縮寫規(guī)則進(jìn)行縮寫。為確保檢索結(jié)果的完整性,還應(yīng)利用其它文獻(xiàn)信息源進(jìn)行查找,如瀏覽最新的核心刊物來補(bǔ)充檢索工具或數(shù)據(jù)庫中尚未報(bào)道的最新文獻(xiàn)。若采用適當(dāng)?shù)臄U(kuò)檢技術(shù),檢索結(jié)果仍不能令人滿意,則考慮更換檢索文檔,即重新選擇檢索工具或數(shù)據(jù)庫。(1).縮檢:當(dāng)檢出的記錄數(shù)量太多時(shí),應(yīng)采用縮檢技術(shù)排除不符合需要或相關(guān)性較小的記錄。構(gòu)造檢索式就是把已經(jīng)確定的檢索詞和分析檢索課題時(shí)確定的檢索要求用檢索系統(tǒng)所支持的各種運(yùn)算符聯(lián)接起來,形成檢索式。確定檢索詞就是將檢索課題中包含的各個(gè)要素及檢索要求轉(zhuǎn)換成檢索工具/數(shù)據(jù)庫中允許使用的檢索標(biāo)識(shí)。(4).確定檢索途徑和檢索詞:檢索途徑主要根據(jù)分析課題時(shí)確定的已知條件,以及所選定的檢索工具能夠提供的檢索途徑來決定。對(duì)于聯(lián)機(jī)檢索,費(fèi)用包括機(jī)時(shí)費(fèi)、聯(lián)機(jī)(脫機(jī))打印費(fèi)、通訊費(fèi)、字符費(fèi)等。4)檢索工具/數(shù)據(jù)庫描述文獻(xiàn)的質(zhì)量。(3).選擇檢索系統(tǒng):選擇合適的檢索系統(tǒng)主要是選擇檢索工具/數(shù)據(jù)庫,要根據(jù)檢索課題的內(nèi)容范圍和要求來決定。制定檢索策略檢索策略(Information Retrieval Strategy)是指為實(shí)現(xiàn)檢索目標(biāo)而制定的全盤計(jì)劃或方案,是對(duì)整個(gè)檢索過程的謀劃與指導(dǎo)。明確檢索目的即要弄清楚檢索是為什么而進(jìn)行的,通常檢索目的可分為3種::是要解決研究或生產(chǎn)中的一些技術(shù)難題,如某一理論、方法、設(shè)備、過程等的具體問題,這類檢索要求查準(zhǔn)率高,只要找到合適的文獻(xiàn)即可。 可分為分類語言和主題語言。在對(duì)提問進(jìn)行轉(zhuǎn)換后,與數(shù)據(jù)庫中存儲(chǔ)的數(shù)據(jù)進(jìn)行比較運(yùn)算,然后把運(yùn)算結(jié)果輸出給用戶。詞表管理子系統(tǒng):詞表管理子系統(tǒng)管理維護(hù)系統(tǒng)中已有的詞表,使它與標(biāo)引、建庫等子系統(tǒng)相連接,支持用戶查詢操作,并從提問、對(duì)話或其它文本中采集新的詞匯信息,以及輸出各種形式的詞匯數(shù)據(jù)或詞表產(chǎn)品?! ?biāo)引子系統(tǒng):標(biāo)引,就是根據(jù)系統(tǒng)的規(guī)則和程序,對(duì)文獻(xiàn)內(nèi)容進(jìn)行分析,然后賦予每篇文獻(xiàn)以一定數(shù)量的內(nèi)容標(biāo)識(shí)(如分類號(hào)、主題詞、關(guān)鍵詞等),作為存儲(chǔ)與檢索的依據(jù)。(1)布爾邏輯檢索模型(Boolean Model)(2)向量空間檢索模型(Vector Space Model)(3)概率檢索模型(Probabilistic Model)(4)模糊集合檢索模型(Fuzzyset Model)(5)擴(kuò)展布爾邏輯檢索模型(Extended Boolean Model)(6)相關(guān)反饋模型(Relevance Feedback Model)二、信息檢索系統(tǒng)計(jì)算機(jī)信息檢索系統(tǒng)主要指它包括的功能模塊或子系統(tǒng)及其相互關(guān)系。信息集合:是有關(guān)某一領(lǐng)域的文獻(xiàn)或數(shù)據(jù)的集合體,它是一種公共知識(shí)結(jié)構(gòu),可能彌補(bǔ)用戶的知識(shí)結(jié)構(gòu)缺陷。更新自身知識(shí)積累,適應(yīng)社會(huì)發(fā)展需要 :掌握信息檢索的方法與技能,是形成合理知識(shí)和更新知識(shí)的重要手段,是做到無師自通、不斷進(jìn)取的主要途徑。面對(duì)爆炸式增長的信息量,信息檢索是進(jìn)行科學(xué)研究必不可少的手段之一 。信息存儲(chǔ)是將大量無序的信息集中起來,根據(jù)信息源的外表特征和內(nèi)容特征,經(jīng)過整理、分類、濃縮、標(biāo)引等處理,使其系統(tǒng)化、有序化,并按一定的技術(shù)要求建成一個(gè)具有檢索功能的數(shù)據(jù)庫或檢索系統(tǒng),供人們檢索和利用。三、信息檢索的概念信息檢索(Information Retrieval)是在1949年國際數(shù)學(xué)會(huì)議上由Galvin W. Mooers 在《把信息檢索看作是時(shí)間性的通訊》一文中首次提出的。)(2)信息能力(信息技能) ——尋求有關(guān)新知識(shí)的能力。這是由于各人的信息意識(shí)強(qiáng)弱不同。)傳遞運(yùn)用后事物運(yùn)動(dòng)知識(shí)新的信息信息產(chǎn)生人腦有序化用于實(shí)踐文 獻(xiàn)記錄在載體上信息、知識(shí)與文獻(xiàn)的關(guān)系關(guān)系示意圖信息素質(zhì)信息素質(zhì)(information literacy)是一個(gè)綜合性的概念,包含信息意識(shí),信息技能,信息道德。此外,還有光學(xué)字符識(shí)別(Optical Character Recognition,簡稱OCR)技術(shù)就代表了這種嶄新的技術(shù),它通過光學(xué)方法對(duì)字符、標(biāo)記表示的書面數(shù)據(jù)進(jìn)行自動(dòng)識(shí)別,轉(zhuǎn)換成機(jī)器可以處理的信息,這樣就實(shí)現(xiàn)了紙質(zhì)文獻(xiàn)信息向電子信息的轉(zhuǎn)換,而且可以通過不同接口裝置向不同設(shè)備輸入數(shù)據(jù),這些設(shè)備進(jìn)而與通信網(wǎng)絡(luò)相連,實(shí)現(xiàn)遠(yuǎn)距離數(shù)據(jù)傳送。紙質(zhì)文獻(xiàn)已經(jīng)多得不便于快速傳輸信息、高效查閱和高密度存貯了,于是其他介質(zhì)的文獻(xiàn)應(yīng)運(yùn)而生,這些文獻(xiàn)主要包括:紙質(zhì)文獻(xiàn)具有價(jià)格低廉、質(zhì)地柔軟、易于書寫、攜帶和收藏等其它一些載體所無法比擬的性能而成為文獻(xiàn)家族的主干。)文獻(xiàn)的構(gòu)成要素(1)文獻(xiàn)信息是文獻(xiàn)的內(nèi)容(2)符號(hào)系統(tǒng)是信息的攜帶者(*注:文字已不再是表達(dá)思想的唯一手段,圖形、聲頻、視頻等同樣成為表達(dá)思想、傳遞感情的重要手段。(*注目前有關(guān)文獻(xiàn)的較權(quán)威的定義主要有兩個(gè),一是《文獻(xiàn)情報(bào)術(shù)語國際標(biāo)準(zhǔn)(草案)》(ISO/DIS5127)的定義,“為了把人類知識(shí)傳播開來和繼承下去,人們用文字、圖形、符號(hào)、聲頻、視頻等手段將其記錄下來,或?qū)懺诩埳?,或曬在藍(lán)圖上,或攝制在感光片上,或錄到唱片上,或存貯在磁盤上。隱性知識(shí)對(duì)應(yīng)的是OECD中的關(guān)于Knowhow和Knowwho的知識(shí),其特點(diǎn)是不易被認(rèn)識(shí)到、不易衡量其價(jià)值、不易被其他人所理解和掌握。所謂顯性知識(shí)是指經(jīng)過人的整理和組織后,可以編碼化和度量,并以文字、公式、計(jì)算機(jī)程序等形式表現(xiàn)出來,還可以通過正式的、系統(tǒng)化的方式(如出版物、計(jì)算機(jī)網(wǎng)絡(luò)等)加以傳播,便于其他人掌握的知識(shí)。)知識(shí)是人類的主觀世界對(duì)客觀世界概括和反映,是大量有組織的信息,是關(guān)于事實(shí)和思想的有組織的陳述。那么李太白的詩“日照香爐生紫煙,遙看瀑布掛前川,飛直下三千尺,疑是銀河落花流水九天。在諸多層次中,最重要的是兩個(gè)層次:一是沒有任何約束條件的本體論層次,即信息是一種客觀存在的現(xiàn)象,是事物的運(yùn)動(dòng)狀態(tài)及其變化方式的表征,不受主體意志的影響。信息論的創(chuàng)始人申農(nóng)()1948年在《通信的數(shù)學(xué)原理》一文中將信息定義為“兩次不定性之差”。這種情況主要是由于信息本身的因素,以及認(rèn)識(shí)層次上的差別造成的。二、和信息檢索相關(guān)的幾個(gè)術(shù)語的解釋和理解信息定義——物質(zhì)存在的一種方式,一般指數(shù)據(jù)、消息中所包含的意義?,F(xiàn)代意義的信息檢索作為一個(gè)獨(dú)立的領(lǐng)域,是1946年計(jì)算機(jī)出現(xiàn)后在國際上逐步得以確立的。信息檢索,就是從浩如煙海的信息海洋中查找出所需信息的過程。20世紀(jì)以來,人類創(chuàng)生的信息量高速增長,浩如煙海。但在20世紀(jì)中期以前,信息存儲(chǔ)和傳播主要以紙質(zhì)為載體,信息檢索活動(dòng)也是圍繞和文獻(xiàn)的獲取和控制展開的,因此,信息檢索研究關(guān)注的是如何檢索利用文獻(xiàn)中記載的信息,文獻(xiàn)檢索一度成為信息檢索的同義詞。然而隨著計(jì)算機(jī)、多媒體等信息技術(shù)的發(fā)展,以多種載體多種記錄方式的非紙信息急劇的增加,靠“手翻、眼看、大腦判斷”的手工檢索模式已經(jīng)難以適應(yīng)信息社會(huì)的發(fā)展要求,計(jì)算機(jī)信息檢索應(yīng)運(yùn)而生;以Internet為代表的全球性計(jì)算機(jī)網(wǎng)絡(luò)迅速發(fā)展和普及,更進(jìn)一步的推動(dòng)了信息檢索的發(fā)展,使得網(wǎng)絡(luò)化信息檢索逐漸成為信息檢索的主流。據(jù)不完全統(tǒng)計(jì),信息的定義有100多種,至今仍無法統(tǒng)一,為各界普遍認(rèn)同??刂普搶<襈?維納(N
點(diǎn)擊復(fù)制文檔內(nèi)容
外語相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1