freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

信息檢索論文(參考版)

2024-11-04 00:19本頁面
  

【正文】 參考文獻:[1] [J].科技視界,2012,,(9):68—69.[2] [J].科技資訊,2012,:(26):225.[3] 湯凝.《科技信息檢索》教學新模式的研究[J].江蘇技術(shù)師范學院學報,2011,,17(7):78—81.。五、結(jié)語信息檢索課作為高等學校提高學生信息素質(zhì),培養(yǎng)學生創(chuàng)新精神和科研創(chuàng)新能力的主要課程,承擔著培養(yǎng)學生查找和獲取知識的信息能力的任務(wù)。因此在大四上學期學校給我們開設(shè)的這門課程,有效的提高了我們對于畢業(yè)論文撰寫的認識。四、信息檢索與畢業(yè)論文開展畢業(yè)設(shè)計和學位論文作為一種學習、實踐、探索和創(chuàng)新相結(jié)合的綜合教學,它是對大學生所學知識深度和廣度的全面檢驗,是大學生信息素養(yǎng)水平高低的綜合體現(xiàn)。此外通過上機,我們在練習過程中能夠檢索到大量的學科專業(yè)信息,讓我們經(jīng)歷檢索課題的全過程。整個實踐的過程讓我們體會到選擇檢索詞不是一蹴而就的,而是一個反復修正的過程,只有這樣才能很好地完成一個檢索課題。根據(jù)分析結(jié)果重新調(diào)整檢索策略,直至最終得到滿意的檢索結(jié)果。我們在做題的過程中全面地進行信息搜索,進行綜合分析了解了一些要求,如注明參考文獻、檢索方法和檢索步驟等。由于互聯(lián)網(wǎng)的發(fā)展和普及,也要求我們對互聯(lián)網(wǎng)信息資源搜索有一定的了解。我們根據(jù)題目要求進行檢索,在這個過程中老師給予了我們很大的幫助。理論課,我們主要學習了關(guān)于信息的概念、信息檢索原理、檢索語言、檢索技術(shù)、檢索策略等理論知識,老師的講解讓我們充分的理解了有關(guān)信息檢索方面的知識。最后有利于終身學習和信息創(chuàng)新能力的發(fā)展,信息的獲取、分析評價和利用能力是終身學習必須具備的能力,只有具備了這樣的能力才能實現(xiàn)終身學習的目的。二、大學生信息素質(zhì)教育的目標大學生信息素質(zhì)教育著力提高學生敏感主動的信息意識,加強學生對信息的敏感程度才能使其自覺地捕捉、分析、判斷和吸收信息,將潛在的信息需求表達出來,并實施具體的信息行為。就我們學校而言,如果不是開設(shè)這門課程,我們大多數(shù)情況下都是自己摸索著進行信息檢索,并且只會一些簡單的檢索方法。下面我從幾點來闡述我對這門課程的理解與感受:一、大學生信息素質(zhì)教育的現(xiàn)狀《現(xiàn)代信息檢索》課的重點是掌握檢索知識和檢索方法,利用網(wǎng)絡(luò)和虛擬數(shù)據(jù)庫等信息資源,運用檢索工具查閱文獻信息,獲取所需的文獻資料。這是一門實用性和操作性很強的課程,以介紹各種信息資源的檢索方法和檢索技巧為主要內(nèi)容,是培養(yǎng)大學生的學習能力、動手能力及創(chuàng)新能力的重要工具課程,同時能使大學生在短時間內(nèi)從海量的信息資源中找出符合自己需求的科技信息。因此具備敏感的信息意識,掌握先進的信息檢索技術(shù),并能熟練利用各種豐富的信息資源,成為高等院校培養(yǎng)的跨世紀人才所必備的知識和技能。除了智商、情商。這些對于我們未來的學習都有很大的幫助。搜索引擎:信息檢索實踐 機械工業(yè)出版社2010年第五篇:信息檢索論文《現(xiàn)代信息檢索》課程心得體會摘要:為了培養(yǎng)大學生對科技信息資源檢索與利用的能力,我校開設(shè)了現(xiàn)代信息檢索這門課程。2007年【3】 梁斌。一個基于詞典與統(tǒng)計的中文分詞算法[D]?!緟⒖嘉墨I】【1】 吳勝遠。判斷一個系統(tǒng)的中文分詞功能好壞,主要在于消歧功能和對未登錄詞識別功能。即使這項工作可以完成,還是會存在問題,例如:在句子“張三虎頭虎腦的”中,“張三虎”還能不能算詞?新詞中除了人名以外,還有機構(gòu)名、地名、產(chǎn)品名、商標名、簡稱、省略語等,還有目前網(wǎng)絡(luò)流行語詞,如“有沒有”、“傷不起”“神馬浮云”、“童鞋們”、“蘿莉”等等都是很難處理的問題,而且這些又正好是人們經(jīng)常使用的詞,因此對于搜索引擎來說,分詞系統(tǒng)中的新詞識別十分重要。最典型的是人名,人可以很容易理解句子“張三虎是山東人”中,“張三虎”是個詞,因為是一個人的名字,但要是讓計算機去識別就困難了。(二)新詞專業(yè)術(shù)語稱為未登錄詞。真歧義意思是給出一句話,由人去判斷也不知道哪個應(yīng)該是詞,哪個應(yīng)該不是詞。例如,在句子“這個門把手壞了”中,“把手”是個詞,但在句子“請把手拿開”中,“把手”就不是一個詞;在句子“將軍任命了一名中將”中,“中將”是個詞,但在句子“產(chǎn)量三年中將增長兩倍”中,“中將”就不再是詞。像這種交叉歧義十分常見由于沒有人的知識去理解,計算機很難知道到底哪個方案正確。例如:學歷史知識,因為“學歷”和“歷史”都是詞,那么這個短語就可以分成“學歷”和“歷史”。所以,分詞與這些信息的運用是既相聯(lián)系又相制約的一種相輔相成的關(guān)系,而純粹的機械切分必然會帶來切分歧義。(一)切分歧義就人對漢語的理解而言,漢語的分詞是一個理解的過程,這個過程綜合了詞法、語法、語義等各種信息。中文是一種十分復雜的語言,讓計算機理解中文語言更是困難。筆者了解,海量科技的分詞算法就采用“復方分詞法”,所謂復方,相當于用中藥中的復方概念,即用不同的藥才綜合起來去醫(yī)治疾病,同樣,對于中文詞的識別,需要多種算法來處理不同的問題。到底哪種分詞算法的準確度更高,目前并無定論。(四)一種新的分詞方法并行分詞方法:這種分詞方法借助于一個含有分詞詞庫的管道進行 ,比較匹配過程是分步進行的 ,每一步可以對進入管道中的詞同時與詞庫中相應(yīng)的詞進行比較 ,由于同時有多個詞進行比較匹配 ,因而分詞速度可以大幅度提高。由于漢語語言知識的籠統(tǒng)、復雜性,難以將各種語言信息組織成機器可直接讀取的形式。在總控部分的協(xié)調(diào)下,分詞子系統(tǒng)可以獲得有關(guān)詞、句子等的句法和語義信息來對分詞歧義進行判斷。它的優(yōu)點在于可以發(fā)現(xiàn)所有的切分歧義并且容易將新詞提取出來。它不依靠詞典,而是將文章中任意兩個字同時出現(xiàn)的頻率進行統(tǒng)計,次數(shù)越高的就可能是一個詞。全切分算法能取得所有可能的切分形式,它的句子覆蓋率和分詞覆蓋率均為100%,但全切分分詞并沒有在文本處理中廣泛地采用。(1)全切分全切分要求獲得輸入序列的所有可接受的切分形式,而部分切分只取得一種或幾種可接受的切分形式,由于部分切分忽略了可能的其他切分形式,所以建立在部分切分基礎(chǔ)上的分詞方法不管采取何種歧義糾正策略,都可能會遺漏正確的切分,造成分詞錯誤或失敗。(二)全切分和基于詞的頻度統(tǒng)計的分詞方法基于詞的頻度統(tǒng)計的分詞方法是一種全切分方法。一種方法是改進掃描方式,稱為特征掃描或標志切分,優(yōu)先在待分析字符串中識別和切分出一些帶有明顯特征的詞,以這些詞作為斷點,可將原字符串分為較小的串再來進機械分詞,從而減少匹配的錯誤率。但這種精度還遠遠不能滿足實際的需要。一般說來,逆向匹配的切分精度略高于正向匹配,遇到的歧義現(xiàn)象也較少。還可以將上述各種方法相互組合,例如,可以將正向最大匹配方法和逆向最大匹配方法結(jié)合起來構(gòu)成雙向匹配法。例如切分字段“碩士研究生產(chǎn)”,正向最大匹配法的結(jié)果會是“碩士研究生 / 產(chǎn)”,而逆向最大匹配法利用逆向掃描,可得到正確的分詞結(jié)果“碩士 / 研究 / 生產(chǎn)”。所以,逆向最大匹配法比正向最大匹配法的誤差要小。然后,根據(jù)逆序詞典,對逆序文檔用正向最大匹配法處理即可。相應(yīng)地,它使用的分詞詞典是逆序詞典,其中的每個詞條都將按逆序方式存放。(2)逆向最大匹配法(Recerse MaximumMatching Method))通常簡稱為RMM法RMM法的基本原理與MM法相同 ,不同的是分詞切分的方向與MM法相反,而且使用的分詞辭典也不同。如果詞典中找不到這樣的一個i字詞,則匹配失敗,將匹配字段中的最后一個字去掉,對剩下的字串重新進行匹配處理…… 如此進行下去,直到匹配成功,即切分出一個詞或剩余字串的長度為零為止。常用的幾種機械分詞方法如下:(1)最大正向匹配法(MaximumMatching Method)通常簡稱為MM法其基本思想為:假定分詞詞典中的最長詞有i個漢字字符,則用被處理文檔的當前字串中的前i個字作為匹配字段,查找字典。(一)基于字典、詞庫匹配的分詞方法這種方法又叫做機械分詞方法,它是按照一定的策略將待分析的漢字串與一個“充分大的”機器詞典中的詞條進行配,若在詞典中找到某個字符串,則匹配成功(識別出一個詞)。而且中文分詞的準確度,對搜索引擎結(jié)果相關(guān)性和準確性有相當大的關(guān)系。中文分詞到底對搜索引擎有多大影響?對于搜索引擎來說,最重要的并不是找到所有結(jié)果,因為在上百億的網(wǎng)頁中找到所有結(jié)果沒有太多的意義,沒有人能看得完,最重要的是把最相關(guān)的結(jié)果排在最前面,這也稱為相關(guān)度排序。三、中文分詞與搜索引擎分詞技術(shù)使用在搜索引擎網(wǎng)頁預(yù)處理階段。把中文的漢字序列切分成有意義的詞,就是中文分詞,有些人也稱為切詞。例如,英文句子I am a student,用中文則為:“我是一個學生”。二、什么是中文分詞?中文分詞技術(shù)就是搜索引擎針對用戶提交查詢的關(guān)鍵串進行的查詢處理后,根據(jù)用戶的關(guān)鍵詞串用各種匹配方法進行的一種技術(shù)。一、為什么要進行分詞?漢語是世界上最古老和最豐富的語言之一,但是漢語語法才有將近一百年的歷史,而且現(xiàn)代漢語白話文的形成歷史也比較短,加上漢語自身的特點,因此它的形式化研究更加困難。目前在中文搜索引擎領(lǐng)域,國內(nèi)的搜索引擎已經(jīng)和國外的搜索引擎效果上相差不遠。其中對搜索信息的預(yù)處理階段的關(guān)鍵技
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1