正文內(nèi)容

專業(yè)論文信息檢索方法(參考版)

2024-10-21 05:20本頁面

　　

【正文】搜索引擎：信息檢索實(shí)踐機(jī)械工業(yè)出版社2010年。2007年【3】梁斌。一個(gè)基于詞典與統(tǒng)計(jì)的中文分詞算法[D]?！緟⒖嘉墨I(xiàn)】【1】吳勝遠(yuǎn)。判斷一個(gè)系統(tǒng)的中文分詞功能好壞,主要在于消歧功能和對未登錄詞識(shí)別功能。即使這項(xiàng)工作可以完成，還是會(huì)存在問題，例如：在句子“張三虎頭虎腦的”中，“張三虎”還能不能算詞？新詞中除了人名以外，還有機(jī)構(gòu)名、地名、產(chǎn)品名、商標(biāo)名、簡稱、省略語等，還有目前網(wǎng)絡(luò)流行語詞，如“有沒有”、“傷不起”“神馬浮云”、“童鞋們”、“蘿莉”等等都是很難處理的問題，而且這些又正好是人們經(jīng)常使用的詞，因此對于搜索引擎來說，分詞系統(tǒng)中的新詞識(shí)別十分重要。最典型的是人名，人可以很容易理解句子“張三虎是山東人”中，“張三虎”是個(gè)詞，因?yàn)槭且粋€(gè)人的名字，但要是讓計(jì)算機(jī)去識(shí)別就困難了。（二）新詞專業(yè)術(shù)語稱為未登錄詞。真歧義意思是給出一句話，由人去判斷也不知道哪個(gè)應(yīng)該是詞，哪個(gè)應(yīng)該不是詞。例如，在句子“這個(gè)門把手壞了”中，“把手”是個(gè)詞，但在句子“請把手拿開”中，“把手”就不是一個(gè)詞；在句子“將軍任命了一名中將”中，“中將”是個(gè)詞，但在句子“產(chǎn)量三年中將增長兩倍”中，“中將”就不再是詞。像這種交叉歧義十分常見由于沒有人的知識(shí)去理解，計(jì)算機(jī)很難知道到底哪個(gè)方案正確。例如：學(xué)歷史知識(shí)，因?yàn)椤皩W(xué)歷”和“歷史”都是詞，那么這個(gè)短語就可以分成“學(xué)歷”和“歷史”。所以，分詞與這些信息的運(yùn)用是既相聯(lián)系又相制約的一種相輔相成的關(guān)系，而純粹的機(jī)械切分必然會(huì)帶來切分歧義。（一）切分歧義就人對漢語的理解而言，漢語的分詞是一個(gè)理解的過程，這個(gè)過程綜合了詞法、語法、語義等各種信息。中文是一種十分復(fù)雜的語言，讓計(jì)算機(jī)理解中文語言更是困難。筆者了解，海量科技的分詞算法就采用“復(fù)方分詞法”，所謂復(fù)方，相當(dāng)于用中藥中的復(fù)方概念，即用不同的藥才綜合起來去醫(yī)治疾病，同樣，對于中文詞的識(shí)別，需要多種算法來處理不同的問題。到底哪種分詞算法的準(zhǔn)確度更高，目前并無定論。（四）一種新的分詞方法并行分詞方法：這種分詞方法借助于一個(gè)含有分詞詞庫的管道進(jìn)行 ,比較匹配過程是分步進(jìn)行的 ,每一步可以對進(jìn)入管道中的詞同時(shí)與詞庫中相應(yīng)的詞進(jìn)行比較 ,由于同時(shí)有多個(gè)詞進(jìn)行比較匹配 ,因而分詞速度可以大幅度提高。由于漢語語言知識(shí)的籠統(tǒng)、復(fù)雜性，難以將各種語言信息組織成機(jī)器可直接讀取的形式。在總控部分的協(xié)調(diào)下，分詞子系統(tǒng)可以獲得有關(guān)詞、句子等的句法和語義信息來對分詞歧義進(jìn)行判斷。它的優(yōu)點(diǎn)在于可以發(fā)現(xiàn)所有的切分歧義并且容易將新詞提取出來。它不依靠詞典,而是將文章中任意兩個(gè)字同時(shí)出現(xiàn)的頻率進(jìn)行統(tǒng)計(jì),次數(shù)越高的就可能是一個(gè)詞。全切分算法能取得所有可能的切分形式，它的句子覆蓋率和分詞覆蓋率均為100%，但全切分分詞并沒有在文本處理中廣泛地采用。（1）全切分全切分要求獲得輸入序列的所有可接受的切分形式，而部分切分只取得一種或幾種可接受的切分形式，由于部分切分忽略了可能的其他切分形式，所以建立在部分切分基礎(chǔ)上的分詞方法不管采取何種歧義糾正策略，都可能會(huì)遺漏正確的切分，造成分詞錯(cuò)誤或失敗。（二）全切分和基于詞的頻度統(tǒng)計(jì)的分詞方法基于詞的頻度統(tǒng)計(jì)的分詞方法是一種全切分方法。一種方法是改進(jìn)掃描方式，稱為特征掃描或標(biāo)志切分，優(yōu)先在待分析字符串中識(shí)別和切分出一些帶有明顯特征的詞，以這些詞作為斷點(diǎn)，可將原字符串分為較小的串再來進(jìn)機(jī)械分詞，從而減少匹配的錯(cuò)誤率。但這種精度還遠(yuǎn)遠(yuǎn)不能滿足實(shí)際的需要。一般說來，逆向匹配的切分精度略高于正向匹配，遇到的歧義現(xiàn)象也較少。還可以將上述各種方法相互組合，例如，可以將正向最大匹配方法和逆向最大匹配方法結(jié)合起來構(gòu)成雙向匹配法。例如切分字段“碩士研究生產(chǎn)”，正向最大匹配法的結(jié)果會(huì)是“碩士研究生 / 產(chǎn)”，而逆向最大匹配法利用逆向掃描，可得到正確的分詞結(jié)果“碩士 / 研究 / 生產(chǎn)”。所以，逆向最大匹配法比正向最大匹配法的誤差要小。然后，根據(jù)逆序詞典，對逆序文檔用正向最大匹配法處理即可。相應(yīng)地，它使用的分詞詞典是逆序詞典，其中的每個(gè)詞條都將按逆序方式存放。（2）逆向最大匹配法(Recerse MaximumMatching Method))通常簡稱為ＲＭＭ法ＲＭＭ法的基本原理與ＭＭ法相同 ,不同的是分詞切分的方向與MM法相反，而且使用的分詞辭典也不同。如果詞典中找不到這樣的一個(gè)i字詞，則匹配失敗，將匹配字段中的最后一個(gè)字去掉，對剩下的字串重新進(jìn)行匹配處理…… 如此進(jìn)行下去，直到匹配成功，即切分出一個(gè)詞或剩余字串的長度為零為止。常用的幾種機(jī)械分詞方法如下：（1）最大正向匹配法(MaximumMatching Method)通常簡稱為ＭＭ法其基本思想為：假定分詞詞典中的最長詞有i個(gè)漢字字符，則用被處理文檔的當(dāng)前字串中的前i個(gè)字作為匹配字段，查找字典。(一)基于字典、詞庫匹配的分詞方法這種方法又叫做機(jī)械分詞方法，它是按照一定的策略將待分析的漢字串與一個(gè)“充分大的”機(jī)器詞典中的詞條進(jìn)行配，若在詞典中找到某個(gè)字符串，則匹配成功（識(shí)別出一個(gè)詞）。而且中文分詞的準(zhǔn)確度，對搜索引擎結(jié)果相關(guān)性和準(zhǔn)確性有相當(dāng)大的關(guān)系。中文分詞到底對搜索引擎有多大影響？對于搜索引擎來說，最重要的并不是找到所有結(jié)果，因?yàn)樵谏习賰|的網(wǎng)頁中找到所有結(jié)果沒有太多的意義，沒有人能看得完，最重要的是把最相關(guān)的結(jié)果排在最前面，這也稱為相關(guān)度排序。三、中文分詞與搜索引擎分詞技術(shù)使用在搜索引擎網(wǎng)頁預(yù)處理階段。把中文的漢字序列切分成有意義的詞，就是中文分詞，有些人也稱為切詞。例如，英文句子I am a student，用中文則為：“我是一個(gè)學(xué)生”。二、什么是中文分詞？中文分詞技術(shù)就是搜索引擎針對用戶提交查詢的關(guān)鍵串進(jìn)行的查詢處理后，根據(jù)用戶的關(guān)鍵詞串用各種匹配方法進(jìn)行的一種技術(shù)。一、為什么要進(jìn)行分詞？漢語是世界上最古老和最豐富的語言之一，但是漢語語法才有將近一百年的歷史，而且現(xiàn)代漢語白話文的形成歷史也比較短，加上漢語自身的特點(diǎn)，因此它的形式化研究更加困難。目前在中文搜索引擎領(lǐng)域，國內(nèi)的搜索引擎已經(jīng)和國外的搜索引擎效果上相差不遠(yuǎn)。其中對搜索信息的預(yù)處理階段的關(guān)鍵技術(shù)是中文分詞和建立倒排文件，本文主要論述搜索引擎工作過程中的中文自動(dòng)分詞技術(shù)。參考文獻(xiàn)[1]邵源,鐘炬,1999(9).[2]徐平平,1999(4).[3].[4]周世煒,張紹卿,1999(8).[5],2000(1).[6]邱玉春,1998:6(48).第五篇：信息檢索論文論搜索引擎中文自動(dòng)分詞技術(shù)【摘要】搜索引擎是應(yīng)用在web上的軟件系統(tǒng)，它以一定的策略搜集和發(fā)現(xiàn)信息，再對信息進(jìn)行處理和組織后為用戶提供web信息查詢服務(wù)。配變集中器、軟件只作了一個(gè)方案性的設(shè)計(jì)。顯然本文所做的工作還離這一目標(biāo)有相當(dāng)長的一段距離。具有低壓擴(kuò)頻載波數(shù)據(jù)遠(yuǎn)傳功能的用戶電能表終端和配變集中器是構(gòu)成本文所提出的遠(yuǎn)程抄表方案的核心裝置。采用新的遠(yuǎn)程抄表技術(shù)來改善用電治理和電能營銷的裝備水平、優(yōu)化電能市場服務(wù)的技術(shù)手段是供電企業(yè)最緊迫的需求。工作電壓：AC165～260V；用戶電能表功耗：待機(jī)時(shí)≤200mW，發(fā)送數(shù)據(jù)時(shí)≤700mW，發(fā)送時(shí)間≤25ms，接收靈敏度≤2mW；讀數(shù)準(zhǔn)確度：計(jì)數(shù)精度達(dá)到小數(shù)點(diǎn)后兩位，用戶電能表讀數(shù)與標(biāo)準(zhǔn)電能表的誤差不大于1個(gè)字()；抄表成功率：；戶表采集器的性能指標(biāo)如下：依照CEBus標(biāo)準(zhǔn)編制的程序，在傳輸過程中，沒有發(fā)現(xiàn)誤碼的存在。其中，用電采集程序可以進(jìn)行定時(shí)統(tǒng)抄、不定時(shí)統(tǒng)抄及單用戶隨時(shí)查抄；用電量可按地址統(tǒng)計(jì)，也可按相位統(tǒng)計(jì)，以便合理地調(diào)整配電變壓器A、B、C三相負(fù)載的配置，使供電系統(tǒng)的性能發(fā)揮得更好；在電費(fèi)結(jié)算時(shí)，可通過分時(shí)計(jì)費(fèi)，合理定價(jià)，使負(fù)載基本恒定；電表參數(shù)、用電信息可送到用戶終端，從而非常方便地修改電能表參數(shù)，顯示用戶的用電量及結(jié)算電費(fèi)；欠費(fèi)警告及斷電控制功能可督促用戶按時(shí)交費(fèi)；不安全和違章用電監(jiān)視報(bào)警功能可使用電監(jiān)察人員迅速準(zhǔn)確地維護(hù)用電秩序；日報(bào)表、月報(bào)表、年報(bào)表的形成和輸出方便而快捷。另外，電話線Modem還可以將營業(yè)站用電治理主機(jī)與電費(fèi)托收銀行聯(lián)機(jī)。營業(yè)站抄算主機(jī)主要由PC機(jī)、電話線Modem及其軟件構(gòu)成。上行和下行數(shù)據(jù)要經(jīng)過工控機(jī)的處理，并在不需要數(shù)據(jù)通信的時(shí)候儲(chǔ)存在工控機(jī)的磁盤中。在配變集中器內(nèi)設(shè)置電能表模塊便于對每一相的總電量進(jìn)行計(jì)量和統(tǒng)計(jì)分析，以作為用電治理部門考核線損和平衡3

點(diǎn)擊復(fù)制文檔內(nèi)容

合同協(xié)議相關(guān)推薦

專業(yè)論文信息檢索方法(參考版)

【摘要】第一篇：專業(yè)論文信息檢索方法專業(yè)論文信息檢索方法基于Deform-3D的身管徑向鍛造工藝數(shù)值模擬研究與應(yīng)用一、檢索文獻(xiàn) 1、采用中國知網(wǎng)（）網(wǎng)站進(jìn)行檢索，進(jìn)入頁面后點(diǎn)擊“文獻(xiàn)檢索”，彈出...

2024-10-21 05:20

信息檢索論文(參考版)

【摘要】第一篇：信息檢索論文信息檢索實(shí)驗(yàn)報(bào)告題目：現(xiàn)代會(huì)計(jì)發(fā)展趨勢分析學(xué)院：班級(jí)：學(xué)號(hào)：姓名：成績：遼寧工程技術(shù)大學(xué)基礎(chǔ)教學(xué)部現(xiàn)代會(huì)計(jì)發(fā)展方向分析摘要：綜合考慮我國各級(jí)會(huì)計(jì)人員的主...

2024-10-28 21:22

信息檢索論文(參考版)

【摘要】第一篇：信息檢索論文居民用電遠(yuǎn)程抄表系統(tǒng) 長期以來，供電企業(yè)電能數(shù)據(jù)的抄算都是基于電能表的手工作業(yè)方式，即每月定期派人到各用戶那里抄錄電能表的用電數(shù)據(jù)作為電費(fèi)計(jì)算和收繳的依據(jù)。隨著電力負(fù)荷的急劇...

2024-10-21 06:59

信息檢索論文(參考版)

【摘要】第一篇：信息檢索論文關(guān)于數(shù)字化學(xué)習(xí)資源利用的思考人資1W學(xué)號(hào)：10213103 姓名：陳磊班級(jí)：10摘要：隨著教育信息化工程的整體推進(jìn)，要求數(shù)字化學(xué)習(xí)資源的建設(shè)也要同步地向前發(fā)展。正確認(rèn)識(shí)數(shù)...

2024-11-04 00:19

現(xiàn)代信息檢索論文(參考版)

【摘要】第一篇：現(xiàn)代信息檢索論文期末課程論文論文標(biāo)題：課程名稱：信息檢索技術(shù)課程編號(hào)：學(xué)生姓名：尹江津?qū)W生學(xué)號(hào)：所在學(xué)院：計(jì)算機(jī)科學(xué)與工程學(xué)院學(xué)習(xí)專業(yè)：計(jì)算機(jī)科學(xué)與技術(shù)課程教師：文本分類及相關(guān)技術(shù)...

2024-10-21 12:21

信息檢索技術(shù)論文(參考版)

【摘要】第一篇：信息檢索技術(shù)論文近年來，計(jì)算機(jī)技術(shù)、語言學(xué)以及人工智能技術(shù)的發(fā)展促進(jìn)了整個(gè)信息檢索技術(shù)領(lǐng)域的發(fā)展。今天小編要給大家介紹的便是信息檢索技術(shù)論文，歡迎閱讀！信息檢索技術(shù)論文 [摘要]通過...

2024-10-21 06:35

網(wǎng)絡(luò)信息檢索論文(參考版)

【摘要】第一篇：網(wǎng)絡(luò)信息檢索論文網(wǎng)絡(luò)時(shí)代新特征 ——讀《理解媒介：論人的延伸》有感由于沒讀《世界是平的》，所以談?wù)勛x《理解媒介：論人的延伸》對網(wǎng)絡(luò)時(shí)代新特征的理解。加拿大傳播學(xué)巨匠麥克盧漢的著作《理...

2024-10-21 12:39

信息檢索期末論文(參考版)

【摘要】第一篇：信息檢索期末論文在研究“氧化鋅半導(dǎo)體薄膜的制備及表征”課題中，信息檢索的應(yīng)用首先當(dāng)我們拿到課題“氧化鋅半導(dǎo)體薄膜的制備及表征”課題之后，我們馬上需要做的是查找相關(guān)的文獻(xiàn)，獲取相關(guān)的...

2024-10-21 06:55

信息檢索論文綜述(參考版)

【摘要】第一篇：信息檢索論文綜述垃圾滲濾液處理技術(shù) 研究進(jìn)展班級(jí)：06級(jí)環(huán)境工程3班學(xué)號(hào)：2006650703 姓名：宋美虹指導(dǎo)老師：石露垃圾滲濾液處理技術(shù)研究進(jìn)展摘要：近年來城市垃圾...

2024-10-21 06:45

信息檢索課程論文(參考版)

【摘要】第一篇：信息檢索課程論文論大學(xué)生如何提高信息素養(yǎng) 摘要：信息素養(yǎng)要求大學(xué)生具備檢索、論文評(píng)價(jià)和有效使用所需信息的能力。大學(xué)生信息素養(yǎng)由信息意識(shí)與信息能力構(gòu)成。大學(xué)期間，學(xué)校應(yīng)通過學(xué)校教育、社會(huì)環(huán)...

2024-10-21 06:49

信息檢索(會(huì)計(jì)專業(yè))(參考版)

【摘要】第一篇：信息檢索(會(huì)計(jì)專業(yè)) 班級(jí) 姓名學(xué)號(hào) 一檢索課題概況（一）檢索課題名稱（中英文）（說明：檢索課題名稱結(jié)合自己專業(yè)自擬）企業(yè)財(cái)務(wù)內(nèi)部控制機(jī)制探析 Theenterprisei...

2024-10-21 07:13

文獻(xiàn)信息檢索論文(參考版)

【摘要】文獻(xiàn)信息檢索論文數(shù)字化圖書館與文獻(xiàn)信息檢索摘要:數(shù)字圖書館的研究與建設(shè)涉及多方面內(nèi)容,其中文獻(xiàn)信息檢索技術(shù)是數(shù)字圖書館建設(shè)發(fā)展中一個(gè)不可或缺的重要方面?！　”疚闹饕懻摿藬?shù)字圖書館的興起和特征,及在數(shù)字圖書館條件下對文獻(xiàn)檢索方式、方法和內(nèi)容上的變革影響,分析了在此條件下圖書館文獻(xiàn)服務(wù)重點(diǎn)的轉(zhuǎn)移,提出了數(shù)字環(huán)境下優(yōu)化圖書館信息服務(wù)的策略,以求得對當(dāng)前圖書館數(shù)字化進(jìn)程有所幫助。

2024-08-31 16:54

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

專業(yè)論文信息檢索方法(參考版)

專業(yè)論文信息檢索方法(參考版)

信息檢索論文(參考版)

信息檢索論文(參考版)

信息檢索論文(參考版)

現(xiàn)代信息檢索論文(參考版)

信息檢索技術(shù)論文(參考版)

網(wǎng)絡(luò)信息檢索論文(參考版)

信息檢索期末論文(參考版)

信息檢索論文綜述(參考版)

信息檢索課程論文(參考版)

信息檢索(會(huì)計(jì)專業(yè))(參考版)

文獻(xiàn)信息檢索論文(參考版)

信息檢索論文[五篇](參考版)

關(guān)于網(wǎng)絡(luò)信息檢索論文(參考版)

信息存儲(chǔ)與檢索論文(參考版)

專業(yè)論文信息檢索方法-閱讀頁

專業(yè)論文信息檢索方法(文件)

專業(yè)論文信息檢索方法-全文預(yù)覽

專業(yè)論文信息檢索方法-預(yù)覽頁

專業(yè)論文信息檢索方法-免費(fèi)閱讀