正文內(nèi)容

大學(xué)本科生畢業(yè)論文-基于paradise平臺論文檢索系統(tǒng)(文件)

2025-06-17 16:40 上一頁面

下一頁面

　

【正文】求庫，來提高搜索引擎的中相似的請求的處理速度。 Abstract: Large web search engines have to answer thousands of queries per second with interactive response times. Due to the sizes of the data sets involved, often in the range of multiple terabytes, a single query may require the processing of hundreds of megabytes or more of index data. To keep up with this immense workload, large search engines employ clusters of hundreds or thousands of machines, and a number of techniques such as catching, index pression, and index and query pruning are used to improve scalability. In particular, twolevel caching techniques cache results of repeated identical queries at the frontend, while index data for frequently used query terms are cached in each node at a lower level. We propose and evaluate a threelevel caching scheme that adds an intermediate level of caching for additional performance gains. This intermediate level attempts to exploit frequently occurring pairs of terms by caching intersections or projections of the corresponding inverted lists. We propose and study several offline and online algorithms for the resulting weighted caching problem, which turns out to be surprisingly rich in structure. Our experimental evaluation based on a large web crawl and real search engine query log shows significant performance gains for the best schemes, both in isolation and in bination with the other caching levels. We also observe that a careful selection of cache admission and eviction policies is crucial for best overall performance. 摘要部分，先說了搜索引擎的負(fù)載很重的概況；然后介紹現(xiàn) 有的兩級catc h 有一定的缺點(diǎn)，而作者完成了一個(gè)三級緩存，在原有的緩存加入了一個(gè)中間層；最后說本文用到了一些算法，并且最終實(shí)驗(yàn)結(jié) 果的性能也很好。平均每個(gè)論文有個(gè) 95 評論句子，每個(gè) 論文在被另外一篇論文引用時(shí) ，平均約被評論次根據(jù)上面的比率，可以看出，如果我們最終顯示在界面上的評論個(gè)數(shù)需要是 5 個(gè)，那么一篇論文，它被 1 到 2 篇論文引用時(shí) ，就會獲得足夠的評論集。這里，我們利用了前面獲得的文件，里面存有一篇論文的摘要，獲得摘要段落之后，對其利用摘要算法，可以獲取較好的效果。因為 Paradise 主要是針對網(wǎng) 頁搜索的，所以稱這個(gè)域為 Url，實(shí)際上應(yīng)該叫 DocumentID更確切一點(diǎn)。其中， url 域及其重要，是必須有的一個(gè)域，而且必須名為 Url。 pWriteraddDocument(document)。 shared_ptrFieldData field_ID_data(new FieldData(PDFFunction::Int2Str(pContentgetID())))。 shared_ptrFieldData field_content_data(new FieldData(pContentgetContentToken()))。 (2) 重寫一個(gè) Content 類，里面存有所需要建立索引的 document 的內(nèi)容，由上面的 getContent 類返回。amp。 Timer t。 PDFParser parser。 void main(){ Analyzer* analyzer = new NaiveAnalyzer()。這個(gè)地方需要注意的就是與 index部分有一定的結(jié) 合，會在后面提到。（ 2） index是索引模塊，用于將需要檢索的部分建立倒排索引。通過這段內(nèi)容，我們可以了解到 paradise 使用的基本過程，最終我們會發(fā)現(xiàn) ，如果想搭建其他方向的搜索引擎，使用 paradise 也是非常方便的。之后，選擇其中得分最高的k 個(gè)句子，組合在一起，就獲得了原文基于影響的概括了。整個(gè)流程如 [ 圖表 3]，需要用到 [ 圖表 2]中的前三部算法獲得的評論列表。那么，對于每一個(gè)句子 s，我們在進(jìn) 行上面的算法時(shí) ，需要進(jìn) 行如下一步 ( p(w | I ) log( p(w | s p(w | I ) log( p(w | I ))) w V 這就需要對這 4 億個(gè) 單詞進(jìn) 行遍歷一遍，并且分別計(jì) 算括號中的那一步。我們仌然假設(shè) u為 w 的 n倍，則 (2)式可以看成 pC(w | d ) p(w | C) * n ，可見， n 越大時(shí) ，表示這個(gè) 單詞 w 與 C 的關(guān)系越大，而 n 小于 1 n n 時(shí) ，則與論文本身關(guān)系較大。W 等于 1時(shí) ，則表示二者一樣，各占 1/2。建模算法首先，為仸何一個(gè)句子打分的公式 Score(s)如下： Score(s) D( I || s ) p(w | I )log( p(w | s )) p(w | I )log( p(w | I )) w V w V 仍信息理論的觀點(diǎn)，其中 D( I || s ) 即為 KLdivergence，可以被解釋為通過句子 s來表示基于影響的段落，需要仍文章中刪除的信息量。最終將影響力最大的幾個(gè)句子合在一起，就形成了基于影響的概括。我們在提取數(shù)據(jù)的同時(shí) ，會獲得每一篇文章的 citation信息，代表這篇文章被引用的次數(shù)，一般，一個(gè) 較好的文章，被引用的次數(shù)也應(yīng) 當(dāng)比較多，因此，對于每一個(gè) 評價(jià)，根據(jù)它所在文章的被引用次數(shù) 進(jìn) 行排序，可以獲得較為專業(yè) ，也較為合理的結(jié) 果。最終，得到對 A 進(jìn) 行評論的候選句子集 {e1,e2,e3...}，這里面可能會有一些評價(jià) 來自同一篇論文。一般有以下幾種情況： (1) Bi中的句子出現(xiàn) 了 A的論文名 (2) Bi中的句子出現(xiàn) 了 A的作者名 (3) 在 Bi 的 reference 列表中，如果 A 出現(xiàn) 在第 k 個(gè)位置，那么通常在文章中會利用 [k]來對 A進(jìn) 行引用。 ? 第 3 章生成評論集通過上面的內(nèi)容之后，我們獲得了所有基本的信息，其中，最重要的，獲得了 tofrom 表，該表的 key 是一篇論文 A 的 ID， value 是引用 A 的所有論文 ID 的集合。 ? ? 輕便靈活（ Portable）：它可以運(yùn)行于幾乎所有的 UNIX 和 Linux 系統(tǒng) 及其變種系統(tǒng) 、 Windows 操作系統(tǒng) 以及多種嵌入式實(shí)時(shí) 操作系統(tǒng) 之下。是對整個(gè) 論文的引用關(guān)系圖進(jìn) 行解析獲得的，仍上面的元數(shù)據(jù)中，我們可以獲得每個(gè) 論文所引用的論文的名稱，這樣，我們可以通過這些名稱，來獲得這個(gè) 論文所引用的所有論文的 ID 號，并且存儲到數(shù)據(jù) 庫中。對于其他的信息，這里選擇存儲在 berkeleyD B 里面。這樣，文章中所有匹配上面正則表達(dá)式的字符串，其中的作者信息（即上面括號中的內(nèi)容），都會存在 authors 這個(gè)容器里面還需要注意的一點(diǎn)就是，由于網(wǎng) 頁的不規(guī) 整性，所以要排除一些錯(cuò)誤的情況。CFID=23 904299amp。以提取作者信息為例： a href=?id=81100472691amp。數(shù)據(jù)抓取的過程已經(jīng) 確定抓取數(shù)據(jù)的大體方法了，下面就要開始正式的抓取數(shù)據(jù)了。因為我們的實(shí)驗(yàn) 所需要的數(shù)據(jù)最好是在一個(gè) 領(lǐng) 域里面的一個(gè)方向的論文，并且需要引用關(guān)系較緊密的，以便于后續(xù) 的工作，因此，這里采用會議的文章作為種子，對于每一篇文章遞歸三層。于是，我們想出了一個(gè) 簡單的辦法。我們的目標(biāo) 是通過獲得每篇文章所引用過的文章，建立一個(gè)映射表，然后將映射表倒置過來，仍而獲得每篇文章被哪些文章引用過。簡單來說，我們這個(gè)系統(tǒng) 的意義，就是通過數(shù)據(jù)挖掘的方法，獲得一些直接仍原論文很難發(fā)現(xiàn) 的信息，并且結(jié) 合 paradise 系統(tǒng) ，以搜索引擎的方式呈現(xiàn)出來，便于大家檢索查找。一般來說，作者如果想仍自己的角度歸納本文的大體內(nèi)容，通過閱讀摘要，我們可以看到作者寫這篇文章大體做了什么。而在讀完一篇論文之后，我們能獲得什么信息呢？主要有以下幾種： (1) 這篇文章做了什么事情，這可以仍摘要中獲得。 PARADISE 由預(yù)處理，簡歷索引，檢索，前臺四部分組成。最終，為了便于使用者觀看，還需要對這些句子進(jìn) 行一些整理，進(jìn) 行排序、整理成一個(gè)段落出來。之所以選擇仍這上面抓取，是因為我們不僅需要論文的 pdf 文檔，還需要仍中自動提取摘要、引用等信息，而這本身就應(yīng)該是一個(gè)挺復(fù) 雜的算法了，而且不是我們工作的目的，而上述網(wǎng)站已經(jīng) 人工的將論文的摘要、引用信息提取了出來，并且對于每一個(gè)引用還有相應(yīng) 的鏈接，因此會節(jié) 省我們抓取數(shù)據(jù)所要花費(fèi) 的工作量。在 [3]3(Qiaozhu Mei, ChengXiang Zhai)中，作者利用 KLdivergence算法建立了一個(gè)模型，生成了一篇論文基于影響的概括，但是它并沒有強(qiáng)調(diào)評論的重要性（這里的評論，是指別的作者對它引用的一篇文章的評論），它只講評論當(dāng)成一個(gè)中間狀態(tài) ，當(dāng)成一個(gè)求得基于影響的概括的手段。這就像我們準(zhǔn) 備去一個(gè)地方去旅游，不僅需要該景點(diǎn)本身的介紹（有點(diǎn) 類似于摘要），往往更想知道去過這個(gè)地方的人都是如何評價(jià)這些地方的。領(lǐng) 域的最主要論文，以及一些較權(quán) 威的作者，幫助讀者了解相關(guān)知識。學(xué) 術(shù)檢索，絕不簡簡單單的檢索出所要查找的論文，這樣就和普通的通用搜索引擎如 google 等一樣了。本科生畢業(yè)論文題目 :基于 PARADISE 平臺論文檢索系統(tǒng) Literature Search Design based on PARADISE 姓名：李峰 0 號： 0 系：信息科學(xué)技術(shù) 學(xué)院專業(yè) ：計(jì) 算機(jī)科學(xué)與技術(shù) 系指導(dǎo) 教師：閆宏飛副教授二〇一五年四月二十日摘要：本文基于天網(wǎng) 實(shí)驗(yàn) 室的 Platform for Applying,

點(diǎn)擊復(fù)制文檔內(nèi)容

研究報(bào)告相關(guān)推薦

基于java的餐飲管理系統(tǒng)(本科生畢業(yè)論文)-資料下載頁

【摘要】I本科生畢業(yè)論文(設(shè)計(jì))題目：基于JAVA的餐飲管理系統(tǒng)II畢業(yè)論文（設(shè)計(jì)）原創(chuàng)性聲明本人所呈交的畢業(yè)論文（設(shè)計(jì)）是我在導(dǎo)師的指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知，除文中已經(jīng)注明引用的內(nèi)容外，本論文（設(shè)計(jì)）不包含其他個(gè)人已經(jīng)發(fā)表或撰寫過的研究成果。

2025-07-01 16:48

南昌大學(xué)本科生畢業(yè)設(shè)計(jì)(論文)-資料下載頁

【摘要】南昌大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）工作管理辦法畢業(yè)設(shè)計(jì)（論文）是教學(xué)計(jì)劃中最后一個(gè)重要的實(shí)踐教學(xué)環(huán)節(jié)，是提高本科生知識、能力、素質(zhì)的關(guān)鍵步驟，是學(xué)生畢業(yè)資格、學(xué)士學(xué)位認(rèn)定的一個(gè)重要依據(jù)，是高等教育質(zhì)量的重要評價(jià)內(nèi)容。做好畢業(yè)設(shè)計(jì)（論文）工作，對全面提高本科教學(xué)質(zhì)量具有重要的意義。根據(jù)《教育部辦公廳關(guān)于加強(qiáng)普通高等學(xué)校畢業(yè)設(shè)

2025-03-04 20:10

南通大學(xué)本科生畢業(yè)設(shè)計(jì)(論文)開題-資料下載頁

【摘要】南通大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）開題報(bào)告學(xué)生姓名吾靜學(xué)號0812002150專業(yè)電氣工程及其自動化課題名稱低成本輪式驅(qū)動機(jī)器人控制器設(shè)計(jì)研究閱讀文獻(xiàn)情況國內(nèi)文獻(xiàn)11篇開題日期國外文獻(xiàn)3篇開題地點(diǎn)南通大學(xué)主校區(qū)一文獻(xiàn)綜述與調(diào)研報(bào)告：（闡述課題研究的現(xiàn)狀及發(fā)展趨勢，本課題研究的意義和價(jià)

2025-08-05 03:40

浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)論文-資料下載頁

【摘要】浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)論文目錄1浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）工作程序 12浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）選題一覽表 23浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）撰寫格式與規(guī)范 24浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）封面 115浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）任務(wù)書 126浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）文獻(xiàn)綜述的基本要求 14

2025-06-28 04:47

哈爾濱工程大學(xué)本科生畢業(yè)設(shè)計(jì)論文-資料下載頁

【摘要】哈爾濱工程大學(xué)本科生畢業(yè)設(shè)計(jì)（論文）任務(wù)書題目：指導(dǎo)教師：職稱

2025-07-27 07:13

江蘇科技大學(xué)本科生畢業(yè)論文(設(shè)計(jì))格式-資料下載頁

【摘要】江蘇科技大學(xué)××××學(xué)院畢業(yè)論文（設(shè)計(jì)）中文摘要（頁眉宋體五號）附16：畢業(yè)論文（設(shè)計(jì)）中文摘要格式（空一行）××××××××××（題目黑體三號居中）摘要（宋體加粗四號居中）（具體內(nèi)容宋體小四號）…………………………………………………

2025-08-05 09:08

武漢大學(xué)本科生畢業(yè)論文(設(shè)計(jì))書寫印制規(guī)范-資料下載頁

【摘要】第一篇：武漢大學(xué)本科生畢業(yè)論文(設(shè)計(jì))書寫印制規(guī)范武漢大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）書寫印制規(guī)范畢業(yè)論文寫作是反映學(xué)生畢業(yè)論文工作成效的重要途經(jīng)，是考核學(xué)生掌握和運(yùn)用所學(xué)基礎(chǔ)理論、基本知識、基本技...

2024-10-21 11:16

陜西師范大學(xué)本科生畢業(yè)論文寫作規(guī)范-資料下載頁

【摘要】第一篇：陜西師范大學(xué)本科生畢業(yè)論文寫作規(guī)范陜西師范大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）寫作技術(shù)規(guī)范 2006年12月21日陜西師范大學(xué) 本科生畢業(yè)論文（設(shè)計(jì)）寫作技術(shù)規(guī)范一、畢業(yè)論文（設(shè)計(jì)）主要...

2024-11-16 02:14

浙江大學(xué)本科生畢業(yè)論文(設(shè)計(jì))工作實(shí)施意見-資料下載頁

【摘要】第一篇：浙江大學(xué)本科生畢業(yè)論文(設(shè)計(jì))工作實(shí)施意見浙江大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）工作實(shí)施意見編輯：xtt10207日期：2008-12-2208:08 （浙大本發(fā)〔2008〕31號）畢業(yè)...

2024-11-18 22:04

山東科技大學(xué)本科生畢業(yè)論文(設(shè)計(jì))格式規(guī)范)-資料下載頁

【摘要】編號（學(xué)號）：山東科技大學(xué)本科學(xué)生畢業(yè)論文（設(shè)計(jì)）手冊

2025-03-04 11:16

吉林大學(xué)本科生畢業(yè)論文格式要求費(fèi)下載-資料下載頁

【摘要】吉林大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）撰寫要求與書寫格式本科生畢業(yè)論文（設(shè)計(jì)）是本科學(xué)習(xí)期間獨(dú)立分析問題、解決問題及初步進(jìn)行科學(xué)研究能力的綜合體現(xiàn)也是創(chuàng)新意識、創(chuàng)新能力和獲取新知識能力的綜合檢驗(yàn)是學(xué)校授予學(xué)位的重要依據(jù)為了規(guī)范畢業(yè)論文（設(shè)計(jì)）的書寫格式提高撰寫質(zhì)量制定撰寫要求及書寫格式一、畢業(yè)論文（設(shè)計(jì)）內(nèi)容畢業(yè)論文（設(shè)計(jì)）包含下列內(nèi)容

2025-08-04 14:55

湖南師范大學(xué)本科生畢業(yè)論文設(shè)計(jì)撰寫規(guī)范-資料下載頁

【摘要】湖南師范大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）撰寫規(guī)范撰寫畢業(yè)論文（設(shè)計(jì)）是培養(yǎng)學(xué)生綜合運(yùn)用本學(xué)科的基本知識和基本技能，分析、解決實(shí)際問題和某些理論問題，培養(yǎng)學(xué)生科學(xué)研究、創(chuàng)新意識、創(chuàng)新能力，提高學(xué)生素質(zhì)的重要途徑，是高校教學(xué)的重要實(shí)踐環(huán)節(jié)。為了統(tǒng)一和規(guī)范我校本科生畢業(yè)論文（設(shè)計(jì)）的寫作，保證我校本科生畢業(yè)論文（設(shè)計(jì)）的質(zhì)量，根據(jù)《中華人民共和國國家標(biāo)準(zhǔn)科學(xué)技術(shù)報(bào)告、學(xué)位論文和

2025-08-26 12:24

吉林大學(xué)本科生畢業(yè)論文撰寫要求與書寫格式-資料下載頁

【摘要】附件2：吉林大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）撰寫要求與書寫格式本科生畢業(yè)論文（設(shè)計(jì)）是本科學(xué)習(xí)期間獨(dú)立分析問題、解決問題及初步進(jìn)行科學(xué)研究能力的綜合體現(xiàn)，也是創(chuàng)新意識、創(chuàng)新能力和獲取新知識能力的綜合檢驗(yàn)，是學(xué)校授予學(xué)位的重要依據(jù)。為了規(guī)范畢業(yè)論文（設(shè)計(jì)）的書寫格式，提高撰寫質(zhì)量，制定撰寫要求及書寫格式。一、畢業(yè)論文（設(shè)計(jì)）內(nèi)容畢業(yè)論文（設(shè)計(jì)）包含下列內(nèi)容，其序

2025-08-04 14:44

安徽師范大學(xué)本科生畢業(yè)論文(設(shè)計(jì))撰寫格式示例-資料下載頁

【摘要】附件1：安徽師范大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）撰寫格式示例論文題目(居中、黑體、三號)（空1行）姓名，學(xué)院(居中、宋體、小四號)（空1行）摘要（頂格、黑體、四號、“摘”“要”之間空2個(gè)字符）：隨著XXXXXXXXXXXXXXXXXXXXXXXX(摘要內(nèi)容為仿宋、小4號)關(guān)鍵詞（頂格、黑體、四號）：XXXXX；XXXXX；XXXXX（仿宋，小4號）（空1行）XXXXX

2025-08-04 15:42

中山大學(xué)本科生畢業(yè)論文的有關(guān)規(guī)定-資料下載頁

【摘要】中山大學(xué)本科生畢業(yè)論文的有關(guān)規(guī)定本科生畢業(yè)論文（含畢業(yè)設(shè)計(jì)，下同）是本科教學(xué)中的重要環(huán)節(jié)，是對學(xué)生提高科研創(chuàng)新能力的重要訓(xùn)練，是對學(xué)生知識的理解和綜合運(yùn)用能力的重要考察。為規(guī)范本科生畢業(yè)論文的工作，進(jìn)一步提高教育質(zhì)量，特制訂本科生畢業(yè)論文的有關(guān)規(guī)定。第一章畢業(yè)論文的工作程序第一條畢業(yè)論文屬必修課，一般安排在本科階段最后一學(xué)年進(jìn)行。畢業(yè)論文工作包括寫作指導(dǎo)、選題、安排指

2025-07-24 16:10

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

大學(xué)本科生畢業(yè)論文-基于paradise平臺論文檢索系統(tǒng)(文件)

基于java的餐飲管理系統(tǒng)(本科生畢業(yè)論文)-資料下載頁

南昌大學(xué)本科生畢業(yè)設(shè)計(jì)(論文)-資料下載頁

南通大學(xué)本科生畢業(yè)設(shè)計(jì)(論文)開題-資料下載頁

浙江農(nóng)林大學(xué)本科生畢業(yè)設(shè)計(jì)論文-資料下載頁

哈爾濱工程大學(xué)本科生畢業(yè)設(shè)計(jì)論文-資料下載頁

江蘇科技大學(xué)本科生畢業(yè)論文(設(shè)計(jì))格式-資料下載頁

武漢大學(xué)本科生畢業(yè)論文(設(shè)計(jì))書寫印制規(guī)范-資料下載頁

陜西師范大學(xué)本科生畢業(yè)論文寫作規(guī)范-資料下載頁

浙江大學(xué)本科生畢業(yè)論文(設(shè)計(jì))工作實(shí)施意見-資料下載頁

山東科技大學(xué)本科生畢業(yè)論文(設(shè)計(jì))格式規(guī)范)-資料下載頁

吉林大學(xué)本科生畢業(yè)論文格式要求費(fèi)下載-資料下載頁

湖南師范大學(xué)本科生畢業(yè)論文設(shè)計(jì)撰寫規(guī)范-資料下載頁

吉林大學(xué)本科生畢業(yè)論文撰寫要求與書寫格式-資料下載頁

安徽師范大學(xué)本科生畢業(yè)論文(設(shè)計(jì))撰寫格式示例-資料下載頁

中山大學(xué)本科生畢業(yè)論文的有關(guān)規(guī)定-資料下載頁

大學(xué)本科生畢業(yè)論文-基于paradise平臺論文檢索系統(tǒng)-閱讀頁

大學(xué)本科生畢業(yè)論文-基于paradise平臺論文檢索系統(tǒng)(文件)

大學(xué)本科生畢業(yè)論文-基于paradise平臺論文檢索系統(tǒng)-全文預(yù)覽

大學(xué)本科生畢業(yè)論文-基于paradise平臺論文檢索系統(tǒng)-預(yù)覽頁

大學(xué)本科生畢業(yè)論文-基于paradise平臺論文檢索系統(tǒng)-免費(fèi)閱讀