正文內(nèi)容

大學(xué)本科生畢業(yè)論文-基于paradise平臺論文檢索系統(tǒng)(編輯修改稿)

2025-07-02 16:40 本頁面

　

【文章內(nèi)容簡介】 ) 利用 split 函數(shù)，將結(jié) 果存入 list 里面 liststring authors。 boost::regex_split(std::back_inserter(authors), content, ePaperAuthors)。這樣，文章中所有匹配上面正則表達(dá)式的字符串，其中的作者信息（即上面括號中的內(nèi)容），都會存在 authors 這個(gè)容器里面還需要注意的一點(diǎn)就是，由于網(wǎng) 頁的不規(guī) 整性，所以要排除一些錯(cuò)誤的情況。還有一些文章，確實(shí) 沒有摘要、引用或者其他信息（這些文章多出現(xiàn) 在引用鏈的頂層，主要是一些書籍等參考資料，所以也比較正常），遇到這些情況我們就不抓取下來了。數(shù)據(jù)的存儲及解析在將數(shù)據(jù)仍網(wǎng) 頁下載下來之后，需要存儲起來。首先，對于 pdf 的格式，只能存在文件系統(tǒng) 里，按正常的方式存儲。對于其他的信息，這里選擇存儲在 berkeleyD B 里面。 berkeleyDB 是一種輕量級的數(shù)據(jù) 庫， Mysql 等數(shù)據(jù) 庫底層就是利用berkel eyDB 來完成的。它的有點(diǎn)是可移動性，不用想 Mysql 那樣搭建朋務(wù) 器，而且讀取數(shù) 據(jù) 時(shí)較快。對于每一篇文章的基本信息 metadata，按照【表格 1】中的形式存入 berkeleyDB中：表格 1 Key int64_t 的一個(gè)整數(shù) 字符流 ,存儲元數(shù)據(jù)信息，按如下格式： **************************************************name **************************************************source Value **************************************************abstract **************************************************citationCount **************************************************authors **************************************************references **************************************************referenceName **************************************************url 獲得這些基本信息之后，我們還要根據(jù) 這些元信息，陸續(xù) 建立一些berkeley DB 文件，用于存儲其他信息，如 [ 表格 2]：表格 2 文件名 Key Value int64_t 的整數(shù)，論文 ID 這篇論文的全部文本內(nèi)容 int64_t 的整數(shù)，論文 ID 用于存儲一篇論文所引用的所有文章 int64_t 的整數(shù)，論文 ID 用于存儲一篇論文被哪些文章所引用 int64_t 的整數(shù)，論文 ID 存儲最終要顯示在頁面上的文章的評價(jià) int64_t 的整數(shù)，論文 ID 存儲最終要顯示在頁面上的基于影響的文章的概括其中是通過將 pdf 格式轉(zhuǎn) 化為 txt 之后獲得的。是對整個(gè) 論文的引用關(guān)系圖進(jìn) 行解析獲得的，仍上面的元數(shù)據(jù)中，我們可以獲得每個(gè) 論文所引用的論文的名稱，這樣，我們可以通過這些名稱，來獲得這個(gè) 論文所引用的所有論文的 ID 號，并且存儲到數(shù)據(jù) 庫中。獲得之后，對其進(jìn) 行倒置，就可以獲得的內(nèi)容這里之所以選擇 BerkeleyDB進(jìn) 行存儲，是因為它有以下這些優(yōu) 點(diǎn)： ? 嵌入式（ Embedded）：它直接鏈接到應(yīng) 用程序中，與應(yīng) 用程序運(yùn)行于同樣的地址空間中，因此，無論是在網(wǎng) 絡(luò) 上不同計(jì) 算機(jī)之間還是在同一臺計(jì) 算機(jī) 的不同進(jìn) 程之間，數(shù)據(jù) 庫操作并不要求進(jìn) 程間通訊。 ??? Berkeley DB為多種編程語言提供了 API 接口，其中包括 C、 C++、Java、 Perl、 Tcl、 Pyt hon和 PHP，所有的數(shù)據(jù) 庫操作都在程序庫內(nèi)部發(fā) 生。對于我們這個(gè)系統(tǒng) ，后臺程序是由 c++完成，而前臺程序是由python完成，他們都會共同訪問一些文件，通過存儲在 BerkeleyDB進(jìn)行存儲，就解決了不同語言之間兼容的問題。 ? ? 輕便靈活（ Portable）：它可以運(yùn)行于幾乎所有的 UNIX 和 Linux 系統(tǒng) 及其變種系統(tǒng) 、 Windows 操作系統(tǒng) 以及多種嵌入式實(shí)時(shí) 操作系統(tǒng) 之下。它并不需要搭建一個(gè)數(shù)據(jù) 庫朋務(wù) 器，以用戶、朋務(wù) 器形式訪問數(shù)據(jù) 庫，而是以函數(shù) ??調(diào) 用的形式。一旦 Berkeley DB 被鏈接到應(yīng) 用程序中，終端用戶一般根本感覺不到有一個(gè)數(shù)據(jù) 庫系統(tǒng) 存在。這樣提高了我們的系統(tǒng) 的實(shí) 用性，當(dāng)用戶需要自己搭建一個(gè)我們的論文系統(tǒng)時(shí) ，不用再去搭建數(shù)據(jù) 庫朋務(wù) 器，進(jìn) 行各種繁瑣的配置。 ? 第 3 章生成評論集通過上面的內(nèi)容之后，我們獲得了所有基本的信息，其中，最重要的，獲得了 tofrom 表，該表的 key 是一篇論文 A 的 ID， value 是引用 A 的所有論文 ID 的集合。下面我們就要結(jié) 合前面獲得的數(shù)據(jù)，包括論文的文本、元數(shù)據(jù)，來獲得一篇論文的評論集。獲得評價(jià)的候選句子集通過 tofrom表，我們可以獲得一個(gè)集合 {B1,B2,B3...}，其中 Bi對 A進(jìn) 行了引用。我們相信，如果 Bi對 A進(jìn) 行了引用，那么 Bi中可能會有一些句子對 A進(jìn) 行了評價(jià)。一般有以下幾種情況： (1) Bi中的句子出現(xiàn) 了 A的論文名 (2) Bi中的句子出現(xiàn) 了 A的作者名 (3) 在 Bi 的 reference 列表中，如果 A 出現(xiàn) 在第 k 個(gè)位置，那么通常在文章中會利用 [k]來對 A進(jìn) 行引用。 (4) .對于 (3)的情況，有時(shí) 候并不只是對 k 進(jìn) 行引用，可能文章中的一句話代表的是好幾篇文章的工作概括，因此會出現(xiàn) “[i,k,j]”這種類型的符號來對 A進(jìn) 行引用，而且出現(xiàn) 的概率很高。 (5) (如果 Bi 中的某句話對 A 進(jìn) 行了評論，那么通常它的前一句話和后一句話也會出現(xiàn)評價(jià)的信息通過上面的 5點(diǎn)，我們就可以獲得了 Bi中對 A進(jìn) 行評價(jià)的句子，仍而獲得了一個(gè)候選句子集，里面的每一句話都不同程度的對 A進(jìn) 行了評價(jià)。圖表 2 如 [ 圖表 2]所示流程，具體實(shí)現(xiàn) 的時(shí) 候，先要將 Bi按句子進(jìn) 行劃分為一個(gè)句子序列 {Bis1, Bis2,Bis3.....}，然后遍歷這個(gè)句子序列，對于每一個(gè)句子，按照上面的前四條規(guī)則進(jìn) 行評判，如果滿足其中仸意一條，則這個(gè)句子是候選句子集合中的一個(gè)，并將其前后兩個(gè)句子也合到一起，添加的候選句子集合中。最終，得到對 A 進(jìn) 行評論的候選句子集 {e1,e2,e3...}，這里面可能會有一些評價(jià) 來自同一篇論文。獲得評論段落獲得了候選句子集之后，我們需要對其進(jìn) 行適當(dāng)?shù)呐判?，仍?選出較好的幾個(gè) 句子，最終顯示在頁面上。由于不同的人，對這篇論文的評價(jià)可能也不太一樣，因此，就不能簡單的按照這些評價(jià)句子與原文的相似度來進(jìn) 行打分排序了，因為這樣會造成和原文觀點(diǎn)相近的評分較高，不是我們希望獲得的結(jié)果。實(shí)際上，有時(shí) 候越是和原文的觀點(diǎn)不同，反而可能越重要，它可能是對這篇文章的批判，也有可能是原文的作者并在寫 paper 是并沒有發(fā)現(xiàn) 的一些問題，這對我們尋找后續(xù) 工作時(shí) 可能會非常重要。我們在提取數(shù)據(jù)的同時(shí) ，會獲得每一篇文章的 citation信息，代表這篇文章被引用的次數(shù)，一般，一個(gè) 較好的文章，被引用的次數(shù)也應(yīng) 當(dāng)比較多，因此，對于每一個(gè) 評價(jià)，根據(jù)它所在文章的被引用次數(shù) 進(jìn) 行排序，可以獲得較為專業(yè) ，也較為合理的結(jié) 果。同時(shí) ，需要注意的是，如果一個(gè)篇論文的被引用次數(shù)很高，而且它又有兩段評論原文的句子時(shí) ，那么這兩段會一起出現(xiàn) 在最終的結(jié) 果里，在這里我們就需要對結(jié) 果進(jìn) 行調(diào) 整，保證在權(quán) 重相同的情況下，盡可能選擇盡量不同的文章的評論。第 4 章建立模型并生成基于影響的概括通過獲得了對源論文的評論集合，下面就可以與源論文建立模型來獲得基于影響的概括。所謂基于影響的概括，簡單來說，就是某句話與評論之間的關(guān) 系越緊密，那么這句話的影響力就越大。最終將影響力最大的幾個(gè)句子合在一起，就形成了基于影響的概括。建模之前我們所有的數(shù)據(jù) 在建模之前，我們先來看看我們已經(jīng)獲得了哪些數(shù)據(jù)： (1)所有論文集合 D，以及 D 里所出現(xiàn) 的所有單詞，構(gòu)成一個(gè) 單詞表 V，并且可以統(tǒng) 計(jì) 出每個(gè) 單詞 w 出現(xiàn) 的次數(shù) C(w,D) (2)對于一篇論文 d，將其劃分為多個(gè)句子 {s1, s2, s3……} (3)已經(jīng)獲得了這片論文進(jìn) 行評論的所有句子 {e1, e2, e3……}, 把他們的集合成為 C（ Citation Context）。下面，我們就可以參照 KLdivergence算法 ([3] 3， Qiaozhu Mei and ChengXiang Zhai)，對 d中的句子 s 進(jìn) 行打分。這里的打分，主要是基于詞頻以及相似度來做的。建模算法首先，為仸何一個(gè)句子打分的公式 Score(s)如下： Score(s) D( I || s ) p(w | I )log( p(w | s )) p(w | I )log( p(w | I )) w V w V 仍信息理論的觀點(diǎn)，其中 D( I || s ) 即為 KLdivergence，可以被解釋為通過句子 s來表示基于影響的段落，需要仍文章中刪除的信息量。顯然，其值越小， Score 則越大，它也越能代表文章以及其他文章對它的評價(jià)的意思（因為它只要刪除較少的信息）可以看出，公式中最重要的是求出 p(w | I )和 p(w | s ) (1) p(w | S ) c(w, s) s * p(w | D) | s | s (2) p(w | I ) c(w, d ) C p(w | C) | d | C 對于公式（ 1），其中， c(w, s) 表示一個(gè) 單詞 w 在句子 s 中出現(xiàn) 的次數(shù)， p(w | D) 表示單詞 w 出現(xiàn) 在所有論文空間中出現(xiàn) 的概率， D 為我們的整個(gè) 論文空間。而為 p(w | s) p(w | D) s 平滑參數(shù)。我們假設(shè) s 為 |s|的 n倍，則 (1)式可以看成是 * n ,可 n n 見， s 越大，表示 w與整個(gè) 論文空間的關(guān)系越大，而與這個(gè)句子的關(guān)系則較少。W 等于 1時(shí) ，則表示二者一樣，各占 1/2。我在這里將 s 設(shè) 置為了 1。對于公式 (2)，其中 c(w, d ) 表示一個(gè) 單詞 w 在當(dāng)前要求的這篇論文中出現(xiàn) 的次數(shù)，而 p(w | C) 表示單詞 w在我們?yōu)檫@ 篇

點(diǎn)擊復(fù)制文檔內(nèi)容

研究報(bào)告相關(guān)推薦

東北林業(yè)大學(xué)本科生畢業(yè)論文模板-資料下載頁

【總結(jié)】......畢業(yè)論文用戶評論中產(chǎn)品特征的挖掘方法研究學(xué)生姓名：李焱專業(yè)班級：信息管理與信息系統(tǒng)2011級1班指導(dǎo)教師：王名揚(yáng)副教授學(xué)院：信息與計(jì)算機(jī)工程學(xué)院2015年6

2025-08-02 23:07

基于lbp紋理特征的圖像檢索系統(tǒng)畢業(yè)論文-資料下載頁

【總結(jié)】華僑大學(xué)畢業(yè)設(shè)計(jì)（論文）題目：基于LBP紋理特征的圖像檢索系統(tǒng)院（系）計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院專業(yè)軟件工程屆別2021屆學(xué)號0825121037

2025-02-26 09:54

云南農(nóng)業(yè)大學(xué)本科生畢業(yè)論文撰寫-資料下載頁

【總結(jié)】第一篇：云南農(nóng)業(yè)大學(xué)本科生畢業(yè)論文撰寫科類管理學(xué)編號（學(xué)號）20133122 51陳光標(biāo)慈善事業(yè)與管理學(xué) ChenGuangbiaocharityandmanagement 范博指導(dǎo)教師...

2025-10-12 06:23

2022年大學(xué)本科生畢業(yè)論文評語-資料下載頁

【總結(jié)】此資料由網(wǎng)絡(luò)收集而來，如有侵權(quán)請告知上傳者立即刪除。資料共分享，我們負(fù)責(zé)傳遞知識。最新大學(xué)本科生畢業(yè)論文評語　　對于我們大學(xué)本科生的畢業(yè)論文評語要怎么去寫呢?下面是小編搜集整理的最新大學(xué)本科生...

2025-01-26 00:52

基于顏色特征的圖像檢索系統(tǒng)設(shè)計(jì)畢業(yè)論文-資料下載頁

【總結(jié)】基于顏色特征的圖像檢索系統(tǒng)設(shè)計(jì)畢業(yè)論文目錄摘要 IAbstract II1緒論 1課題背景及涉及問題 1圖像檢索主要應(yīng)用 2研究現(xiàn)狀 2相關(guān)反饋技術(shù) 3性能評價(jià) 32基于顏色的圖像檢索 5RGB顏色空間和HSV顏色空間 5RGB顏色模型 5HSV顏色模型 6從RGB到HSV的轉(zhuǎn)換 7顏色特征、特征提取和特征

2025-06-22 02:39

武漢大學(xué)本科生畢業(yè)論文書寫規(guī)范-11--資料下載頁

【總結(jié)】武漢大學(xué)教務(wù)部實(shí)踐教學(xué)管理辦公室武漢大學(xué)本科生畢業(yè)論文書寫印制規(guī)范畢業(yè)論文寫作是反映學(xué)生畢業(yè)論文工作成效的重要途經(jīng)，是考核學(xué)生掌握和運(yùn)用所學(xué)基礎(chǔ)理論、基本知識、基本技能從事科學(xué)研究和解決實(shí)際問題能力的有效手段。掌握撰寫畢業(yè)論文的基本能力是本科人才培養(yǎng)中的一個(gè)十分重要的環(huán)節(jié)。為了統(tǒng)一我校本科生畢業(yè)論文的書寫格式，特制定本規(guī)范。在遵照本規(guī)范的前提下，各學(xué)院（系）還可根據(jù)不同專業(yè)特點(diǎn)對相關(guān)

2025-08-04 16:34

基于java的餐飲管理系統(tǒng)本科生畢業(yè)論文-資料下載頁

【總結(jié)】I本科生畢業(yè)論文(設(shè)計(jì))題目：基于JAVA的餐飲管理系統(tǒng)II畢業(yè)論文（設(shè)計(jì)）原創(chuàng)性聲明本人所呈交的畢業(yè)論文（設(shè)計(jì)）是我在導(dǎo)師的指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。據(jù)我所知，除文中已經(jīng)注明引用的內(nèi)容外，本論文（設(shè)計(jì)）不包含其他個(gè)人已經(jīng)發(fā)表或撰寫過的研究成果。對本論文（設(shè)計(jì)）的研究做出重要貢獻(xiàn)的個(gè)人和集體，均已在文中作了明確說明并表示謝意。

2025-06-27 17:44

蘭州大學(xué)本科生畢業(yè)論文(設(shè)計(jì))寫作規(guī)范(試行)-資料下載頁

【總結(jié)】附件2：蘭州大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）寫作規(guī)范（試行）為規(guī)范我校本科生畢業(yè)論文（設(shè)計(jì)）撰寫格式，根據(jù)學(xué)位論文編寫的相關(guān)標(biāo)準(zhǔn)，特制定本規(guī)范。一、畢業(yè)論文（設(shè)計(jì)）基本結(jié)構(gòu)與編寫要求畢業(yè)論文（設(shè)計(jì)）基本結(jié)構(gòu)包括前置部分、主體部分和結(jié)尾部分。字?jǐn)?shù)原則上不少于6000字，用簡體中文撰寫。（一）前置部分包括封面（包括扉頁）、誠信責(zé)任書、使用授權(quán)聲明、摘要（包括中英文摘要）、目錄等。

2025-04-12 12:01

南開大學(xué)本科生畢業(yè)論文(設(shè)計(jì))管理規(guī)定-資料下載頁

【總結(jié)】目錄南開大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）管理規(guī)定（2020年修訂）?????????1南開大學(xué)本科畢業(yè)論文（設(shè)計(jì)）格式和打印要求?????????????14南開大學(xué)本科畢業(yè)論文（設(shè)計(jì)）封面及表格???????????????22南開大學(xué)本科畢業(yè)論文（設(shè)計(jì)）指導(dǎo)教師職責(zé)??????????????

2025-10-29 22:20

哈爾濱工業(yè)大學(xué)本科生畢業(yè)論文撰寫規(guī)范-資料下載頁

【總結(jié)】哈爾濱工業(yè)大學(xué)本科生畢業(yè)論文撰寫規(guī)范本科生畢業(yè)論文是學(xué)生在畢業(yè)前提交的一份具有一定科研價(jià)值和實(shí)用價(jià)值的學(xué)術(shù)論文。它是本科學(xué)生開始從事工程設(shè)計(jì)、科學(xué)實(shí)驗(yàn)和科學(xué)研究的初步嘗試，是學(xué)生在教師的指導(dǎo)下，所取得成果的科學(xué)表述，是學(xué)生畢業(yè)及學(xué)位資格認(rèn)定的重要依據(jù)。畢業(yè)論文撰寫是本科生培養(yǎng)過程的基本訓(xùn)練之一，指導(dǎo)教師應(yīng)加強(qiáng)指導(dǎo)，嚴(yán)格把關(guān)。畢業(yè)論文撰寫應(yīng)實(shí)事求是，杜絕造假和抄襲等行為，符合國家及各專業(yè)部

2025-04-18 03:31

師范大學(xué)本科生畢業(yè)論文(設(shè)計(jì))撰寫格式示例-資料下載頁

【總結(jié)】附件1：安徽師范大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）撰寫格式示例論文題目(居中、黑體、三號)（空1行）姓名，學(xué)院(居中、宋體、小四號)（空1行）摘要（頂格、黑體、四號、“摘”“要”之間空2個(gè)字符）：隨著XXXXXXXXXXXXXXXXXXXXXXXX(摘要內(nèi)容為仿宋、小4號)關(guān)鍵詞（頂格、黑體、四號）：XXXXX；XXXXX；XXXXX（仿宋，小4號）（空1行）XXXXX

2025-07-26 09:02

浙江大學(xué)本科生畢業(yè)論文(設(shè)計(jì))工作實(shí)施意見-資料下載頁

【總結(jié)】浙江大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）工作實(shí)施意見編輯：xtt10207日期：2008-12-2208:08（浙大本發(fā)〔2008〕31號）畢業(yè)論文（設(shè)計(jì)）在培養(yǎng)大學(xué)生探求真理和知識、強(qiáng)化社會意識、進(jìn)行專業(yè)綜合訓(xùn)練、提高實(shí)踐能力和綜合素質(zhì)等方面具有不可替代的作用，是教育與生產(chǎn)勞動和社會實(shí)踐相結(jié)合的重要體現(xiàn)，是培養(yǎng)大學(xué)生的創(chuàng)新能力、實(shí)踐能力和創(chuàng)新創(chuàng)業(yè)精神，實(shí)現(xiàn)人才培養(yǎng)目標(biāo)的重要

2025-08-04 17:33

指導(dǎo)]天津師范大學(xué)本科生畢業(yè)論文指導(dǎo)手冊-資料下載頁

【總結(jié)】本科畢業(yè)論文（設(shè)計(jì)）天津師范大學(xué)本科生畢業(yè)論文指導(dǎo)手冊2本科畢業(yè)論文（設(shè)計(jì)）指導(dǎo)手冊天津師范大學(xué)教務(wù)處編印二〇〇六年八月前言本科生畢業(yè)論文（設(shè)計(jì)）是對學(xué)生在大學(xué)階段學(xué)習(xí)的專業(yè)基礎(chǔ)知識和形成的研究能力、自學(xué)能力才辜妊什罵呀兄褪按鼓喝侄館京嘯山娃掀陋徹莉繳考蛹氓臨媽曹立秉抵可酚前瘟昨待啄騁寅唯辱齲腰前炙爆達(dá)閩桂啼沫慚夢線碰丟撫舟攜藤瀑懇搖指

2025-11-07 19:12

蘭州大學(xué)本科生畢業(yè)論文設(shè)計(jì)寫作規(guī)范試行-資料下載頁

2025-04-12 12:01

武漢大學(xué)本科生畢業(yè)論文(設(shè)計(jì))書寫印制規(guī)范-資料下載頁

【總結(jié)】附件：《武漢大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）書寫印制規(guī)范》附件武漢大學(xué)本科生畢業(yè)論文（設(shè)計(jì)）書寫印制規(guī)范畢業(yè)論文寫作是反映學(xué)生畢業(yè)論文工作成效的重要途經(jīng)，是考核學(xué)生掌握和運(yùn)用所學(xué)基礎(chǔ)理論、基本知識、基本技能從事科學(xué)研究和解決實(shí)際問題能力的有效手段。掌握撰寫畢業(yè)論文的基本能力是本科人才培養(yǎng)中的一個(gè)十分重要的環(huán)節(jié)。為了統(tǒng)一我校本科生畢業(yè)論文的書寫格式，特制定本規(guī)范。本規(guī)范約定的書寫格式

2025-08-04 17:25

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片