freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

軟件工程畢業(yè)設(shè)計(jì)-基于wordnet的xml文檔語義相似性計(jì)算方法-文庫吧資料

2024-12-12 09:43本頁面
  

【正文】 語義相似性、語義相關(guān)性和語義距離,這三個詞總是同時出現(xiàn),甚至被經(jīng)?;煊茫欢?,它們的意義并非完全一樣,這里我們舉例來說明。 WordNet 作為一個主要的通用本體,每一個詞的定義都經(jīng)過專家論證,可以天津大學(xué) 2021屆本科生畢業(yè)設(shè)計(jì)(論文) 6 為我們常見的英文詞匯提供可靠的基本解釋;其完善的樹形組織結(jié)構(gòu)利于語義的相似度比較,在現(xiàn)階段的語義相似度研究中被廣泛使用,本文也將使用 WordNet作為本體。整體部分關(guān)系( meronymy):在 WordNet 中,包含了三種整體部分關(guān)系, A是 B 的組成部分; A 是 B 的成員; A 是 B 的 構(gòu)成材料。上下位關(guān)系:如果同義詞集合 A 的所有特征被包含在同義詞集合 B的特征集中,而不是相反,那么 B 是 A 的下位概念( hyponym),反過來, A 是B 的上位概念( hypernym)。簡而言之,同義詞構(gòu)成同義詞集合,同義詞集合構(gòu)成類,不同類又構(gòu)成更上層的類。在名詞樹形結(jié)構(gòu)的最頂層是11 個基本類,比如 “ entity” 、 “ event” 等等。 WordNet 中最基礎(chǔ)的語義關(guān)系是 synonymy(同義關(guān)系)。 WordNet 的名詞部分是目前被開發(fā)的最完整的部分,名詞的連接關(guān)系就占了所有連接關(guān)系的 80%。其描述的對象包括 pound(復(fù)合詞)、 phrasal verb(短語動詞)、 collocation(搭配詞)、 idiomatic phrase(成語)、 word(單詞),其中 單詞是最基本的單位。 綜上所述,我們對于本體的選擇,一方面取決于 對概念密度和概念間關(guān)系的天津大學(xué) 2021屆本科生畢業(yè)設(shè)計(jì)(論文) 5 組織強(qiáng)度的需求,另一方面需要參考我們使用本體的目的,所研究問題的特點(diǎn)。 本體有許多分類方式,一種常用的方式是根據(jù)內(nèi)容分為三類:領(lǐng)域本體:本體內(nèi)容適用于特定學(xué)科領(lǐng)域;通用本體:本體內(nèi)容包含具有普遍意義的客觀世界的常識;任務(wù)本體:本體本 身為用于解決特定任務(wù)的術(shù)語集合。父親節(jié)點(diǎn)是當(dāng)前節(jié)點(diǎn)所表示概念的上一級概念,比如 “ 狗 ” 的上一級概念可能為 “ 哺乳動物 ” ;兄弟節(jié)點(diǎn)是父親節(jié)點(diǎn)相同的節(jié)點(diǎn),比如 “ 哺乳動物 ” 的子節(jié)點(diǎn)可能有 “ 狗 ” 、 “ 貓 ” 、 “ 猩猩 ” 等等,那么 “ 狗 ” 的兄弟節(jié)點(diǎn)即為 “ 貓 ” 和 “ 猩猩 ” ;子節(jié)點(diǎn)為當(dāng)前概念的下一級概念,比如 “ 狗 ” 的下一級概念可以為 “ 獵犬 ” 、 “ 牧羊犬 ” 等等。在具體應(yīng)用中,一個領(lǐng)域的知識庫,一個詞典,一個語義網(wǎng)都可以被用來當(dāng)作一個本體。 有很多方 法被用來表示一個本體,方法的選擇取決于研究領(lǐng)域?qū)Ρ倔w的不同需求,也就是對概念密度和概念間關(guān)系的組織強(qiáng)度的需求。類和概念之間加入適當(dāng)?shù)年P(guān)系,使各個獨(dú)立的概念和類相連,也就構(gòu)成了一個本體。 本體的基本元素是概念,概念的表現(xiàn)形式為詞匯,即一個詞匯可以有多個語義,可以表達(dá)多個概念,而同一個概念也可以被多個詞匯表達(dá)。在信息科學(xué)領(lǐng)域,本體的定義是一直發(fā)展著的,目前對于本體的統(tǒng)一定義是 “ 本體是一種形式化的,對 共享概念明確而又規(guī)范的說明 ” 。 天津大學(xué) 2021屆本科生畢業(yè)設(shè)計(jì)(論文) 4 第二章 語義相似度研究 本體概述 “ 本體( ontology) ” 一詞源于哲學(xué)領(lǐng)域,在古希臘羅馬哲學(xué)中,本體論主要研究的是對世界本源或基本構(gòu)成的探究,根據(jù) Webster 詞典的定義,本體是關(guān)于存在的物體的本質(zhì)或者各種存在的物體的本質(zhì)的規(guī)范定義。 主要內(nèi)容和組織結(jié)構(gòu) 本文的第一部分緒論主要闡述了課題的必要性和意義;第二部分簡要敘述了語義相似性研究的基本知識,并對后文將要用到的工具 WordNet 進(jìn)行了介紹;第三部分在已有算法的基礎(chǔ)上給出了一種更加精確的概念語義相似性比較算法;第四部分結(jié)合概念語義相似性比較算法給出了一種 XML文檔語義相似性比較算法;第五部分論述了 XML 文檔語義相似性比較算法的實(shí)現(xiàn)過程;第六部分對本文進(jìn)行了總結(jié)并對將來的發(fā)展方向進(jìn)行了論述 。 在 XML 語義相似性測量方面,當(dāng)前的主要方法是遍歷每一個節(jié)點(diǎn),比較每一個節(jié)點(diǎn)的語義相似度,計(jì)算出相似節(jié)點(diǎn)的個數(shù)和總結(jié)點(diǎn)個數(shù)的比作為 XML 文檔相似度的依據(jù),一方面它忽略了文檔本身的結(jié)構(gòu)性,另一方面為每一個節(jié)點(diǎn)執(zhí)行一遍概念相似度算法復(fù)雜度太高。以距離測量的方法有太多的經(jīng)驗(yàn)判斷,缺少說服力,同時計(jì)算復(fù)雜度高;信息學(xué)理論有一個很好的評價相似性的方法,即以共有信息量的多少為標(biāo)準(zhǔn),但卻忽視了概念之間的方向性等信息,比如 “ 貓 ” 和 “ 哺乳動物 ” 作比較,反過來 “ 哺乳動物 ” 和 “ 貓 ” 作比較,兩者有什么不同呢?顯然,兩者的共有信息量是一樣的。而少量的文獻(xiàn)中雖然提到了 XML 語義相似度測量,但由于將過多的精力放在了其節(jié)點(diǎn)的語義相似度上,而忽略了文檔本身的結(jié)構(gòu)性。 而在語義相似性測量方面,當(dāng)前研究的主要焦點(diǎn)仍然是概念相似度測量,還很少有研究將概念相似度測量應(yīng)用到 XML 文檔中來實(shí)現(xiàn) XML 文檔的語義相似性比較。這種方法忽略了 XML 文檔的結(jié)構(gòu)特點(diǎn);還有研究基于擁有相似的路徑集合則 XML 文檔相似的假設(shè),通過路徑集合 的比較計(jì)算 XML 文檔之間的相似度。 天津大學(xué) 2021屆本科生畢業(yè)設(shè)計(jì)(論文) 2 研究現(xiàn)狀 目前 XML 文檔相似度的研究已經(jīng)取得了許多進(jìn)展。名詞、動詞、形容詞和副詞各被組織成一個同義詞的網(wǎng)絡(luò),每個同義詞集合都代表一個基本的語義概念,并且這些集合之間也由各種關(guān)系連結(jié)。 有了概念語義相似度的基礎(chǔ),解決 XML 語義相似度的測量問題首先需要選擇一個 適合的通用本體,我們采用 WordNet,一種大家普遍接受的通用本體,作為判斷自然語言之間語義的相似性的依據(jù)。和文本文檔相比, XML 文檔具有 “ 自描述 ” 、 “ 樹形結(jié)構(gòu) ” 、 “ 結(jié)構(gòu)嵌套 ” 等特點(diǎn)。 研究與應(yīng)用并重,我們將重點(diǎn)放在了如何基于本體測 量 XML的語義相似度。) ,數(shù)據(jù)挖掘和知識獲取的必要步驟之一,如何實(shí)現(xiàn)不同本體之間的信息交換成為一個不可忽視的問題;換言之,要實(shí)現(xiàn)不同本體間的信息交換,或者想要挖掘出所需知識,就必須找到與所需概念相似的概念。語義相似性測量方法被廣泛的應(yīng)用在了數(shù)據(jù)挖掘和知識獲取方面以及國防安全、企業(yè)應(yīng)用等領(lǐng)域。 關(guān)鍵詞: 語義相似度 ; 概念 ; WordNet; XML; XML 文檔語義相似度 ABSTRACT With the use of XML in data mining, classification and clustering, data exchange, content management, Web services and so on, how to decide the similarity between XML documents is being a mon problem. And there’s still no answer for where is the effective method to measure the semantic similarity between XML documents. This paper gives a more accurate way for this problem based on WordNet , the ontology , with the discussing of current mainstream ways of semantic similarity between concepts. Based on the semantic similarity between concepts and the structure characteristics of XML, this paper gives a new algorithm for semantic similarity between XML documents. It count the semantic similarity of XMLelements as units, and weights them, and gives the overall semantic similarity of XML documents. The algorithm has been proved to be feasible. And it’s a little step forward that the study of semantic similarity between XML documents has not been focused yet. Key words: semantic similarity; concept; WordNet; XML; semantic similarity between XML documents 1 目 錄 第一章 緒論 ........................................................................... 1 研究背景 ............................................................................. 1 研究現(xiàn)狀 ............................................................................. 2 研究意義 ............................................................................. 2 主要內(nèi)容和組織結(jié)構(gòu) ......................................................... 3 本章小結(jié) ............................................................................. 3 第二章 語義相似度研究 ...................................................... 4 本體概述 ............................................................................. 4 WordNet 簡介 ..................................................................... 5 語義相似性、語義相關(guān)性和語義距離 .............................. 6 本章小結(jié) ............................................................................. 6 第 三章 基于 WordNet 的概念語義相似度算法 ................ 7 基于 WordNet 的語義相似性算法綜述 ............................. 7 網(wǎng)絡(luò)距離模型 .............................................................. 7 信息理論模型 .............................................................. 9 當(dāng)前算法存在的問題 ......................................................... 9 一種新的概念語義相似度計(jì)算方法 .................................. 9 算法分析 ........................................................................... 11 本章小結(jié) ........................................................................... 12 第四章 基于 WordNet 的 XML 語義相似性算法 ........... 13 2 XML 文檔簡介 ................................................................. 13 基于語義相似性計(jì)算 XML 文檔的語義相似性 .............. 13 兩種概念相似性測量方法的選擇 .................................... 15 XML 文檔語義相似性測量的其他問題 .......................... 16 本章小結(jié) ........................................................................... 17 第五章 基于 WordNet 的 XML 語義相似性算法設(shè)計(jì) ... 18 需求分析 ........................
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1