freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于ictclas50智能答疑系統(tǒng)設(shè)計與實現(xiàn)畢業(yè)論文-免費閱讀

2025-08-10 20:14 上一頁面

下一頁面
  

【正文】 //提交到數(shù)據(jù)庫 ()。關(guān)鍵代碼如下: 28 其中第一行中的 dbConnection 是自己獲取的數(shù)據(jù)庫連接對象。該層必須能支持上面的 Model 層和 oniofgoy 層的多種表現(xiàn)視圖。例如推理過程中產(chǎn)生的三元組的結(jié)果集。描述邏輯是一階 邏輯 (First Order Logic)的一個可判定的變種 (譯注:不一定準(zhǔn)確,原文 decidable fragment),因此可以用來進行自動推理,計算機從而可以知道本體中的分類層次,以及本體中的各種概念是否一致。屬性和資源可以聚合到容器 (Coniainer)中 ,容器由一系列的特性和資源組成。 (3)聲明 (statements)是資源和屬性的下一級延伸。 RDF 是一個處理元數(shù)據(jù)的 XML(標(biāo)準(zhǔn)通用標(biāo)記語言 的子集 )應(yīng)用,所謂元數(shù)據(jù),就是 “描述數(shù)據(jù)的數(shù)據(jù) ”或者 “描述信息的信息 ”。另外本體推理機提供的常見編程語言接口主要有 Lisp 和 Java 兩種,大部分本體推理機是采用這兩種編程語言實現(xiàn)的。 25 查詢解析器:負(fù)責(zé)解析用戶的查詢命令。目前基于規(guī)則方法實現(xiàn)的本體推理機系統(tǒng)典型代表有 Jess 和 Jena。對字符串?dāng)?shù)進行解析時,分別獲取每個字符串的詞性,判斷該詞性是否為自定義的關(guān)鍵詞的詞性,如果是,將該字符串添加到 list 中,模塊的結(jié)果就是返回這個 list。 在領(lǐng)域的智能答疑系統(tǒng)中,需要從用戶的語言中獲取關(guān)鍵字,再通過關(guān)鍵字進行推理,達(dá)到我們想要的結(jié)果,關(guān)鍵詞的提取需要用到 ICTCLAS 的添加詞典的功能,同時ICTALAS 系統(tǒng)有詞匯標(biāo)注功能,將領(lǐng)域中關(guān)鍵詞標(biāo)注好,添加入到系統(tǒng)中,在對用戶的語言解析的時候獲取我們自定義的標(biāo)注的詞匯即可進行相關(guān)的推理, 添 加入自行標(biāo)注的詞匯可以通過系統(tǒng)提供的 api,或者通過下載包中的 Demo的 ,添加標(biāo)注有兩種情況,一種是 單個單詞的添加,一種是批量添加, 第一次 添加的結(jié)果是在 Data 的文件夾里生成 4 個新的文件 , , , 。中國科學(xué)院計算技術(shù)研究所在多年研究工作積累的基礎(chǔ)上,研制出了漢語詞法分析系統(tǒng) ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括 中文分詞 ;詞性標(biāo)注;命名實體識別;新詞識別;同時支持用戶詞典。 如圖示例 。 (應(yīng)用 Prot_g 構(gòu)建臨床藥物本體的探索 )。屬性都有自己的定義域和 值域 ,默認(rèn)為 “ Thing” 。 這三種類型的屬性分別應(yīng)用不同的關(guān)系。 hasSubType hasSubType hasSubType 防治 生物防治 化學(xué)防治 物理防治 hasSubType hasSubType hasSubType 營養(yǎng)與飲食 食用搭配 微量元素 營養(yǎng)物質(zhì) 15 圖 8 害蟲關(guān)系圖 荔枝的病害和蟲害與防治歸為一類,危害與防治 。 荔枝的品種:三月紅,元紅,蘭竹,園枝,妃子笑,掛綠,桂味,淮枝,白糖罌,糯米滋,陳紫,黑葉 ; 微量元素:碘,鈣,鈉,鉀,鐵,銅,鋅,錳,鎂 ...; 營養(yǎng)物質(zhì):尼克酸,核黃素,硫胺素,碳水化合物,維生素 A,維生素 C,胡蘿卜素,脂肪,膳食纖維,蛋白質(zhì) ...; 市區(qū):東莞,中山,廣州,揭陽,深圳,潮州,茂名 ...; 省份:臺灣,廣東,廣西,海南,福建 ...; 行政區(qū):從化,北流,增城,容縣,惠來,新興街道,桂平,橫縣,浦北,電白,藤縣,貴縣,饒平,高州 ...; 麗金龜科:古背異麗金龜,紅腳異麗金龜 ; 卷葉蛾科:圓翅卷葉蛾,擬小黃卷葉蛾,白點褐卷葉蛾 ; 天??疲豪笾敱程炫?; 小卷葉蛾科:灰 白卷葉蛾,褐帶長卷葉蛾,黃三角黑卷葉蛾,黑點褐卷葉蛾 ; 擬木蠹蛾科:相思擬木蠹蛾,荔枝擬木蠹蛾 ; 木蠹蛾科:咖啡木蠹蛾 ; 灰蝶科:荔枝小灰蝶 ; 癭蚊科:荔枝葉癭蚊 ; 癭螨科:荔枝癭螨 ; 細(xì)蛾科:爻蚊細(xì)蛾,荔枝細(xì)蛾,荔枝蒂蛀蟲 ; 薊馬科:茶黃薊馬 ; 葉:葉脈,嫩葉,嫩芽,成葉,老葉 ...; 果:果實,果柄,果核,果皮,果肉 ...; 枝條:枝,嫩梢 ; 病害:易逝杯傘葡,荔枝叢枝病,荔枝扁枝槲寄生,荔枝桑寄生,荔枝炭疽病,荔枝藻斑病 ...; 防治方法:化學(xué)防治,生物防治,物理防治; ...; ..。荔枝的栽培,迄今為止,已長達(dá)兩千多年的歷史 , 我國 幅員 廣闊,不同地區(qū)有不同的 特產(chǎn) 。g233。g233。g233。的特點 Prot233。另外, prot233。g233。 Prot233。 定義概念之間的關(guān)系 概念的分類層次結(jié)構(gòu)體現(xiàn)了分類概念之間的一種繼承關(guān)系 (kindof),但是在領(lǐng)域本體中,概念和概念之間 通過關(guān)系來交互,除了繼承關(guān)系,在我們構(gòu)建的領(lǐng)域本體中還可以根據(jù)需要,定義其他的關(guān)系。建立一個分類概念的層次結(jié)構(gòu)有 3 種可行的方法 : 自頂向下法、自底向上法和綜合法。所 以在設(shè)計和建立自己的領(lǐng)域本體之前,應(yīng)該考慮重用已經(jīng)存在的本體。七個步驟分別是 : ① 確定本體的專業(yè)領(lǐng)域和范疇; ② 考查復(fù)用現(xiàn)有本體的可能性 ;③ 列出本體中的重要術(shù)語; ④ 定義類和類的等級體系 (完善等級體系可行的方法有 : 自頂向下法、自低向上法和綜合法 [7]);⑤ 定義類的屬性 ;⑥ 定義屬性的分面 ;⑦ 創(chuàng)建實例 (劉仁寧 等 ,20xx)。任何大型的通用本體(像 Cyc、 Dahlgren 的本體 )、詞匯 語義網(wǎng) (像 WordNet,GermaNet)、或者領(lǐng)域相關(guān)的本體(像 TOVE)都可以作為這個過程的開始。這個本體開發(fā)方法更接近軟件工程開發(fā)方法。 IDEF5 創(chuàng)建本體的 5 個主要步驟是: ① 定義課題、組織隊伍 ; ② 收集數(shù)據(jù) ;③ 分析數(shù)據(jù) ;④ 本體初步開發(fā) ; ⑤ 本 體優(yōu)化與驗證。 ⑧ 使用多樣的概念層次結(jié)構(gòu)實現(xiàn)多繼承機制。由于沒有一個標(biāo)準(zhǔn)的本體構(gòu)造方法,不少研究人員出于指導(dǎo)人們構(gòu)造本體的目的,從實踐出發(fā),提出了不少有益于構(gòu)造本體的標(biāo)準(zhǔn)。 可 擴展標(biāo)記語言和 超文本標(biāo)記語言 之間的差異 1 它不是 超文本標(biāo)記語言 的替代。 作為 標(biāo)準(zhǔn)通用標(biāo)記語言 的子集,一種用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語言。 Gellish 語言之中包括了關(guān)于自身擴展的規(guī)則,因而集成了一部本體和一種本體語言。 本體構(gòu)成要素 常見的本體構(gòu)成要素包括 如下表 1 所示 : 表 1 本體過程屬性 屬性 屬性說明 個體 (實例 ) 基礎(chǔ)的或者說 “ 底層的 ” 對象 類 集合 (sets)、概念、對象類型或者說事物的種類 屬性 對象 (和類 )所可能具有的屬性、特征、特性、特點和參數(shù) 關(guān)系 類與個體之間的彼此關(guān)聯(lián)所可能具有的方式 函式術(shù)語 在聲明語句當(dāng)中,可用來代替具體術(shù)語的特定關(guān)系所構(gòu)成的復(fù)雜結(jié)構(gòu) 約束 (限制 ) 采取形式化方式所聲明的,關(guān)于接受某項斷言作為輸入而必須成立的情況的描述 規(guī)則 用于描述可以依據(jù)特定形式的某項斷言所能夠得出的邏輯推論的, ifthen(前因-后果 )式語句形式的聲明。在 計算機科學(xué) 領(lǐng)域,其核心意思是指一種模型,用于描述由一套對象類型 (概念或者說類 )、屬性以及關(guān)系類型所構(gòu)成的世界。 本研究通過建立智能答疑系統(tǒng),用戶通過輸入自己的問題,系統(tǒng)后臺在相關(guān)的知識庫中獲取答案,并顯示給用戶。的特點 ..................................................... 10 Prot233。 (2)介 紹和使用 ICTCLAS50 分詞工具,介紹系統(tǒng)分詞模塊的建立方法。對用戶的提問進行解析分詞。g233。知識庫是通過本體建立語義網(wǎng) 為基礎(chǔ)構(gòu)建起來的,為用戶搭建起一個便捷、高效的知識和信息的共享平臺。盡管不同的本體對于這些構(gòu)成成分的確切稱謂有所不同,但它們卻都是一部本體不可或缺的基本要素。 公理 采取特定邏輯形式的斷言 (包括規(guī)則在內(nèi) )所共同構(gòu)成的就是其本體在相應(yīng)應(yīng)用領(lǐng)域當(dāng)中所描述的整個理論。 IDEF5 是一種用于編制和維護 準(zhǔn)確 的,具有 可復(fù)用性 的領(lǐng)域本體的 軟件工程 方法。它可以用來標(biāo)記數(shù)據(jù)、定義數(shù)據(jù)類型,是一種允許用戶對自己的標(biāo)記語言進行定義的源語言。 2 它是對 超文本標(biāo)記語言 的補充。通過分析總結(jié),本體的設(shè)計原則可以概括如下 : ① 明確性和客觀性:即本體應(yīng)該用自然語言對所定義術(shù)語給出明確的、客觀的語義定義。 ⑨ 盡可能使用標(biāo)準(zhǔn)化的術(shù)語名稱。 (2)Skeletal Methodolody 骨架法 (Uschold M,1996): 這個方法是從英國 Edinburgh 大學(xué) AI 應(yīng)用研究所的 Enterprise 項目組開發(fā)企業(yè)建模過程的 Enterprise Ontology 本體的經(jīng)驗中得出的,該方法主要面向企業(yè)活動領(lǐng)域的本體構(gòu)建,包含了同企業(yè)活動相關(guān)的一組術(shù)語和定義,以企業(yè)為對象領(lǐng)域構(gòu)建本體 。它將本體開發(fā)進程和本體生命周期兩個方面區(qū)別開來,并使用不同的技術(shù)予以支持。選定基礎(chǔ)本體后,用戶必須確定用于抽取領(lǐng)域相關(guān)實體的文本。 建領(lǐng)域本體的步驟 本體的開發(fā)和完善是一個反反復(fù)復(fù)不斷補充的迭代過程。如果系統(tǒng)需要和其它的應(yīng)用平臺進行互操作,而這個應(yīng)用平臺又與特定的領(lǐng)域本體或相關(guān)概念聯(lián)系在一起,那么復(fù)用現(xiàn)有的本體是行之有效的方法。 一般領(lǐng)域概念分類層次對應(yīng)著一棵樹,樹中的節(jié)點體現(xiàn)了領(lǐng)域概念間的層次結(jié)構(gòu)關(guān)系。 protege 工具建立本體 Prot233。g233。 工具本身沒有嵌入推理工具,不能實現(xiàn)推理,但它具有很強的可擴展性,可以插入 插件 來擴展一些特殊的功能如推理、提問、 XML 轉(zhuǎn)換等。g233。g233??梢酝ㄟ^兩種方式進行擴展: 插件 和基于 java 的 API??捎糜冢? 類模擬 (Class modeling): prot233。有一個插件庫,可以定義語義、解答詢問以及定義邏輯行為。 荔枝的屬性包括形態(tài)特質(zhì),地理分布,荔枝的品種,使用價值,栽培技術(shù),荔枝的病害、蟲害,及其防治。 描述 類與類之間的等級體系 13 完善類間的層級體系通??梢圆捎萌N方法 (Uschold and Gruninger,1996),自頂向下,自底向上,綜合法,三者的不同在于建立等級層次的過程中是從哪里開始著手的,自頂向下是從領(lǐng)域中最頂級的概念開始,再將概念逐層細(xì)化,自底向上則相反,綜合發(fā)是將前兩者的方法結(jié)合在一起使用,先定義最重要的概念,再通過適當(dāng)?shù)臍w納演繹,將其他的概念關(guān)聯(lián)起來。 圖 9 危害與防治關(guān)系圖 地域,包括市區(qū),省份,行政區(qū) 。 Object 屬性可以通過該屬性在類與類之間建立關(guān)系。在定義屬性的時候 ,可以規(guī)定屬性的定義域和值域 ,這樣 ,在為類附加屬性的時候 ,可以清楚地知道屬性可以附加的類及可取值的類 ,保持本體的一致性。 下面對已有的類定義相關(guān)的屬性,大多數(shù)情況下,屬性可以理解為下面的公式“主語的 (屬性 )是 **” ,屬性可以作為形容詞的部分,這該論文的研究上,使用 protege 建立的兩種種屬性 data 屬性和 object 屬性加到語義網(wǎng)中如下兩張圖所示。 圖 16 添加實例到類 21 圖 17 添加數(shù)據(jù)屬性和對象屬性到實例 本體知識庫 在該論文中,荔枝的本體構(gòu)建有 42 個類, 127 個實例, 13 個數(shù)據(jù)屬性, 10 個物質(zhì)屬性滿足用戶基本的查詢。 目前最新的版本為 ICTCLAS 20xx,又名NLPIR 自然語言處理與信息檢索共享平臺。這里以使用 程序為例。 本章小結(jié) 本章介紹了關(guān)于 ICTCLAS 的基本情況,因為 ICTCLAS 可以說是當(dāng)前性能和速度最好的中文分詞工具,所以本論文選用這個工具使用到荔枝的智能答疑系統(tǒng)中。 3) 利用邏輯編程方法。 推理引擎:是本體推理機的核心部件,負(fù)責(zé)接受解析后的本體文件和查詢命令,并執(zhí)行推理流程,推理引擎決定本體推理機的推理能力。 Jena 開發(fā)包 隨著近年來語義網(wǎng)技術(shù)的發(fā)展 ,出現(xiàn)了新的基于 web 的本體描述語言 ,如RDF,RDFS,DAML+OIL,OWL 等。 資源描述框架 ( RDF)是一個用于表達(dá)關(guān)于 萬維網(wǎng) (World Wide Web)上資源信息的語言 . 它專門用于表達(dá)關(guān)于 Web 資源的元數(shù)據(jù),比如 Web 頁面的標(biāo)題、作者和修改時間, Web文檔的版權(quán)和許可信息,某個被共享資源的可用計劃表等。每個 RDF 聲明用 XML 來表述。 RDF 描述使用 RDF/XML 規(guī)范被序列化并作為 XML 來傳輸。 3)OWLfull: OWLFull是 OWL 的三種子語言中表達(dá)能力最強的一個,適合在那些需要非常強的表達(dá)能力,而不用太關(guān)心可判定性 (decidability)或是計算完全性的場合下使用。 eJnaZ 中 GraPh 層的實現(xiàn)提供了多種持久性存儲三元組的方式 ,并且內(nèi)置了基于 RDFS 和 OWLLiet 的推理。這一層的作用是使得表現(xiàn)層不固定 ,可以根據(jù)需要而改變。 存儲的結(jié)構(gòu)是在數(shù)據(jù)庫中生成 7 張表 : 表 3 本體在數(shù)據(jù)庫中生成的 7 張表 表名 存儲 jena_g1t1_stmt 本體數(shù)據(jù) jena_g1t
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1