freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

基于ictclas50智能答疑系統(tǒng)設計與實現(xiàn)畢業(yè)論文-免費閱讀

2025-08-10 20:14 上一頁面

下一頁面
  

【正文】 //提交到數(shù)據庫 ()。關鍵代碼如下: 28 其中第一行中的 dbConnection 是自己獲取的數(shù)據庫連接對象。該層必須能支持上面的 Model 層和 oniofgoy 層的多種表現(xiàn)視圖。例如推理過程中產生的三元組的結果集。描述邏輯是一階 邏輯 (First Order Logic)的一個可判定的變種 (譯注:不一定準確,原文 decidable fragment),因此可以用來進行自動推理,計算機從而可以知道本體中的分類層次,以及本體中的各種概念是否一致。屬性和資源可以聚合到容器 (Coniainer)中 ,容器由一系列的特性和資源組成。 (3)聲明 (statements)是資源和屬性的下一級延伸。 RDF 是一個處理元數(shù)據的 XML(標準通用標記語言 的子集 )應用,所謂元數(shù)據,就是 “描述數(shù)據的數(shù)據 ”或者 “描述信息的信息 ”。另外本體推理機提供的常見編程語言接口主要有 Lisp 和 Java 兩種,大部分本體推理機是采用這兩種編程語言實現(xiàn)的。 25 查詢解析器:負責解析用戶的查詢命令。目前基于規(guī)則方法實現(xiàn)的本體推理機系統(tǒng)典型代表有 Jess 和 Jena。對字符串數(shù)進行解析時,分別獲取每個字符串的詞性,判斷該詞性是否為自定義的關鍵詞的詞性,如果是,將該字符串添加到 list 中,模塊的結果就是返回這個 list。 在領域的智能答疑系統(tǒng)中,需要從用戶的語言中獲取關鍵字,再通過關鍵字進行推理,達到我們想要的結果,關鍵詞的提取需要用到 ICTCLAS 的添加詞典的功能,同時ICTALAS 系統(tǒng)有詞匯標注功能,將領域中關鍵詞標注好,添加入到系統(tǒng)中,在對用戶的語言解析的時候獲取我們自定義的標注的詞匯即可進行相關的推理, 添 加入自行標注的詞匯可以通過系統(tǒng)提供的 api,或者通過下載包中的 Demo的 ,添加標注有兩種情況,一種是 單個單詞的添加,一種是批量添加, 第一次 添加的結果是在 Data 的文件夾里生成 4 個新的文件 , , , 。中國科學院計算技術研究所在多年研究工作積累的基礎上,研制出了漢語詞法分析系統(tǒng) ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括 中文分詞 ;詞性標注;命名實體識別;新詞識別;同時支持用戶詞典。 如圖示例 。 (應用 Prot_g 構建臨床藥物本體的探索 )。屬性都有自己的定義域和 值域 ,默認為 “ Thing” 。 這三種類型的屬性分別應用不同的關系。 hasSubType hasSubType hasSubType 防治 生物防治 化學防治 物理防治 hasSubType hasSubType hasSubType 營養(yǎng)與飲食 食用搭配 微量元素 營養(yǎng)物質 15 圖 8 害蟲關系圖 荔枝的病害和蟲害與防治歸為一類,危害與防治 。 荔枝的品種:三月紅,元紅,蘭竹,園枝,妃子笑,掛綠,桂味,淮枝,白糖罌,糯米滋,陳紫,黑葉 ; 微量元素:碘,鈣,鈉,鉀,鐵,銅,鋅,錳,鎂 ...; 營養(yǎng)物質:尼克酸,核黃素,硫胺素,碳水化合物,維生素 A,維生素 C,胡蘿卜素,脂肪,膳食纖維,蛋白質 ...; 市區(qū):東莞,中山,廣州,揭陽,深圳,潮州,茂名 ...; 省份:臺灣,廣東,廣西,海南,福建 ...; 行政區(qū):從化,北流,增城,容縣,惠來,新興街道,桂平,橫縣,浦北,電白,藤縣,貴縣,饒平,高州 ...; 麗金龜科:古背異麗金龜,紅腳異麗金龜 ; 卷葉蛾科:圓翅卷葉蛾,擬小黃卷葉蛾,白點褐卷葉蛾 ; 天??疲豪笾敱程炫?; 小卷葉蛾科:灰 白卷葉蛾,褐帶長卷葉蛾,黃三角黑卷葉蛾,黑點褐卷葉蛾 ; 擬木蠹蛾科:相思擬木蠹蛾,荔枝擬木蠹蛾 ; 木蠹蛾科:咖啡木蠹蛾 ; 灰蝶科:荔枝小灰蝶 ; 癭蚊科:荔枝葉癭蚊 ; 癭螨科:荔枝癭螨 ; 細蛾科:爻蚊細蛾,荔枝細蛾,荔枝蒂蛀蟲 ; 薊馬科:茶黃薊馬 ; 葉:葉脈,嫩葉,嫩芽,成葉,老葉 ...; 果:果實,果柄,果核,果皮,果肉 ...; 枝條:枝,嫩梢 ; 病害:易逝杯傘葡,荔枝叢枝病,荔枝扁枝槲寄生,荔枝桑寄生,荔枝炭疽病,荔枝藻斑病 ...; 防治方法:化學防治,生物防治,物理防治; ...; ..。荔枝的栽培,迄今為止,已長達兩千多年的歷史 , 我國 幅員 廣闊,不同地區(qū)有不同的 特產 。g233。g233。g233。的特點 Prot233。另外, prot233。g233。 Prot233。 定義概念之間的關系 概念的分類層次結構體現(xiàn)了分類概念之間的一種繼承關系 (kindof),但是在領域本體中,概念和概念之間 通過關系來交互,除了繼承關系,在我們構建的領域本體中還可以根據需要,定義其他的關系。建立一個分類概念的層次結構有 3 種可行的方法 : 自頂向下法、自底向上法和綜合法。所 以在設計和建立自己的領域本體之前,應該考慮重用已經存在的本體。七個步驟分別是 : ① 確定本體的專業(yè)領域和范疇; ② 考查復用現(xiàn)有本體的可能性 ;③ 列出本體中的重要術語; ④ 定義類和類的等級體系 (完善等級體系可行的方法有 : 自頂向下法、自低向上法和綜合法 [7]);⑤ 定義類的屬性 ;⑥ 定義屬性的分面 ;⑦ 創(chuàng)建實例 (劉仁寧 等 ,20xx)。任何大型的通用本體(像 Cyc、 Dahlgren 的本體 )、詞匯 語義網 (像 WordNet,GermaNet)、或者領域相關的本體(像 TOVE)都可以作為這個過程的開始。這個本體開發(fā)方法更接近軟件工程開發(fā)方法。 IDEF5 創(chuàng)建本體的 5 個主要步驟是: ① 定義課題、組織隊伍 ; ② 收集數(shù)據 ;③ 分析數(shù)據 ;④ 本體初步開發(fā) ; ⑤ 本 體優(yōu)化與驗證。 ⑧ 使用多樣的概念層次結構實現(xiàn)多繼承機制。由于沒有一個標準的本體構造方法,不少研究人員出于指導人們構造本體的目的,從實踐出發(fā),提出了不少有益于構造本體的標準。 可 擴展標記語言和 超文本標記語言 之間的差異 1 它不是 超文本標記語言 的替代。 作為 標準通用標記語言 的子集,一種用于標記電子文件使其具有結構性的標記語言。 Gellish 語言之中包括了關于自身擴展的規(guī)則,因而集成了一部本體和一種本體語言。 本體構成要素 常見的本體構成要素包括 如下表 1 所示 : 表 1 本體過程屬性 屬性 屬性說明 個體 (實例 ) 基礎的或者說 “ 底層的 ” 對象 類 集合 (sets)、概念、對象類型或者說事物的種類 屬性 對象 (和類 )所可能具有的屬性、特征、特性、特點和參數(shù) 關系 類與個體之間的彼此關聯(lián)所可能具有的方式 函式術語 在聲明語句當中,可用來代替具體術語的特定關系所構成的復雜結構 約束 (限制 ) 采取形式化方式所聲明的,關于接受某項斷言作為輸入而必須成立的情況的描述 規(guī)則 用于描述可以依據特定形式的某項斷言所能夠得出的邏輯推論的, ifthen(前因-后果 )式語句形式的聲明。在 計算機科學 領域,其核心意思是指一種模型,用于描述由一套對象類型 (概念或者說類 )、屬性以及關系類型所構成的世界。 本研究通過建立智能答疑系統(tǒng),用戶通過輸入自己的問題,系統(tǒng)后臺在相關的知識庫中獲取答案,并顯示給用戶。的特點 ..................................................... 10 Prot233。 (2)介 紹和使用 ICTCLAS50 分詞工具,介紹系統(tǒng)分詞模塊的建立方法。對用戶的提問進行解析分詞。g233。知識庫是通過本體建立語義網 為基礎構建起來的,為用戶搭建起一個便捷、高效的知識和信息的共享平臺。盡管不同的本體對于這些構成成分的確切稱謂有所不同,但它們卻都是一部本體不可或缺的基本要素。 公理 采取特定邏輯形式的斷言 (包括規(guī)則在內 )所共同構成的就是其本體在相應應用領域當中所描述的整個理論。 IDEF5 是一種用于編制和維護 準確 的,具有 可復用性 的領域本體的 軟件工程 方法。它可以用來標記數(shù)據、定義數(shù)據類型,是一種允許用戶對自己的標記語言進行定義的源語言。 2 它是對 超文本標記語言 的補充。通過分析總結,本體的設計原則可以概括如下 : ① 明確性和客觀性:即本體應該用自然語言對所定義術語給出明確的、客觀的語義定義。 ⑨ 盡可能使用標準化的術語名稱。 (2)Skeletal Methodolody 骨架法 (Uschold M,1996): 這個方法是從英國 Edinburgh 大學 AI 應用研究所的 Enterprise 項目組開發(fā)企業(yè)建模過程的 Enterprise Ontology 本體的經驗中得出的,該方法主要面向企業(yè)活動領域的本體構建,包含了同企業(yè)活動相關的一組術語和定義,以企業(yè)為對象領域構建本體 。它將本體開發(fā)進程和本體生命周期兩個方面區(qū)別開來,并使用不同的技術予以支持。選定基礎本體后,用戶必須確定用于抽取領域相關實體的文本。 建領域本體的步驟 本體的開發(fā)和完善是一個反反復復不斷補充的迭代過程。如果系統(tǒng)需要和其它的應用平臺進行互操作,而這個應用平臺又與特定的領域本體或相關概念聯(lián)系在一起,那么復用現(xiàn)有的本體是行之有效的方法。 一般領域概念分類層次對應著一棵樹,樹中的節(jié)點體現(xiàn)了領域概念間的層次結構關系。 protege 工具建立本體 Prot233。g233。 工具本身沒有嵌入推理工具,不能實現(xiàn)推理,但它具有很強的可擴展性,可以插入 插件 來擴展一些特殊的功能如推理、提問、 XML 轉換等。g233。g233??梢酝ㄟ^兩種方式進行擴展: 插件 和基于 java 的 API??捎糜冢? 類模擬 (Class modeling): prot233。有一個插件庫,可以定義語義、解答詢問以及定義邏輯行為。 荔枝的屬性包括形態(tài)特質,地理分布,荔枝的品種,使用價值,栽培技術,荔枝的病害、蟲害,及其防治。 描述 類與類之間的等級體系 13 完善類間的層級體系通常可以采用三種方法 (Uschold and Gruninger,1996),自頂向下,自底向上,綜合法,三者的不同在于建立等級層次的過程中是從哪里開始著手的,自頂向下是從領域中最頂級的概念開始,再將概念逐層細化,自底向上則相反,綜合發(fā)是將前兩者的方法結合在一起使用,先定義最重要的概念,再通過適當?shù)臍w納演繹,將其他的概念關聯(lián)起來。 圖 9 危害與防治關系圖 地域,包括市區(qū),省份,行政區(qū) 。 Object 屬性可以通過該屬性在類與類之間建立關系。在定義屬性的時候 ,可以規(guī)定屬性的定義域和值域 ,這樣 ,在為類附加屬性的時候 ,可以清楚地知道屬性可以附加的類及可取值的類 ,保持本體的一致性。 下面對已有的類定義相關的屬性,大多數(shù)情況下,屬性可以理解為下面的公式“主語的 (屬性 )是 **” ,屬性可以作為形容詞的部分,這該論文的研究上,使用 protege 建立的兩種種屬性 data 屬性和 object 屬性加到語義網中如下兩張圖所示。 圖 16 添加實例到類 21 圖 17 添加數(shù)據屬性和對象屬性到實例 本體知識庫 在該論文中,荔枝的本體構建有 42 個類, 127 個實例, 13 個數(shù)據屬性, 10 個物質屬性滿足用戶基本的查詢。 目前最新的版本為 ICTCLAS 20xx,又名NLPIR 自然語言處理與信息檢索共享平臺。這里以使用 程序為例。 本章小結 本章介紹了關于 ICTCLAS 的基本情況,因為 ICTCLAS 可以說是當前性能和速度最好的中文分詞工具,所以本論文選用這個工具使用到荔枝的智能答疑系統(tǒng)中。 3) 利用邏輯編程方法。 推理引擎:是本體推理機的核心部件,負責接受解析后的本體文件和查詢命令,并執(zhí)行推理流程,推理引擎決定本體推理機的推理能力。 Jena 開發(fā)包 隨著近年來語義網技術的發(fā)展 ,出現(xiàn)了新的基于 web 的本體描述語言 ,如RDF,RDFS,DAML+OIL,OWL 等。 資源描述框架 ( RDF)是一個用于表達關于 萬維網 (World Wide Web)上資源信息的語言 . 它專門用于表達關于 Web 資源的元數(shù)據,比如 Web 頁面的標題、作者和修改時間, Web文檔的版權和許可信息,某個被共享資源的可用計劃表等。每個 RDF 聲明用 XML 來表述。 RDF 描述使用 RDF/XML 規(guī)范被序列化并作為 XML 來傳輸。 3)OWLfull: OWLFull是 OWL 的三種子語言中表達能力最強的一個,適合在那些需要非常強的表達能力,而不用太關心可判定性 (decidability)或是計算完全性的場合下使用。 eJnaZ 中 GraPh 層的實現(xiàn)提供了多種持久性存儲三元組的方式 ,并且內置了基于 RDFS 和 OWLLiet 的推理。這一層的作用是使得表現(xiàn)層不固定 ,可以根據需要而改變。 存儲的結構是在數(shù)據庫中生成 7 張表 : 表 3 本體在數(shù)據庫中生成的 7 張表 表名 存儲 jena_g1t1_stmt 本體數(shù)據 jena_g1t
點擊復制文檔內容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1