freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于模式的語義信息抽取及應(yīng)用研究畢業(yè)論文(編輯修改稿)

2024-08-14 12:54 本頁面
 

【文章內(nèi)容簡介】 ....... 22 圖 4. 4 分詞后的文本劃分為不同的類別 ...................................................... 23 圖 4. 5 相關(guān)文檔集的聚類結(jié)果 ..................................................................... 24 圖 4. 6 模式合并結(jié)果 ..................................................................................... 26 圖 4. 7 泛化后的模式結(jié)果 ............................................................................. 26 圖 4. 8 中醫(yī)醫(yī)案文本 ..................................................................................... 27 圖 4. 9 測試語料劃分為不同的類別 .............................................................. 27 圖 4. 10 實(shí)驗(yàn)得到的信息抽取模式 ................................................................ 28 圖 4. 11 信息抽取模式 ................................................................................... 28 圖 4. 12 不適宜全部合并的實(shí)例 ................................................................... 29 圖 5. 1 中醫(yī)信息抽取流程圖 ......................................................................... 33 圖 5. 2 典型中醫(yī)肝病醫(yī)案 ............................................................................. 35 圖 5. 3 典型中醫(yī)肝病醫(yī)案分詞標(biāo)注結(jié)果 ...................................................... 36 圖 5. 4MapRules 的數(shù)據(jù)結(jié)構(gòu) ......................................................................... 39 基于規(guī)則的信息抽取技術(shù)的研究及其在中醫(yī)醫(yī)案文獻(xiàn)中的應(yīng)用 XII 圖 5. 5 典型中醫(yī)肝病醫(yī)案信息抽取結(jié)果 ....................................................... 44 圖 6. 1 基于模式匹配的中醫(yī)醫(yī)案信息抽取系統(tǒng)結(jié)構(gòu)圖 ............................... 48 圖 6. 2 信息抽取模塊流程圖 .......................................................................... 50 圖 6. 3 用戶登錄界面設(shè)計(jì) .............................................................................. 51 圖 6. 4 用戶管理界面設(shè)計(jì) .............................................................................. 52 圖 6. 5 系統(tǒng)主界面設(shè)計(jì) ................................................................................. 52 圖 6. 6 用戶詞典管理界面 .............................................................................. 53 圖 6. 7 基于模版匹配的抽取界面 .................................................................. 54 北京科技大學(xué)碩士學(xué)位論文 XIII 附表清單 表 5. 1 模式庫 系統(tǒng)用到的 16 個(gè)模式 ........................................................... 31 表 5. 2 模式中數(shù)字的含義 ............................................................................. 32 表 5. 3 模式中字母的含義 ............................................................................. 32 表 5. 4 中醫(yī)醫(yī)案的用戶詞典 ......................................................................... 34 表 5. 5 VecWordCate 數(shù)據(jù)結(jié)構(gòu)圖 .................................................................. 39 表 5. 6 基本信息部分實(shí)例 ............................................................................. 40 表 5. 7 主訴部分存儲(chǔ)實(shí)例 ............................................................................. 40 表 5. 8 治則部分存儲(chǔ)實(shí)例 ............................................................................. 41 表 5. 9 VecWordCate 數(shù)據(jù)結(jié)構(gòu)圖 .................................................................. 41 表 6. 1 用戶信息表 ......................................................................................... 50 表 6. 2 案例信息表 ......................................................................................... 51 北京科技大學(xué)碩士學(xué)位論文 1 1 緒論 課題背景 課題的來源,目的和意義 該研究課題來源 于 “十二五”國家科技支撐計(jì)劃“ 名老中醫(yī)臨床經(jīng)驗(yàn)、學(xué)術(shù)思想傳承研究(一) ” 項(xiàng)目。 本課題研究目標(biāo)是從中醫(yī)傳承的臨床需求出發(fā), 匯聚中醫(yī)學(xué)、認(rèn)知科學(xué)、信息技術(shù),研發(fā) 中醫(yī) 醫(yī)案信息抽取系統(tǒng),即 臨床醫(yī)案收集、儲(chǔ)存、分析、管理為一體的系統(tǒng),實(shí)現(xiàn)臨床患者病案采集、數(shù)據(jù)存儲(chǔ) 、結(jié)構(gòu)化處理等功能 。研發(fā)模式庫生成系統(tǒng),實(shí)現(xiàn) 自動(dòng)化地從文本中獲取模式,生成模式庫,用于支持信息抽取的過程。研發(fā)信息抽取系統(tǒng),實(shí)現(xiàn)系統(tǒng)自動(dòng)識(shí)別出醫(yī)案文本中特定語義信息。 隨著近幾年來中醫(yī)學(xué)研究的深入進(jìn)行,對(duì)中醫(yī)醫(yī)案的信息分析需求越來越迫切,經(jīng)歷了中國五千年的文化變遷,中醫(yī)歷史積累了海量的中醫(yī)醫(yī)案,收錄散雜,在內(nèi)容和文字上不免也存在著訛、漏、誤、衍等錯(cuò)誤現(xiàn)象 [15],采用人工手段進(jìn)行查找與分析已經(jīng)不能滿足快節(jié)奏需求。利 用信息抽取的辦法,將形式多樣、內(nèi)容豐富繁雜的中醫(yī)醫(yī)案以統(tǒng)一、完整結(jié)構(gòu)化的形式提取出來,有效而搶救性地整理和保留了臨床經(jīng)驗(yàn),將無形的經(jīng)驗(yàn)變成有形的可供大家共享的知識(shí),這對(duì)我國中醫(yī)藥領(lǐng)域的傳承意義重大。 課題的研究內(nèi)容 本文研究 基于模式 的信息抽取技術(shù)及應(yīng)用,課題解決的主要技術(shù)難點(diǎn)及技術(shù)方案: ( 1) 模式匹配是信息抽取普遍采用的方法,如何生成模式是課題研究的難點(diǎn)和重點(diǎn)。本文根據(jù)中文自身的特點(diǎn), 考慮到模式即為在文本中經(jīng)常出現(xiàn)的句法結(jié)構(gòu) , 同時(shí)借鑒 英文文本的模式獲取方法 , 提出一種基于聚類的 模式獲取 方法,實(shí)現(xiàn)了 從中醫(yī) 醫(yī)案 中自動(dòng)獲取模式。 首先對(duì)文本進(jìn)行 預(yù)處理,然后對(duì)分詞后的文本 聚類 , 將分詞后的短語 劃分為不同的類別, 則每個(gè)類別為 一個(gè)模式集。將同一模式集中的模式實(shí)例進(jìn)行合并, 就可以得到最終的信息抽取模式。 ( 2) 研究信息抽取技術(shù)在中醫(yī)醫(yī)案領(lǐng)域的應(yīng)用,實(shí)現(xiàn)機(jī)器自動(dòng)識(shí)別 中醫(yī)醫(yī)案里包含的“病”、“證”、“癥候”等相關(guān)屬性及病人基本信息形成最小數(shù)據(jù)冗余基于規(guī)則的信息抽取技術(shù)的研究及其在中醫(yī)醫(yī)案文獻(xiàn)中的應(yīng)用 2 的數(shù)據(jù)。 本文嘗試采用基于模式匹配的正則匹配算法。第一步對(duì)文本進(jìn)行分詞、詞性標(biāo)注處理,第二步在模式庫的支持下,采用模式匹配算法,最終實(shí)現(xiàn)了 機(jī)器對(duì)醫(yī)案的“人名”、“出診時(shí)間”、“ 癥候 ” 信息的識(shí)別,以及實(shí)體間關(guān)系識(shí)別。 論文的主要工作 本文的主要工作包括以下幾個(gè)方面: 1)綜述信息抽取及相關(guān)技術(shù)方法,主要內(nèi)容 包括相關(guān)概念的介紹,技術(shù)專有名詞的解釋說明,還包括對(duì)各種技術(shù)的 分析。 2) 重點(diǎn)研究了基于模式的中醫(yī)醫(yī)案的信息抽取問題。構(gòu)建動(dòng)詞庫、模式庫。 3)設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于中醫(yī)醫(yī)案的信息抽取原型系統(tǒng)。該系統(tǒng)提供了一個(gè)方法以供用戶使用,能夠很好的實(shí)現(xiàn)對(duì)中醫(yī)醫(yī)案信息的抽取。 本文的組織結(jié)構(gòu) 本文共分 7 章,每部分的組織如下: 第一章首先介紹了 本課題的課題背景 ,闡述了 課題的來源,目的及意義,說明了課題 的研究內(nèi)容。 第二章給出了模式自動(dòng)生成的學(xué)習(xí)方法以及它們的優(yōu)缺點(diǎn)。 第三章介紹了中醫(yī)領(lǐng)域中文文本的特點(diǎn),提出了信息抽取的任務(wù)。 第四章介紹了模式自動(dòng)生成方法的思想和具體步驟,并給出了實(shí)驗(yàn)結(jié)果。 第五章介紹了基于模式匹配的信息抽取方法 第六章 完成基于模式匹配的中醫(yī)醫(yī)案信息抽取系統(tǒng),實(shí)現(xiàn)了其中的命名實(shí)體識(shí)別(人名、地名、時(shí)間等名詞性短語)的工作 第七 章 總結(jié)與展望 最后是本文的參考文獻(xiàn),及本文作者對(duì)導(dǎo)師和實(shí)驗(yàn)室同學(xué)的衷心感謝! 北京科技大學(xué)碩士學(xué)位論文 3 2 信息抽取模式學(xué)習(xí) 系統(tǒng) 綜述 信息抽取模式學(xué)習(xí)系統(tǒng)分類 為了進(jìn)行 IE( Information Extraction)模式的學(xué)習(xí),人們先后設(shè)計(jì)過各種 IE模式獲取系統(tǒng),例如 AutoSlog、 PALKA、 CRYSTAL、 LIEP、 AutoSlogTS、 ExDisco、TIMES 等。根據(jù) IE模式獲取系統(tǒng)需要用戶輔助工作 方式 的不同,可以把這些系統(tǒng)分為四個(gè)類別: 它們?yōu)?基于人工語料標(biāo)注的 IE模式學(xué)習(xí)系統(tǒng),如 AutoSlog、PALKA、 CRYSTAL、 LIEP 等 。基于人工語料分類的 IE 模式學(xué)習(xí)系統(tǒng),如AutoSlogTS 等 ?;诜N子模式的自舉 IE 模式學(xué)習(xí)系統(tǒng),如 ExDisco 等 ?;赪ordNet和語料 標(biāo)注的 IE模式學(xué)習(xí)系統(tǒng),如 TIMES 等。下面 分別 介紹這四類系統(tǒng)的工作原理。 基于人工語料標(biāo)注的 IE 模式 學(xué)習(xí) 系統(tǒng) 基于人工語料標(biāo)注的 IE 模式學(xué)習(xí)系統(tǒng) 的 原理 基于人工語料標(biāo)注的 IE 模式獲取 系統(tǒng)的基本原理是: 使用一種 IE 模式表示方式,人工預(yù)先標(biāo)注訓(xùn)練語料, 接著利用機(jī)器學(xué)習(xí)的方法從訓(xùn)練語料中學(xué)出 IE模式。 例如 AutoSlog、 PALAK、 CRYSTAL、 LIEP。 本節(jié)詳細(xì)介紹 AutoSlog 和PALKA 的工作原理。 AutoSlog 是世界上第一個(gè)成功實(shí)現(xiàn)利用機(jī)器學(xué)習(xí)的方法獲取信息抽取模式的系統(tǒng),由 Massachusetts 開發(fā)。 AutoSlog 的核心 就是一個(gè)模式學(xué)習(xí)算法。對(duì)于一個(gè)特定的 IE 任務(wù),系統(tǒng)的輸入是人工標(biāo)注的訓(xùn)練語料 ,一套語言模式集(領(lǐng)域無關(guān)) 和一個(gè)相關(guān)領(lǐng)域的語義詞典。系統(tǒng)的輸出 是對(duì)應(yīng)案例語句的 IE 模式。另外,整個(gè)統(tǒng)的實(shí)現(xiàn)需要 CIRCUS 句法分析器的輔助支持, CIRCUS 句法分析器的功能是自動(dòng)識(shí)別句子中的主語、謂語和賓語等。 最后需要人工對(duì)學(xué)出的模式進(jìn)行審定和篩選。 語言模式集(領(lǐng)域無關(guān)) 由人工設(shè)計(jì)而成。對(duì)于不同領(lǐng)域的信息抽取任務(wù),語言模式集并不需要做較大改動(dòng)。圖 列出了 針對(duì)恐怖活動(dòng)事件用到 的語言模式,以及與它們對(duì)應(yīng)的一條 IE 模式。 基于規(guī)則的信息抽取技術(shù)的研究及其在中醫(yī)醫(yī)案文獻(xiàn)中的應(yīng)用 4 圖 2. 1 AutoSlog 采用的 語言表達(dá)模式及 IE 模式 這里的語言模式集和 IE 模式的不同之處在于:語言模式是領(lǐng)域無關(guān)的,是由人工預(yù)先給定的。而 IE 模式是由該系統(tǒng)自動(dòng)生成的,是給出的語言模式實(shí)例化的結(jié)果。 IE 模式用于對(duì)一個(gè)事件進(jìn)行信息抽取。 語言模式“ subject activeverb”的含
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1