freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于模式的語(yǔ)義信息抽取及應(yīng)用研究畢業(yè)論文-wenkub.com

2025-06-25 12:54 本頁(yè)面
   

【正文】 因此,在中文信息處理中,首先將遇到中文詞法分析的問題。 目前自然語(yǔ)言處理只能處理一般的文本。另外,由于中醫(yī)學(xué)的研究與知識(shí)的 積累等的載體都是中文自然語(yǔ)言而非人工語(yǔ)言,因此對(duì)中醫(yī)學(xué)的研究必然要受到所使用語(yǔ)言載體的限制。比如:癆瘵、勞嗽、急癆、傳尸等均表示肺癆這種病。 中藥名如生龍牡(生龍骨.生牡蠣)、二冬(麥門冬,天冬門)、二地(生地,熟地)等。這為自然語(yǔ)言處理和信息抽取提供了較好的先決條件。 不過也可以沒有段落主題,例如圖 中的病人基本信息。 上方藥服六劑,腹脹搭建,飲食轉(zhuǎn)佳,小便自如。 辨證:肝脾失調(diào),濕阻血瘀。但稍老則右脅隱痛,食欲欠佳。例如家族史、西醫(yī)檢查等信息可以不出現(xiàn)。通常每個(gè)段落對(duì)應(yīng)一部分信息,我 們把這稱為段落主題。信息抽取技術(shù)的出現(xiàn)有效 地 處理 了 該難題 。 中醫(yī)醫(yī)案特征分析 中醫(yī)醫(yī)案結(jié)構(gòu)特征分析 計(jì)算機(jī)技術(shù)與互聯(lián)網(wǎng)技術(shù)突飛猛進(jìn)的發(fā)展,改變了人們的生活。病案中包含著豐富的病證、用藥等相關(guān)知識(shí),是醫(yī)生診斷和治療疾病的依據(jù),是醫(yī)學(xué)科學(xué)研究中很有價(jià)值的資料。 試想,能否設(shè)計(jì)一種 IE 模式學(xué)習(xí)方法,只需人工定義 IE任務(wù),不需要人工提供種子模式、人工進(jìn)行語(yǔ)料分類、人工進(jìn)行語(yǔ)料標(biāo)注,就能夠?qū)崿F(xiàn)自動(dòng)學(xué)出相應(yīng)的 IE 模式。第六列“ sense” 列出了中心詞的概念序號(hào)。 第二列“ Target”表示出事件的重要角色,是第一列詞組充當(dāng)?shù)哪繕?biāo)類型,若不能充當(dāng) IE目標(biāo)值為 None。 4)用戶對(duì)某些有歧義的中心詞進(jìn)行詞義消岐。 TIMES 的 IE 模式學(xué)習(xí)流程 ,步驟如下圖所示: 圖 2. 8 TIMES 的 IE 模式學(xué)習(xí)流程 舉例說明 TIMES 進(jìn)行 IE 模式學(xué)習(xí)的基本流程 0)假設(shè)信息抽取任務(wù)為:從工作信息文本中抽取出公司、職位和職位的地理位置這 三個(gè)目標(biāo)信息。 4)根據(jù)新生成的模式集合 P,對(duì)每個(gè)文檔重新進(jìn)行領(lǐng)域相關(guān)度計(jì)算。 2)生成新的候選模式 將 D 中出現(xiàn)的每個(gè)從句都轉(zhuǎn)換成一個(gè)候選模式,計(jì)算出這些模式的領(lǐng)域相關(guān)度,并按照這些模式的領(lǐng)域相關(guān)度大小將它們排序。 0)對(duì)于一個(gè)特定的 IE 領(lǐng)域任務(wù),給定:一個(gè)未經(jīng)分類的文檔集 D;幾個(gè)種子 IE模式集 P。 規(guī)則主要包含兩個(gè)部分。TIMES 的工作原理是: 一個(gè)概念知識(shí)庫(kù) WordNet 的支持,它是領(lǐng)域無關(guān)的。 表中的第二 個(gè)模式是一個(gè)“辭職”事件模式。 圖中的第一個(gè)模式表示“任命”事件。下面以 ExDisco 為例,介紹基于種子自舉的 IE 模式學(xué)習(xí)系統(tǒng)的工作原理。如果 Concept Node 的領(lǐng)域相關(guān)性較低 ,則去除這個(gè) Concept Node。optional effect:(STATE) 。 例如句子“ World trade center was bombed by terrorists”,經(jīng)過 CIRCUS 句法分析器處理的結(jié)果為 :“ World trade center”充當(dāng)句子的主語(yǔ),“ was FPstructure = Meaning Frame+Phrasal PatternMeaning Frame: (BOMBING isa:(TERRORISTACTION) keywords:(explode, hurl, throw, explosion, bomb, explosive, dynamite, grenade...) agent:(ANIMATE) 。 AutoSlogTS 系統(tǒng)的輸入是用戶給出的領(lǐng)域相關(guān)和不相關(guān)文檔集及 AutoSlog 中用到的語(yǔ)言模式。 圖 2. 2 一個(gè)標(biāo)注后的語(yǔ)句及 AutoSolg 從中學(xué)出的一個(gè)概念節(jié)點(diǎn) Sentence: In La Oroya, Junin department, in the central Peruvian mountain range , public buildings (bombing,TARGET) were bombed and a car was detonated. CONCEPT NODE Name: targetsubjectpassiveverbbombed Trigger: bombed Variable Slots: (target(SUBJECT*l)) Constraints: (class PHYS 一 TARGET *SUBJECT*) Constant Slots: (type bombing) Enabling Conditions: ( passive) 基于規(guī)則的信息抽取技術(shù)的研究及其在中醫(yī)醫(yī)案文獻(xiàn)中的應(yīng)用 6 圖 2. 3 PALKA 的 一個(gè) FPstructure 的例子 基于人工語(yǔ)料分類的 IE 模式學(xué) 習(xí)系統(tǒng) 該類系統(tǒng)的典型代表是 AutoSlogTS,它是有 Riloff 于 1996 年發(fā)明的。這些系統(tǒng)的特點(diǎn)是依賴手工標(biāo)記過的數(shù)據(jù)或通過與用戶的交互過程,利用加工過的語(yǔ)料,學(xué)習(xí)語(yǔ)言的模式規(guī)則,是一種典型的機(jī)器輔助式知識(shí)獲取。 AutoSlog[13]和 PALKA[13]等是最早向知識(shí)獲取自動(dòng)化邁進(jìn)的系統(tǒng)之一。 對(duì)應(yīng)于該語(yǔ)言模式 的一個(gè) IE 模式“ victimwas murdered”的含義是 :句子經(jīng)過 CIRCUS 句法分析器 處理后,“ was murdered”充當(dāng)動(dòng)詞短語(yǔ) ,動(dòng)詞短語(yǔ)的左側(cè)是主語(yǔ)語(yǔ)法成份,則此主語(yǔ)作為bombing 事件的 victim角色。而 IE 模式是由該系統(tǒng)自動(dòng)生成的,是給出的語(yǔ)言模式實(shí)例化的結(jié)果。 語(yǔ)言模式集(領(lǐng)域無關(guān)) 由人工設(shè)計(jì)而成。對(duì)于一個(gè)特定的 IE 任務(wù),系統(tǒng)的輸入是人工標(biāo)注的訓(xùn)練語(yǔ)料 ,一套語(yǔ)言模式集(領(lǐng)域無關(guān)) 和一個(gè)相關(guān)領(lǐng)域的語(yǔ)義詞典。 例如 AutoSlog、 PALAK、 CRYSTAL、 LIEP?;诜N子模式的自舉 IE 模式學(xué)習(xí)系統(tǒng),如 ExDisco 等 。 第四章介紹了模式自動(dòng)生成方法的思想和具體步驟,并給出了實(shí)驗(yàn)結(jié)果。該系統(tǒng)提供了一個(gè)方法以供用戶使用,能夠很好的實(shí)現(xiàn)對(duì)中醫(yī)醫(yī)案信息的抽取。 論文的主要工作 本文的主要工作包括以下幾個(gè)方面: 1)綜述信息抽取及相關(guān)技術(shù)方法,主要內(nèi)容 包括相關(guān)概念的介紹,技術(shù)專有名詞的解釋說明,還包括對(duì)各種技術(shù)的 分析。將同一模式集中的模式實(shí)例進(jìn)行合并, 就可以得到最終的信息抽取模式。利 用信息抽取的辦法,將形式多樣、內(nèi)容豐富繁雜的中醫(yī)醫(yī)案以統(tǒng)一、完整結(jié)構(gòu)化的形式提取出來,有效而搶救性地整理和保留了臨床經(jīng)驗(yàn),將無形的經(jīng)驗(yàn)變成有形的可供大家共享的知識(shí),這對(duì)我國(guó)中醫(yī)藥領(lǐng)域的傳承意義重大。 本課題研究目標(biāo)是從中醫(yī)傳承的臨床需求出發(fā), 匯聚中醫(yī)學(xué)、認(rèn)知科學(xué)、信息技術(shù),研發(fā) 中醫(yī) 醫(yī)案信息抽取系統(tǒng),即 臨床醫(yī)案收集、儲(chǔ)存、分析、管理為一體的系統(tǒng),實(shí)現(xiàn)臨床患者病案采集、數(shù)據(jù)存儲(chǔ) 、結(jié)構(gòu)化處理等功能 。實(shí)現(xiàn)了利用機(jī)器學(xué)習(xí)方法自動(dòng)獲取模式,利用模 式識(shí)別文本中的人名、地名、時(shí)間以及實(shí)體間關(guān)系信息。因此, 本 文主要研究如何通過計(jì)算機(jī)技術(shù)自動(dòng)結(jié)構(gòu)化文本形式的病案信息,從而為挖掘名老中醫(yī)的臨床經(jīng)驗(yàn)和診療思路打下基礎(chǔ)。北京科技大學(xué)碩士學(xué)位論文 III 摘 要 中醫(yī)學(xué)作為中國(guó)特色的傳統(tǒng)醫(yī)學(xué)具有重要的社會(huì)價(jià)值,但是由于中醫(yī)學(xué)理論體系的復(fù) 雜性和特殊性,對(duì)中醫(yī)理論和技術(shù)的全面把握需要較長(zhǎng)的時(shí)間。 真誠(chéng)感謝我的父母、姐姐和朋友們。 另外我還要感 謝實(shí)驗(yàn)室的另外兩位老師張德政老師和劉宏嵐老師, 感謝張 老師和劉老師 對(duì)我的鼓勵(lì)和肯定。Comunication Engineering University of Science and Technology Beijing 30 Xueyuan Road, Haidian District Beijing 100083, 北京科技大學(xué)碩士學(xué)位論文 I 致 謝 本課題能夠順利完成,與我所得到的多方面的無私而熱情的幫助是分不開的。 我首先要感謝我的導(dǎo)師 孫義 教授。張老師積極的人生態(tài)度和拼搏精神,對(duì)我們產(chǎn)生深遠(yuǎn)影響,同時(shí)感謝張老師為我們提供的良好的工作和學(xué)習(xí)環(huán)境。在他們的鼓勵(lì)下,我勇敢前進(jìn) ,克服很多困難。 特別是經(jīng)過多年臨床實(shí)踐,而且擁有多年中醫(yī)實(shí)踐經(jīng)驗(yàn)的專家, 很好的反映出 了 中醫(yī)學(xué)的特色 。 本文針對(duì)中醫(yī)病案文本信息的特點(diǎn),從多個(gè)方面、不同角度對(duì) 基于中醫(yī)病案信息的自動(dòng)抽取進(jìn)行了深入研究,實(shí)現(xiàn)了一個(gè)基于模式匹配 的醫(yī)案信息自動(dòng)抽取系統(tǒng)。 設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于中醫(yī)醫(yī)案的信息抽取原型系統(tǒng)。研發(fā)模式庫(kù)生成系統(tǒng),實(shí)現(xiàn) 自動(dòng)化地從文本中獲取模式,生成模式庫(kù),用于支持信息抽取的過程。 課題的研究?jī)?nèi)容 本文研究 基于模式 的信息抽取技術(shù)及應(yīng)用,課題解決的主要技術(shù)難點(diǎn)及技術(shù)方案: ( 1) 模式匹配是信息抽取普遍采用的方法,如何生成模式是課題研究的難點(diǎn)和重點(diǎn)。 ( 2) 研究信息抽取技術(shù)在中醫(yī)醫(yī)案領(lǐng)域的應(yīng)用,實(shí)現(xiàn)機(jī)器自動(dòng)識(shí)別 中醫(yī)醫(yī)案里包含的“病”、“證”、“癥候”等相關(guān)屬性及病人基本信息形成最小數(shù)據(jù)冗余基于規(guī)則的信息抽取技術(shù)的研究及其在中醫(yī)醫(yī)案文獻(xiàn)中的應(yīng)用 2 的數(shù)據(jù)。 2) 重點(diǎn)研究了基于模式的中醫(yī)醫(yī)案的信息抽取問題。 本文的組織結(jié)構(gòu) 本文共分 7 章,每部分的組織如下: 第一章首先介紹了 本課題的課題背景 ,闡述了 課題的來源,目的及意義,說明了課題 的研究?jī)?nèi)容。 第五章介紹了基于模式匹配的信息抽取方法 第六章 完成基于模式匹配的中醫(yī)醫(yī)案信息抽取系統(tǒng),實(shí)現(xiàn)了其中的命名實(shí)體識(shí)別(人名、地名、時(shí)間等名詞性短語(yǔ))的工作 第七 章 總結(jié)與展望 最后是本文的參考文獻(xiàn),及本文作者對(duì)導(dǎo)師和實(shí)驗(yàn)室同學(xué)的衷心感謝! 北京科技大學(xué)碩士學(xué)位論文 3 2 信息抽取模式學(xué)習(xí) 系統(tǒng) 綜述 信息抽取模式學(xué)習(xí)系統(tǒng)分類 為了進(jìn)行 IE( Information Extraction)模式的學(xué)習(xí),人們先后設(shè)計(jì)過各種 IE模式獲取系統(tǒng),例如 AutoSlog、 PALKA、 CRYSTAL、 LIEP、 AutoSlogTS、 ExDisco、TIMES 等。基于WordNet和語(yǔ)料 標(biāo)注的 IE模式學(xué)習(xí)系統(tǒng),如 TIMES 等。 本節(jié)詳細(xì)介紹 AutoSlog 和PALKA 的工作原理。系統(tǒng)的輸出 是對(duì)應(yīng)案例語(yǔ)句的 IE 模式。對(duì)于不同領(lǐng)域的信息抽取任務(wù),語(yǔ)言模式集并不需要做較大改動(dòng)。 IE 模式用于對(duì)一個(gè)事件進(jìn)行信息抽取。 若一個(gè)含有動(dòng)詞短語(yǔ)“ was murdered”的語(yǔ)句經(jīng)過句法分析后,在該動(dòng)詞短語(yǔ)的左側(cè)有一個(gè)充當(dāng)主語(yǔ)的語(yǔ)法成分,則該語(yǔ)法成分充當(dāng) bombing 事件的 victim角色。隨后實(shí)現(xiàn)的 CRYSTAL 和 LIEP,也旨在實(shí)現(xiàn)知識(shí)獲取的自動(dòng)化。 盡管如此,通過知識(shí)的半自動(dòng)獲取,系統(tǒng)仍然可以很大程度上減少手工的參與。AutoSlogTS 是 AutoSlog 的 后繼產(chǎn)品,相比 AutoSlog, AutoSlogTS 對(duì)用戶的工作量與技能要求大大降低。AutoSlogTS 系統(tǒng) 的輸出是學(xué)習(xí)出的語(yǔ)言模式。optional patient:(PHYSICALOBJECT) 。optional Phrasal Pattern: : ((BOMB) BE HUTL AT (PHYSICALOBJ)) FPstructure: ( BOMBING target: PHYSICAL OBJ i nstrument: BOMB pattern: ((i nstrument)BE HURL AT(target)) ) 北京科技大學(xué)碩士學(xué)位論文 7 bombed”充是句子的動(dòng)詞短語(yǔ),“ by terrorists”是介詞短語(yǔ) 。例如圖 列出了計(jì)算出的領(lǐng)域相關(guān)性值,由于 Concept Nodezsaw 的領(lǐng)域相關(guān)性為 49%,小于 50%,表示相關(guān)性較差,因此去除這個(gè) Concept Node。 ExDisco 系統(tǒng)的 IE 模式用二元組或者三元組表示。 該模式的意義是:如果句子的主語(yǔ)為CCompany語(yǔ)義類,句子的動(dòng)詞為 CAppoint語(yǔ)義類 ,句子的直接賓語(yǔ)為 CPerson類,則這個(gè)句子表示一個(gè)“任命”事件。該事件模式有二個(gè)元組組成,它們是在從句中充當(dāng)主語(yǔ)的元組 CPerson 和從句中的動(dòng)詞短語(yǔ)元組 CResign。人工給出描述事件信息的文本,系統(tǒng)對(duì)該文本進(jìn)行句法分析。第一部分是規(guī)則的觸發(fā)條件,它由一個(gè)或多個(gè)條件組成,詳細(xì)描述了條件具備的要素。例如,管理職位繼任信息抽取任務(wù),給出的兩個(gè)種子 IE 模式如圖 所示。模式 p 的領(lǐng)域相關(guān)度在首次循環(huán)時(shí)的計(jì)算公式為:2( p ) ( H ( p ) / ( p ) * l o g ( p )s c o r e R H H R? ? ?,其中, H(p)是其中出現(xiàn)模式 p 的文檔集合。 5)轉(zhuǎn) 1),直到不再生成新的模式或某種循環(huán)條件達(dá)到為止。 l)設(shè)人工給出的事件語(yǔ)句為 “ The National Technology Group has a need for qualified Inventory Specialists to work at an RTP client site for one month.” R1:Mat
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1