【正文】
and preservation.The paper will describe and discuss over the design and realization of this interactive text tagging tool. Firstly, detailed theoretical backgrounds will be given。首先對(duì)背景及理論知識(shí)作了具體的介紹。這樣一來(lái)就需要開(kāi)發(fā)一個(gè)具有友好的人機(jī)交互界面的文本標(biāo)注工具來(lái)輔助文本標(biāo)注,在一定程序上減輕標(biāo)注工作者的負(fù)擔(dān)。開(kāi)發(fā)人機(jī)交互的標(biāo)注工具設(shè)計(jì)畢業(yè)論文目 錄目 錄 2摘要 2Abstract 3第一章 緒 論 11.1 前言 11.2 研究背景 1 1 21.3開(kāi)發(fā)人機(jī)交互的標(biāo)注工具的意義 31.4任務(wù)描述 31.5論文的組織和安排 3第二章 標(biāo)注工具的設(shè)計(jì)原則和設(shè)計(jì)思想 52.1研究方法和指導(dǎo)思想 52.2標(biāo)注工具的設(shè)計(jì)原則 5 文本標(biāo)注工具的設(shè)計(jì)原則 52.3 人機(jī)交互界面設(shè)計(jì)原則 5第三章 標(biāo)注工具的具體開(kāi)發(fā) 53.1開(kāi)發(fā)環(huán)境的選擇 53.2標(biāo)注工具的設(shè)計(jì) 5 5 53.3 標(biāo)注工具的詳細(xì)設(shè)計(jì) 6 6 63.4標(biāo)注過(guò)程文本的處理 6 6 6 63.5 標(biāo)注結(jié)果 63.6技術(shù)難點(diǎn)討論 6第四章 標(biāo)注工具的缺陷分析和功能展望 7結(jié)束語(yǔ) 2致謝 2參考文獻(xiàn) 2人機(jī)交互文本標(biāo)注工具開(kāi)發(fā) 作者: *** 指導(dǎo)教師:*****(指導(dǎo)教師職稱)摘要:基于內(nèi)容的文本信息提取是當(dāng)前的一個(gè)研究熱點(diǎn),無(wú)論搜索引擎還是問(wèn)答系統(tǒng),其根本的基礎(chǔ)是有效的獲取文本中的信息。這次文本標(biāo)注工具的設(shè)計(jì),處理的目標(biāo)是純文本文件,以一篇文檔為單位提供用戶進(jìn)行實(shí)體,事件,關(guān)系的標(biāo)注,并在標(biāo)注過(guò)程中給出標(biāo)注的中間結(jié)果,最后在保存標(biāo)注文件的時(shí)候進(jìn)行處理,以xml語(yǔ)言格式進(jìn)行輸出存儲(chǔ)。然后,分別進(jìn)行文本標(biāo)注工具的系統(tǒng)分析、總體架構(gòu)分析,并對(duì)每個(gè)模塊的具體實(shí)現(xiàn)做詳細(xì)地講解。 secondly, analysis of this tool and general structure for it and the full descriptions about the realization of each model will be introduced。 開(kāi)發(fā)界面友好的標(biāo)注工具可以進(jìn)一步的提高標(biāo)注工作者的效率,同時(shí)結(jié)構(gòu)化的輸出更方便標(biāo)注數(shù)據(jù)的后續(xù)使用。一般來(lái)說(shuō),信息抽取系統(tǒng)的處理對(duì)象是自然語(yǔ)言文本尤其是非結(jié)構(gòu)化文本。由于語(yǔ)言本身的復(fù)雜性和富含信息的特點(diǎn),使得語(yǔ)料庫(kù)標(biāo)注的內(nèi)容、對(duì)象可以在語(yǔ)法、語(yǔ)義、語(yǔ)用等各個(gè)層次上進(jìn)行,語(yǔ)料庫(kù)標(biāo)注的內(nèi)容和程度,從根本上決定了從文本中可以提取出的信息內(nèi)容和信息粒度,也決定了進(jìn)行文本內(nèi)容計(jì)算的對(duì)象、方法。表達(dá)這些信息的語(yǔ)言形式是豐富多樣的,我們將其稱為意義單元。