freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

現(xiàn)代漢語語法信息詞典的開發(fā)與應用-文庫吧

2025-07-20 18:03 本頁面


【正文】 充分的。對于開發(fā)者來說,這當然是莫大的安慰與鼓勵。另外,北大計算語言學研究所與中國科學院計算所聯(lián)合開發(fā)“漢英機器翻譯模型系統(tǒng)”,與北京通字公司聯(lián)合開發(fā)“面向通用圖像碼的自然語言生成系統(tǒng)”,與自然科學基金項目配合,開發(fā)漢語語料庫多級標注系統(tǒng)[9],這些應用系統(tǒng)利用了語法詞典的信息。語法詞典為這些應用系統(tǒng)取得階段性成果也作出了貢獻。 總之,現(xiàn)代漢語語法信息詞典的開發(fā)已取得階段性成果,并且在若干自然語言處理應用系統(tǒng)開發(fā)中得到了利用。2. 現(xiàn)代漢語語法信息詞典的內容概要 詞語的分類詞語的分類既是任何一個自然語言處理系統(tǒng)的基礎也是語法信息詞典開發(fā)的基礎。因為語法詞典既要描述每類詞都有的共同的語法屬性,又要分別描述各類詞特有的語法屬性,只有這樣,語法信息才會充分、完備,而又不致過于冗余。語法詞典的詞類體系是在朱德熙先生的語法理論指導下,依據(jù)詞的語法功能建立的,現(xiàn)代漢語詞語可劃分為以下18個基本詞類:名 詞(n) 如:書、水、教授、國家、心胸、北京時間詞(t) 如:明天、元旦、唐朝、現(xiàn)在、春天處所詞(s) 如:空中、低處、郊外、隔壁方位詞(f) 如:上、下、前、后、東、西、南、北、里面、外頭、中間數(shù)詞(m) 如:一、第一、千、零、許多、分之量 詞(q) 如:個、群、公斤、杯、片、種、些區(qū)別詞(b) 如:男、女、公共、微型、初級代 詞(r) 如:你、我們、這、那么、哪兒、誰 動 詞(v) 如:走、休息、同意、能夠、出去、是、調查形容詞(a) 如:好、紅、大、溫柔、美麗、突然狀態(tài)詞(z) 如:雪白、金黃、淚汪汪、滿滿當當、灰不溜秋副詞(d) 如:不、很、都、剛剛、難道、忽然介 詞(p) 如:把、被、對于、關于、以、按照連 詞(c) 如:和、與、或、雖然、但是、否則助 詞(u) 如:了、著、過、的、所、似的語氣詞(y) 如:嗎、呢、吧、嘛、啦、唄擬聲詞(o) 如:嗚、啪、叮呤當啷、嘩啦嘆 詞(e) 如:唉、喔、哎喲、嗯、啊括號中的英文字母是各個詞類的代碼。這18個基本詞類是被多數(shù)語言學家認可的。其中名詞、時間詞、處所詞、方位詞、數(shù)詞、量詞可以歸并為體詞(其主要語法功能是作主語、賓語),動詞、形容詞、狀態(tài)詞可以歸并為謂詞(其主要語法功能是作謂語),代詞有一部分屬于體詞(如:你、我、這兒、哪里等),又有一部分屬于謂詞(如:這樣、那么、怎么樣等)。體詞、謂詞、區(qū)別詞、副詞又合稱為實詞,而介詞、連詞、助詞、語氣詞合稱為虛詞。在實際文本中出現(xiàn)的詞語,除了屬于以上18個基本詞類的以外,還存在比基本詞類要大的單位,如:成 語(i) 如:空中樓閣、畫龍點睛、字字珠璣、一衣帶水習用語(l) 如:總而言之、自古以來、跑龍?zhí)?、擺花架子簡稱略語(j) 如:北大、數(shù)理化、總參、三好、農牧業(yè)也存在比基本詞類更小的單位,如:前接成分(h) 如:阿(~妹)、老(~張)、偽(~指令)后接成分(k) 如:子(桌~)、兒(花~)、頭(石~)、式、員語 素 字(g) 如:碧、棉、賓、潔、農、怒非語素字(x) 如:鴛、鴦、葡、萄、咖、啡中文的標點符號(w) 如:。,《》 、!“”為了分析實際文本的需要,現(xiàn)代漢語詞語功能分類體系共包括了26個不同的詞語類別?,F(xiàn)在已完成了語法詞典收錄的5萬詞語的歸類工作。 語法詞典的結構與形態(tài)語法詞典采用成熟的關系數(shù)據(jù)庫技術,結合使用分類與屬性描述兩種方法,對5萬詞語建立了分級的語法屬性庫。每一個庫文件都刻劃了詞語及其屬性的二維關系。長期以來,自然語言處理技術都是應用規(guī)則系統(tǒng)描述語言的語法規(guī)律。這種規(guī)則系統(tǒng)抽象程度高,適合于描述詞類與詞類之間的組合關系。但是自然語言極其復雜,每個詞語都有自己的特性,規(guī)則系統(tǒng)是難以應付大范圍的實際語料的復雜性的。面向實際語料中詞與詞的同現(xiàn)關系的統(tǒng)計學研究是一個有前途的新方向,但統(tǒng)計的數(shù)據(jù)量非常大,需要強大的計算機系統(tǒng)甚至超并行計算機系統(tǒng)的支持。語法詞典介于上述兩種辦法之間,是在應用需求與客觀條件之間進行權衡與折衷的實際可行的策略。詞典中共有32個數(shù)據(jù)庫文件。總庫1個。各類詞庫24個(嘆詞、象聲詞、非語素字現(xiàn)未另建庫)。代詞庫下又設兩個庫,即人稱代詞、指示 / 疑問代詞分庫,動詞庫下又設體賓動詞、謂賓動詞、雙賓動詞、動結式、動趨式、離合詞等6個分庫。所有詞的共同屬性容納在總庫中,總庫中的屬性包括讀音、詞類、切分標記、姓氏標記等,共計約20項。各類詞的特有屬性填在各類詞的庫中。以動詞為例,動詞庫中列出了46項屬性,表1是動詞屬性庫中部分屬性的樣例。表1. 動詞屬性庫中部分屬性的樣例詞語同形義項助動外內體謂準雙賓著了過重疊VVO離合單作謂語單作補語兼類交給體雙了理發(fā)內了過VVO離可會A見面體著了過VV
點擊復制文檔內容
物理相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1