freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

現(xiàn)代漢語語法信息詞典的開發(fā)與應用-免費閱讀

2025-08-28 18:03 上一頁面

下一頁面
  

【正文】 北大計算語言學研究所的張蕓蕓、郭濤、周強、陶曉鵬、詹衛(wèi)東、周莉娜等人或者是在詞典本身的開發(fā)中或者是在詞典的應用中都為本項研究貢獻了力量。而且,標注了詞性的語料庫與語法信息詞典相結合,可以構成立體的知識庫,即從語料中的詞/詞性入口,可以迅速檢索到該詞的諸多語法特性,從而為進一步的分析或標注提供豐富的知識。在進行這種標注時,語法詞典可以發(fā)揮重要的作用。由于“pi2pa5”對應兩個同音詞“琵琶”和“枇杷”,某些系統(tǒng)轉換出 桌子上有一斤琵琶 。 她是一個美麗姑娘。圖1 句子(1)與(2)的句法樹 r v r v n (3)根據(jù)上下文無關的語法規(guī)則,這樣的詞類序列可以產生多種句法樹。 基礎研究與應用研究相結合,以基礎研究為主北大計算語言學研究所在八五期間始終將語法詞典的開發(fā)列為工作的重點,尤其是課題組的主要成員,更是全身心地投入了這項開發(fā)工作,以全局利益和長遠利益為重,堅持做底層的基礎的工作。語法詞典就是將這些專家的知識以形式化、規(guī)格化的方式存儲到計算機系統(tǒng)中。3. 現(xiàn)代漢語語法信息詞典的設計思想 通用與專用相結合,以通用為主在自然語言處理系統(tǒng)中,通常都有一部包括詞法、句法、語義信息的機器詞典,但由于這類詞典是服務于特定目的與特定系統(tǒng)的,為了把它從一個系統(tǒng)移植到另一個系統(tǒng)時需要花費很大力氣,人們往往寧愿另起爐灶。第二類是關于動詞變化形態(tài)的,如有沒有VV、ABAB、AABB、V一V、V了V等形態(tài)。 詞語的屬性描寫分類法刻劃事物雖然簡潔、清晰、信息密度大,但屬于同一類的事物仍可能各具特點,例如“魚”和“?!蓖瑢賯€體名詞,因為“魚”有專用個體量詞“尾”,“?!庇袑S脗€體量詞“頭”。了過過體雙著了過VV體準語法詞典介于上述兩種辦法之間,是在應用需求與客觀條件之間進行權衡與折衷的實際可行的策略?!丁? 、!“”為了分析實際文本的需要,現(xiàn)代漢語詞語功能分類體系共包括了26個不同的詞語類別。(2)建立了面向信息處理的現(xiàn)代漢語詞語分類體系并完成了關于這個分類體系的研究報告[6];(3)明確了詞語的收錄范圍與選詞原則[7];(4)探討了某些詞類的子類劃分[8];(5)語法詞典本身的開發(fā),這當然是最繁重、最艱巨的任務。 作為中國七五攻關項目“自然語言理解與人機接口”中的一個子專題,俞士汶于1987年提出了開發(fā)“現(xiàn)代漢語詞語語法信息庫”的計劃[2] ,把研究重點放在詞語語法屬性的描述上。關鍵詞:現(xiàn)代漢語、語法信息詞典、機器詞典、自然語言處理【摘要】現(xiàn)代漢語語法信息詞典是為計算機實現(xiàn)漢語句子的自動分析與自動生成開發(fā)的一部機器詞典,它以數(shù)據(jù)庫文件形式收錄了5萬多條現(xiàn)代漢語的詞語,不僅給出了每個詞語所屬的詞類,而且詳細描述了它們的各種語法屬性。參考文獻[1]深入淺出地介紹了這個方案的原理與實現(xiàn)技術。這個大型語言工程將現(xiàn)代漢語語法信息詞典(以下有時簡稱為“語法詞典”)列為它的一個子專題。另外,北大計算語言學研究所與中國科學院計算所聯(lián)合開發(fā)“漢英機器翻譯模型系統(tǒng)”,與北京通字公司聯(lián)合開發(fā)“面向通用圖像碼的自然語言生成系統(tǒng)”,與自然科學基金項目配合,開發(fā)漢語語料庫多級標注系統(tǒng)[9],這些應用系統(tǒng)利用了語法詞典的信息。其中名詞、時間詞、處所詞、方位詞、數(shù)詞、量詞可以歸并為體詞(其主要語法功能是作主語、賓語),動詞、形容詞、狀態(tài)詞可以歸并為謂詞(其主要語法功能是作謂語),代詞有一部分屬于體詞(如:你、我、這兒、哪里等),又有一部分屬于謂詞(如:這樣、那么、怎么樣等)。這種規(guī)則系統(tǒng)抽象程度高,適合于描述詞類與詞類之間的組合關系。所有詞的共同屬性容納在總庫中,總庫中的屬性包括讀音、詞類、切分標記、姓氏標記等,共計約20項。體體謂謂幫這樣,整個信息庫形成了層次構造的體系。例如,對于作為研究重點的動詞共確定了46項屬性。如果能帶賓語,則進一步細分能帶什么樣的賓語:體詞,謂詞,雙賓等。北大計算語言學研究所還建立了面向語法研究的語料庫,并對其中一部分(約70萬字)進行了切分與標注。4. 現(xiàn)代漢語語法詞典應用例解如: 我們 選舉 他 當 主席。NP VP NP VP r v NP VP r v SC 正因為如此,現(xiàn)在對漢語的句子生成投入的力量是不夠的。只要利用這些平凡的知識,則能生成更自然的句子“她是一個美麗的姑娘”或“她是一個漂亮姑娘”。采用拼音方式從鍵盤上輸入中文所要解決的問題也是拼音序列到漢字序列的轉換。又假定系統(tǒng)已確認對應“jiayi”的詞是“加以”,接著輸入“yanjiu”。因此,系統(tǒng)就會
點擊復制文檔內容
物理相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1