freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

現(xiàn)代漢語語法信息詞典的開發(fā)與應(yīng)用-免費(fèi)閱讀

2025-08-28 18:03 上一頁面

下一頁面
  

【正文】 北大計(jì)算語言學(xué)研究所的張蕓蕓、郭濤、周強(qiáng)、陶曉鵬、詹衛(wèi)東、周莉娜等人或者是在詞典本身的開發(fā)中或者是在詞典的應(yīng)用中都為本項(xiàng)研究貢獻(xiàn)了力量。而且,標(biāo)注了詞性的語料庫(kù)與語法信息詞典相結(jié)合,可以構(gòu)成立體的知識(shí)庫(kù),即從語料中的詞/詞性入口,可以迅速檢索到該詞的諸多語法特性,從而為進(jìn)一步的分析或標(biāo)注提供豐富的知識(shí)。在進(jìn)行這種標(biāo)注時(shí),語法詞典可以發(fā)揮重要的作用。由于“pi2pa5”對(duì)應(yīng)兩個(gè)同音詞“琵琶”和“枇杷”,某些系統(tǒng)轉(zhuǎn)換出 桌子上有一斤琵琶 。 她是一個(gè)美麗姑娘。圖1 句子(1)與(2)的句法樹 r v r v n (3)根據(jù)上下文無關(guān)的語法規(guī)則,這樣的詞類序列可以產(chǎn)生多種句法樹。 基礎(chǔ)研究與應(yīng)用研究相結(jié)合,以基礎(chǔ)研究為主北大計(jì)算語言學(xué)研究所在八五期間始終將語法詞典的開發(fā)列為工作的重點(diǎn),尤其是課題組的主要成員,更是全身心地投入了這項(xiàng)開發(fā)工作,以全局利益和長(zhǎng)遠(yuǎn)利益為重,堅(jiān)持做底層的基礎(chǔ)的工作。語法詞典就是將這些專家的知識(shí)以形式化、規(guī)格化的方式存儲(chǔ)到計(jì)算機(jī)系統(tǒng)中。3. 現(xiàn)代漢語語法信息詞典的設(shè)計(jì)思想 通用與專用相結(jié)合,以通用為主在自然語言處理系統(tǒng)中,通常都有一部包括詞法、句法、語義信息的機(jī)器詞典,但由于這類詞典是服務(wù)于特定目的與特定系統(tǒng)的,為了把它從一個(gè)系統(tǒng)移植到另一個(gè)系統(tǒng)時(shí)需要花費(fèi)很大力氣,人們往往寧愿另起爐灶。第二類是關(guān)于動(dòng)詞變化形態(tài)的,如有沒有VV、ABAB、AABB、V一V、V了V等形態(tài)。 詞語的屬性描寫分類法刻劃事物雖然簡(jiǎn)潔、清晰、信息密度大,但屬于同一類的事物仍可能各具特點(diǎn),例如“魚”和“?!蓖瑢賯€(gè)體名詞,因?yàn)椤棒~”有專用個(gè)體量詞“尾”,“?!庇袑S脗€(gè)體量詞“頭”。了過過體雙著了過VV體準(zhǔn)語法詞典介于上述兩種辦法之間,是在應(yīng)用需求與客觀條件之間進(jìn)行權(quán)衡與折衷的實(shí)際可行的策略?!丁? 、!“”為了分析實(shí)際文本的需要,現(xiàn)代漢語詞語功能分類體系共包括了26個(gè)不同的詞語類別。(2)建立了面向信息處理的現(xiàn)代漢語詞語分類體系并完成了關(guān)于這個(gè)分類體系的研究報(bào)告[6];(3)明確了詞語的收錄范圍與選詞原則[7];(4)探討了某些詞類的子類劃分[8];(5)語法詞典本身的開發(fā),這當(dāng)然是最繁重、最艱巨的任務(wù)。 作為中國(guó)七五攻關(guān)項(xiàng)目“自然語言理解與人機(jī)接口”中的一個(gè)子專題,俞士汶于1987年提出了開發(fā)“現(xiàn)代漢語詞語語法信息庫(kù)”的計(jì)劃[2] ,把研究重點(diǎn)放在詞語語法屬性的描述上。關(guān)鍵詞:現(xiàn)代漢語、語法信息詞典、機(jī)器詞典、自然語言處理【摘要】現(xiàn)代漢語語法信息詞典是為計(jì)算機(jī)實(shí)現(xiàn)漢語句子的自動(dòng)分析與自動(dòng)生成開發(fā)的一部機(jī)器詞典,它以數(shù)據(jù)庫(kù)文件形式收錄了5萬多條現(xiàn)代漢語的詞語,不僅給出了每個(gè)詞語所屬的詞類,而且詳細(xì)描述了它們的各種語法屬性。參考文獻(xiàn)[1]深入淺出地介紹了這個(gè)方案的原理與實(shí)現(xiàn)技術(shù)。這個(gè)大型語言工程將現(xiàn)代漢語語法信息詞典(以下有時(shí)簡(jiǎn)稱為“語法詞典”)列為它的一個(gè)子專題。另外,北大計(jì)算語言學(xué)研究所與中國(guó)科學(xué)院計(jì)算所聯(lián)合開發(fā)“漢英機(jī)器翻譯模型系統(tǒng)”,與北京通字公司聯(lián)合開發(fā)“面向通用圖像碼的自然語言生成系統(tǒng)”,與自然科學(xué)基金項(xiàng)目配合,開發(fā)漢語語料庫(kù)多級(jí)標(biāo)注系統(tǒng)[9],這些應(yīng)用系統(tǒng)利用了語法詞典的信息。其中名詞、時(shí)間詞、處所詞、方位詞、數(shù)詞、量詞可以歸并為體詞(其主要語法功能是作主語、賓語),動(dòng)詞、形容詞、狀態(tài)詞可以歸并為謂詞(其主要語法功能是作謂語),代詞有一部分屬于體詞(如:你、我、這兒、哪里等),又有一部分屬于謂詞(如:這樣、那么、怎么樣等)。這種規(guī)則系統(tǒng)抽象程度高,適合于描述詞類與詞類之間的組合關(guān)系。所有詞的共同屬性容納在總庫(kù)中,總庫(kù)中的屬性包括讀音、詞類、切分標(biāo)記、姓氏標(biāo)記等,共計(jì)約20項(xiàng)。體體謂謂幫這樣,整個(gè)信息庫(kù)形成了層次構(gòu)造的體系。例如,對(duì)于作為研究重點(diǎn)的動(dòng)詞共確定了46項(xiàng)屬性。如果能帶賓語,則進(jìn)一步細(xì)分能帶什么樣的賓語:體詞,謂詞,雙賓等。北大計(jì)算語言學(xué)研究所還建立了面向語法研究的語料庫(kù),并對(duì)其中一部分(約70萬字)進(jìn)行了切分與標(biāo)注。4. 現(xiàn)代漢語語法詞典應(yīng)用例解如: 我們 選舉 他 當(dāng) 主席。NP VP NP VP r v NP VP r v SC 正因?yàn)槿绱?,現(xiàn)在對(duì)漢語的句子生成投入的力量是不夠的。只要利用這些平凡的知識(shí),則能生成更自然的句子“她是一個(gè)美麗的姑娘”或“她是一個(gè)漂亮姑娘”。采用拼音方式從鍵盤上輸入中文所要解決的問題也是拼音序列到漢字序列的轉(zhuǎn)換。又假定系統(tǒng)已確認(rèn)對(duì)應(yīng)“jiayi”的詞是“加以”,接著輸入“yanjiu”。因此,系統(tǒng)就會(huì)
點(diǎn)擊復(fù)制文檔內(nèi)容
物理相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1