freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

關(guān)于現(xiàn)代漢語詞語的語法功能分類(已修改)

2024-11-15 01:54 本頁面
 

【正文】 第一篇:關(guān)于現(xiàn)代漢語詞語的語法功能分類關(guān)于現(xiàn)代漢語詞語的語法功能分類俞士汶關(guān)鍵詞:語言信息處理、現(xiàn)代漢語、詞類、語法功能在朱德熙先生的語法理論的指導(dǎo)下, 北大計(jì)算語言學(xué)研究所與中文系合作, 經(jīng)過幾年的研究, 提出了一個(gè)服務(wù)于語言信息處理的現(xiàn)代漢語詞語分類體系, 并將五萬多條的詞語實(shí)際進(jìn)行了歸類, 與此同時(shí)還按類詳細(xì)描述了每個(gè)詞語的多種語法屬性, 初步建成了“現(xiàn)代漢語語法信息詞典”, 另外對(duì)數(shù)十萬字的語料進(jìn)行了切分和詞性標(biāo)注。這就又進(jìn)一步檢驗(yàn)了詞類劃分的科學(xué)性與可操作性。達(dá)到如此規(guī)模和如此深度的漢語語言工程實(shí)踐可能是罕見的。本文介紹現(xiàn)代漢語詞語分類體系、分類的理論基礎(chǔ), 并以若干詞類為例詳細(xì)介紹具體的劃類準(zhǔn)則?,F(xiàn)代漢語的詞分為以下18個(gè)基本詞類, 括號(hào)中的拉丁字母是各類詞的代碼。名詞(n), 時(shí)間詞(t), 處所詞(s), 方位詞(f), 數(shù)詞(m), 量詞(q), 區(qū)別詞(b), 代詞(r), 動(dòng)詞(v), 形容詞(a), 狀態(tài)詞(z), 副詞(d), 介詞(p), 連詞(c), 助詞(u), 語氣詞(y), 擬聲詞(o), 嘆詞(e)。這些基本詞類可以合并為較大的詞類。名詞、時(shí)間詞、處所詞、方位詞、數(shù)詞、量詞統(tǒng)稱為體詞, 動(dòng)詞、形容詞、狀態(tài)詞統(tǒng)稱為謂詞。有一部分代詞屬于體詞, 另一部分代詞屬于謂詞。體詞、謂詞、區(qū)別詞和副詞又合稱為實(shí)詞。介詞、連詞、助詞、語氣詞合稱為虛詞。實(shí)詞與虛詞是漢語的兩大詞類。此外還有擬聲詞與嘆詞, 它們游離于這兩大詞類之外。自然語言處理的常規(guī)技術(shù)要求在自然語言處理系統(tǒng)中配備一部電子詞典。對(duì)于計(jì)算機(jī)系統(tǒng)來說, 可以認(rèn)為作為電子詞典的登錄項(xiàng)的語言單位是“詞”。其中大部分肯定是語言學(xué)家認(rèn)同的詞, 這也就是暗示了其中還有一部分不能看作“詞”。從計(jì)算機(jī)處理實(shí)際文本的需要出發(fā),從提高計(jì)算機(jī)處理效率的角度考慮,詞典中另外包含了以下7類語言成分: 前接成分(h): 阿, 老, 非, 超, 單 后接成分(k): 兒, 子, 性, 員, 器 語素字(g): 民, 衣, 失, 遙, 郝 非語素字(x): 鴛, 枇, 蚣成語(i): 按部就班, 八拜之交習(xí)用語(l): 總而言之, 由此可見 簡(jiǎn)稱略語(j): 三好, 全總前4類是比“詞”更小的單位,不成詞。這些成分的數(shù)量是有限的,只要電子詞典的規(guī)模允許,應(yīng)當(dāng)盡可能地將這些成分全部收入。后3類是比“詞”更大的單位, 詞典中只能收一部分使用頻率高的。本文將電子詞典中登錄的各種語言成分籠統(tǒng)地叫做“詞語”。以下行文中的“詞類”是就前面的18個(gè)基本詞類而言的, 有時(shí)也討論上述后7類語言成分。 分類的目的與依據(jù)為了進(jìn)行語法研究與信息處理, 需要把語法功能相同的或者相近的詞歸成一類。這里包含兩項(xiàng)工作。一項(xiàng)是要針對(duì)漢語詞語的全集, 按照某種標(biāo)準(zhǔn), 建立一個(gè)分類體系。第一章所介紹的就是面向信息處理的一種漢語詞語分類體系。另一項(xiàng)工作是決定該全集中的每一個(gè)詞語究竟屬于哪一個(gè)詞類, 這項(xiàng)工作可以叫“歸類”, 不過人們習(xí)慣上也在“歸類”的意義上使用“分類”這個(gè)術(shù)語。如果面向人的語言研究,詞語分類尚不十分迫切的話,那么面向計(jì)算機(jī)的語言研究, 詞語的語法分類及其代碼化幾乎是不可缺少的。詞語分類實(shí)際上是將最重要的語法知識(shí)與語法規(guī)則條理化, 從而為自然語言的分析與生成提供最重要的線索。劃分詞類的本質(zhì)根據(jù)只能是詞的語法功能。所謂詞的語法功能主要是指:(1)和某個(gè)或某類詞語組合的能力。(2)在句法結(jié)構(gòu)中充當(dāng)句法成分的能力。例如, 考察具有如下語法功能的詞。,但不能帶真賓語。如“個(gè)子高,教室安靜”中的“高, 安靜”是謂語。象“高三公分, 安靜了兩天” 中的數(shù)量短語 “三公分,兩天”是準(zhǔn)賓語,而不是真賓語?!昂堋币活惓潭雀痹~修飾,如“很高,挺安靜,特別雄偉”。,如“洗干凈,捆得結(jié)實(shí)”中的“干凈、結(jié)實(shí)”是補(bǔ)語。“地”后作狀中結(jié)構(gòu)中的狀語, 如“迅速提高, 安全地轉(zhuǎn)移”中的“迅速、安全”是狀語?!暗摹焙笞鞫ㄖ薪Y(jié)構(gòu)中的定語, 如“漂亮小姐, 挺拔的山峰”中的“漂亮、挺拔”是定語。 a +“不”+ a 的形式提問,如“硬不硬,痛苦不痛苦”。“著呢”,如“美著呢,痛快著呢”。::可將這樣的詞歸成一類, 起個(gè)名字叫“形容詞”, 并用一個(gè)代碼“a”表示。這樣, 如果判明了一個(gè)詞具有上述功能, 則可以將它歸入形容詞。反之, 如果能從漢語語法信息詞典查得某個(gè)詞的詞類代碼是“a”, 則知它很可能具有上述語法功能, 除非漢語語法信息詞典對(duì)其中某些詞的某些語法功能另有更準(zhǔn)確的描述。參照上述語法功能, 可以將形容詞同其它詞類區(qū)分開。如名詞不具備上述功能中的b,c, d, f, g, 一般地說,也不具備功能a。同時(shí)名詞的語法功能中也有一些是形容詞所不具備的。劃分漢語詞類的本質(zhì)依據(jù)就是這些語法功能的異同。劃分詞類的本質(zhì)依據(jù)只能是詞的語法功能, 詞的意義不能作為劃分詞類的依據(jù), 這與劃分詞類的目的是緊密相關(guān)的, 因?yàn)楸硎就惛拍畹脑~的語法功能并不一定相同。例如,“戰(zhàn)爭(zhēng)”與“打仗”指的是同一個(gè)概念, 可是“戰(zhàn)爭(zhēng)”是名詞, “打仗”是動(dòng)詞。漢語不象印歐語那樣有豐富的形態(tài), 也不能根據(jù)形態(tài)給漢語的詞語分類。在第1章描述的分類體系中,有一些詞類(如代詞、數(shù)詞、擬聲詞和嘆詞), 不是嚴(yán)格根據(jù)它們的語法功能分布劃分出來的。這種情況不會(huì)給詞類劃分理論造成困難。以代詞為例, 它是根據(jù)一個(gè)詞是否具有指代功能劃分出來的, 這實(shí)際上是語義范疇的功能。如果嚴(yán)格按功能劃分, 不妨細(xì)分為體詞性代詞(過去叫代名詞)和謂詞性代詞。現(xiàn)在仍將它們歸入一類, 是為了同傳統(tǒng)的說法銜接,同時(shí)也適合信息處理的需要。 關(guān)于分類問題的若干說明 詞的同一性問題 雖然說劃分詞類不是依據(jù)意義, 但是需要認(rèn)識(shí)到, 劃分詞類只能在確定了詞的同一性的基礎(chǔ)上進(jìn)行。所謂同一性指的是在不同的語言環(huán)境中出現(xiàn)的詞形相同的若干個(gè)詞應(yīng)該算同一個(gè)詞還是應(yīng)該算不同的詞。書面漢語的同形詞限定為漢字相同的詞, 也可以直接叫做同字詞。同字詞又可分為同字異音詞與同字同音詞。如“好人好事”中的“好”與“好管閑事”的“好”是同字異音詞, 而“很好”與“好狠”中的“好”卻是同字同音詞。同字異音詞當(dāng)然是不同的詞。因此, 同一性問題的研究對(duì)象是同字同音詞。例1 門上掛著一把鎖。例2 請(qǐng)把門鎖好。例1與例2中的兩個(gè)“鎖”的意義區(qū)別很明顯, 并且語法功能也有明顯的不同, 因而有理由說它們是不同的兩個(gè)詞, 一個(gè)屬名詞, 另一個(gè)屬動(dòng)詞。例3 村里死了一口豬。例4 這個(gè)辦法很死。例3中的“死”是失去生命的意思,可以帶體詞性賓語, 例4中的“死”是呆板、不靈活的意思, 可以受“很”一類程度副詞修飾。如果認(rèn)為“失去生命”與“不靈活”就是不同的意思, 那就可以認(rèn)為例3與例4中的兩個(gè)“死”是不同的詞,一個(gè)是動(dòng)詞,一個(gè)是形容詞。如果認(rèn)為“不靈活”的意思是由“失去生命”的意思引申出來的,把例3與例4的兩個(gè)“死”看成同一個(gè)詞,這時(shí)就需要把有關(guān)“死”的種種語法功能合在一起, 由此來確定“死”的詞類, 采取這種觀點(diǎn), “死”兼屬動(dòng)詞和形容詞這兩類詞。不過, 對(duì)于計(jì)算機(jī)來說, 在句法分析的范圍內(nèi), 只要能在電子詞典中查到“鎖”既是名詞又是動(dòng)詞, “死”既是動(dòng)詞又是形容詞就達(dá)到要求了。至于分屬名詞與動(dòng)詞的“鎖”, 分屬動(dòng)詞與形容詞的“死”是兩個(gè)不同的詞還是同一詞兼屬不同詞類的區(qū)別就不那么重要了。 各類詞的劃類準(zhǔn)則既然劃分詞類的本質(zhì)依據(jù)只能是詞的語法功能, 那么在確定各類詞的分類標(biāo)準(zhǔn)時(shí), 是否都要列舉各類詞的全部語法功能呢? 這是不必要的, 也是不可能的。因?yàn)槿空Z法功能中當(dāng)然也包括了這一類詞與其它類詞的某些相同的語法功能, 而這些相同的語法功能對(duì)劃分詞類是沒有作用的。劃分詞類時(shí)必須注意不同詞類之間那些互相有區(qū)別的特征, 即各個(gè)詞類的語法特點(diǎn)。在進(jìn)行將具體的一個(gè)詞劃歸某個(gè)詞類的實(shí)際操作時(shí), 檢驗(yàn)該詞是否具備該類詞的全部語法特點(diǎn)往往也是不容易的, 通常只要抓住最重要的語法特點(diǎn)即可。例如,(當(dāng)然還不是全部), 其中象“做定語”這樣的功能就算不上是形容詞的語法特點(diǎn), 因?yàn)槊~、動(dòng)詞同樣可以做定語。形容詞的劃類準(zhǔn)則可以選這樣兩條: ;“很”修飾。選擇分類標(biāo)準(zhǔn)的原則應(yīng)當(dāng)是由此建立起來的詞類, 其所屬的詞語在語法功能上要有足夠多的共同點(diǎn), 同時(shí)跟別的詞類又要有足夠多的不同點(diǎn)。劃類標(biāo)準(zhǔn)也不是絕對(duì)的, 不是一成不變的。若選擇的劃類標(biāo)準(zhǔn)不同, 建立的詞語分類體系也會(huì)有所不同。不同類的詞之間必須要有相互區(qū)別的語法特點(diǎn), 但不是說不同類的詞之間毫無共同之處。動(dòng)詞與形容詞都可以做謂語, 后面都可以接“了”及趨向動(dòng)詞“起來”, 就是它們共同的語法功能。如果以這些共同的語法功能作為劃類標(biāo)準(zhǔn), 則可以將動(dòng)詞與形容詞(還包括狀態(tài)詞)合并為一個(gè)更大的類, 即謂詞。 典型性問題在一個(gè)確定的分類體系中, 同類的詞有共同的語法功能,但不等于說,同類的詞的語法功能完全相同。對(duì)于任何一種自然語言, 實(shí)際可行的、有價(jià)值的分類只能做到把語法功能相同或相近的詞歸在一起。這樣一來,同類的詞,有些是典型的, 符合分類的全部標(biāo)準(zhǔn)或最重要的標(biāo)準(zhǔn),有些是不典型的,只符合其中一部分標(biāo)準(zhǔn)。例如, “蘋果、水泥、勇氣、心胸”都是名詞, 它們的共同特征是能做句子的主語與賓語,不受副詞修飾。一般地說,名詞可以受數(shù)量詞修飾, 不過量詞的類型又有差別。如修飾“蘋果”的數(shù)量結(jié)構(gòu)中的量詞可以是個(gè)體量詞、度量詞、容器量詞與種類量詞等, 與“水泥”搭配的就沒有個(gè)體量詞, 與“勇氣”搭配的只有種類量詞和不定量詞,而“心胸”卻不能受任何數(shù)量結(jié)構(gòu)或數(shù)詞修飾。在列舉各個(gè)詞類的劃類準(zhǔn)則時(shí),應(yīng)盡可能地把那些重要的列在前面。當(dāng)判斷一個(gè)具體的詞是否屬于某個(gè)詞類時(shí), 就可以看它是否符合這些判斷標(biāo)準(zhǔn)。越符合多項(xiàng)標(biāo)準(zhǔn)或者前面的標(biāo)準(zhǔn), 越是該類典型的詞。反之, 雖將一個(gè)詞劃入了該類, 但它只符合少數(shù)幾項(xiàng)標(biāo)準(zhǔn)或者只符合較后面的標(biāo)準(zhǔn), 那么這個(gè)詞在該類中就不是典型的。這也是語言現(xiàn)象的模糊性的一種表現(xiàn)。 詞語的兼類在“”中已經(jīng)涉及了詞的兼類, 這里更集中地討論一下這個(gè)問題。詞的兼類指的是如果同字同音同義的同一個(gè)詞具有不同詞類的語法功能,則認(rèn)為這個(gè)詞兼屬不同的詞類,簡(jiǎn)稱兼類。兼類問題可用表征形容詞與動(dòng)詞關(guān)系的圖1來說明。在圖1中,左邊的圓代表形容詞的集合,右邊的圓代表動(dòng)詞的集合。這兩個(gè)圓不相重合部分分別用a,v表示,相重合的陰影部分用$表示。形容詞與動(dòng)詞雖然都是謂詞,但它們有相互區(qū)別的語法特點(diǎn),如形容詞可以受“很”修飾且不能帶真賓語,而動(dòng)詞或者不能受“很”修飾或者能帶真賓語。根據(jù)這些語法特點(diǎn),可以把絕大部分形容詞與動(dòng)詞區(qū)分開來。但是,漢語中確實(shí)有一些詞處于兩個(gè)圓重合的陰影部分, 如“端正,鞏固,方便,壯大,繁榮,豐富”等,這些詞既具有形容詞的語法功能,又具有動(dòng)詞的語法功能,并且看不出它們作為形容詞或者作為動(dòng)詞,在意義上有什么區(qū)別。因此,本研究報(bào)告認(rèn)為這些詞兼屬形容詞與動(dòng)詞。前面已經(jīng)提到,劃類標(biāo)準(zhǔn)有一定的相對(duì)性。仍以圖1為例,關(guān)于a,v,$可以有以下4種處理意見。(一)將a,v,$各自處理成獨(dú)立的類,這就需要為$起個(gè)合適的名字。本研究報(bào)告維持已經(jīng)劃定了的18個(gè)基本詞類的穩(wěn)定性,不主張這樣做。(二)將陰影部分$與a合并,形容詞的集合就是左邊的完整的圓。動(dòng)詞的集合只剩下v, 動(dòng)詞集合內(nèi)的各個(gè)元素間語法功能的一致性就加大了。(三)與(二)反過來,將$與v合并。動(dòng)詞的集合就是右邊的完整的圓。形容詞的集合只剩下了a。(四)a為形容詞, v為動(dòng)詞, $為兼類,既是形容詞的子集,又是動(dòng)詞的子集。反映在漢語語法信息詞典中就是將同一個(gè)詞如“端正,鞏固,方便??”區(qū)分成兩個(gè)登錄項(xiàng)(即詞語), 分別歸入形容詞與動(dòng)詞。如果將a,v,$抽象為任意兩個(gè)不同的詞類及它們的交集,那么在以上4種處理意見中,究竟哪一種更妥當(dāng)一些呢? 這不能一概而論。對(duì)形容詞與動(dòng)詞的交集中的 “端正, 鞏固, 方便??”這些詞,本研究報(bào)告采用了第4種處理意見,但不等于說,對(duì)其它詞類也一律這么辦。在劃分詞類中, 應(yīng)當(dāng)確立這樣一條原則, 即在整個(gè)詞類系統(tǒng)中,只有少數(shù)詞是兼類的。這條原則同樣適合電子詞典的開發(fā), 因?yàn)閳?jiān)持這個(gè)原則可以保證詞典的冗余度小。與“端正,鞏固,方便??”這些詞相似,象“研究,教育,批評(píng),建設(shè),團(tuán)結(jié)”這一類兼有動(dòng)詞與名詞的功能,但這類詞在動(dòng)詞中的比重較大,本技術(shù)報(bào)告不將它們看作兼類,只將它們劃歸動(dòng)詞,是動(dòng)詞的一個(gè)特殊的子類,叫“名動(dòng)詞”,在電子詞典中有關(guān)這些動(dòng)詞的名詞特性另列專門的語法屬性字段加以描述。關(guān)于種種兼類現(xiàn)象,本技術(shù)報(bào)告在第3章“各類詞的劃分方法及有關(guān)說明”中將具體介紹。前面已經(jīng)指出“一把鎖”中的指物的“鎖”與“鎖門”中的指行為動(dòng)作的“鎖”是兩個(gè)不同的詞,在漢語語法信息詞典中,在名詞“鎖”的記錄中需指明還有一個(gè)同字同音的動(dòng)詞“鎖”, 同樣在動(dòng)詞“鎖”記錄中也需要指明另有一個(gè)同字同音的名詞的“鎖”。應(yīng)該首先區(qū)分漢語中的實(shí)詞與虛詞,繼之區(qū)分實(shí)詞中的體詞與謂詞, 然后再逐一說明各個(gè)基本詞語類別的劃分準(zhǔn)則。限于篇幅, 這里只能選擇若干詞類作為例子加以介紹。名詞是最重要的一類體詞。大多數(shù)語法論著認(rèn)為時(shí)間詞、處所詞、方位詞是名詞的子類。本文介紹的分類體系將它們處理成與名詞平行的類,下面只以時(shí)間詞與方位詞為例。在謂詞中, 本文只介紹從形容詞中分化出來的狀態(tài)詞。本文還介紹了實(shí)詞中的區(qū)別詞。對(duì)于虛詞, 本文只選了介詞。另外,對(duì)前接成分、后接成分、語素字、非語素字也作了說明。 時(shí)間詞(1)時(shí)間詞是從名詞中分化出來的一類體詞,如“昨天,現(xiàn)在,今后, 宋朝”等。(2)時(shí)間詞能做“在”、“到”和“等到”的賓語。(3)時(shí)間詞可用“什么時(shí)候”、“這(個(gè))時(shí)候”或“那(個(gè))時(shí)候”提問或指代。(4)普通時(shí)間詞可以作狀語,且作狀語時(shí)無需加“地”,也不能加“地”。如“我昨天看了電影”。專有時(shí)間詞,象“宋朝”,不能單獨(dú)作狀語。(5)時(shí)間詞都表示時(shí)間。但語義與時(shí)間有關(guān)的詞不一定是時(shí)間詞。如“時(shí)間、時(shí)候、功夫” 是名詞(雖然可以說:“時(shí)間到了”但不能說“在時(shí)間”或“等到時(shí)間”), “已經(jīng),剛,忽然”是副詞,“半天,三年”是數(shù)量詞(組)。(6)時(shí)間詞通常表示“時(shí)點(diǎn)”, 即時(shí)間的位置或早晚,當(dāng)然,這里說的“時(shí)點(diǎn)”并不是數(shù)學(xué)中時(shí)間軸上的一個(gè)點(diǎn)。而表示“時(shí)量”(即時(shí)間的長(zhǎng)短
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1