freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

關(guān)于現(xiàn)代漢語詞語的語法功能分類(已修改)

2024-11-15 01:54 本頁面
 

【正文】 第一篇:關(guān)于現(xiàn)代漢語詞語的語法功能分類關(guān)于現(xiàn)代漢語詞語的語法功能分類俞士汶關(guān)鍵詞:語言信息處理、現(xiàn)代漢語、詞類、語法功能在朱德熙先生的語法理論的指導(dǎo)下, 北大計算語言學(xué)研究所與中文系合作, 經(jīng)過幾年的研究, 提出了一個服務(wù)于語言信息處理的現(xiàn)代漢語詞語分類體系, 并將五萬多條的詞語實際進行了歸類, 與此同時還按類詳細描述了每個詞語的多種語法屬性, 初步建成了“現(xiàn)代漢語語法信息詞典”, 另外對數(shù)十萬字的語料進行了切分和詞性標(biāo)注。這就又進一步檢驗了詞類劃分的科學(xué)性與可操作性。達到如此規(guī)模和如此深度的漢語語言工程實踐可能是罕見的。本文介紹現(xiàn)代漢語詞語分類體系、分類的理論基礎(chǔ), 并以若干詞類為例詳細介紹具體的劃類準(zhǔn)則。現(xiàn)代漢語的詞分為以下18個基本詞類, 括號中的拉丁字母是各類詞的代碼。名詞(n), 時間詞(t), 處所詞(s), 方位詞(f), 數(shù)詞(m), 量詞(q), 區(qū)別詞(b), 代詞(r), 動詞(v), 形容詞(a), 狀態(tài)詞(z), 副詞(d), 介詞(p), 連詞(c), 助詞(u), 語氣詞(y), 擬聲詞(o), 嘆詞(e)。這些基本詞類可以合并為較大的詞類。名詞、時間詞、處所詞、方位詞、數(shù)詞、量詞統(tǒng)稱為體詞, 動詞、形容詞、狀態(tài)詞統(tǒng)稱為謂詞。有一部分代詞屬于體詞, 另一部分代詞屬于謂詞。體詞、謂詞、區(qū)別詞和副詞又合稱為實詞。介詞、連詞、助詞、語氣詞合稱為虛詞。實詞與虛詞是漢語的兩大詞類。此外還有擬聲詞與嘆詞, 它們游離于這兩大詞類之外。自然語言處理的常規(guī)技術(shù)要求在自然語言處理系統(tǒng)中配備一部電子詞典。對于計算機系統(tǒng)來說, 可以認為作為電子詞典的登錄項的語言單位是“詞”。其中大部分肯定是語言學(xué)家認同的詞, 這也就是暗示了其中還有一部分不能看作“詞”。從計算機處理實際文本的需要出發(fā),從提高計算機處理效率的角度考慮,詞典中另外包含了以下7類語言成分: 前接成分(h): 阿, 老, 非, 超, 單 后接成分(k): 兒, 子, 性, 員, 器 語素字(g): 民, 衣, 失, 遙, 郝 非語素字(x): 鴛, 枇, 蚣成語(i): 按部就班, 八拜之交習(xí)用語(l): 總而言之, 由此可見 簡稱略語(j): 三好, 全總前4類是比“詞”更小的單位,不成詞。這些成分的數(shù)量是有限的,只要電子詞典的規(guī)模允許,應(yīng)當(dāng)盡可能地將這些成分全部收入。后3類是比“詞”更大的單位, 詞典中只能收一部分使用頻率高的。本文將電子詞典中登錄的各種語言成分籠統(tǒng)地叫做“詞語”。以下行文中的“詞類”是就前面的18個基本詞類而言的, 有時也討論上述后7類語言成分。 分類的目的與依據(jù)為了進行語法研究與信息處理, 需要把語法功能相同的或者相近的詞歸成一類。這里包含兩項工作。一項是要針對漢語詞語的全集, 按照某種標(biāo)準(zhǔn), 建立一個分類體系。第一章所介紹的就是面向信息處理的一種漢語詞語分類體系。另一項工作是決定該全集中的每一個詞語究竟屬于哪一個詞類, 這項工作可以叫“歸類”, 不過人們習(xí)慣上也在“歸類”的意義上使用“分類”這個術(shù)語。如果面向人的語言研究,詞語分類尚不十分迫切的話,那么面向計算機的語言研究, 詞語的語法分類及其代碼化幾乎是不可缺少的。詞語分類實際上是將最重要的語法知識與語法規(guī)則條理化, 從而為自然語言的分析與生成提供最重要的線索。劃分詞類的本質(zhì)根據(jù)只能是詞的語法功能。所謂詞的語法功能主要是指:(1)和某個或某類詞語組合的能力。(2)在句法結(jié)構(gòu)中充當(dāng)句法成分的能力。例如, 考察具有如下語法功能的詞。,但不能帶真賓語。如“個子高,教室安靜”中的“高, 安靜”是謂語。象“高三公分, 安靜了兩天” 中的數(shù)量短語 “三公分,兩天”是準(zhǔn)賓語,而不是真賓語。“很”一類程度副詞修飾,如“很高,挺安靜,特別雄偉”。,如“洗干凈,捆得結(jié)實”中的“干凈、結(jié)實”是補語。“地”后作狀中結(jié)構(gòu)中的狀語, 如“迅速提高, 安全地轉(zhuǎn)移”中的“迅速、安全”是狀語。“的”后作定中結(jié)構(gòu)中的定語, 如“漂亮小姐, 挺拔的山峰”中的“漂亮、挺拔”是定語。 a +“不”+ a 的形式提問,如“硬不硬,痛苦不痛苦”?!爸亍?如“美著呢,痛快著呢”。::可將這樣的詞歸成一類, 起個名字叫“形容詞”, 并用一個代碼“a”表示。這樣, 如果判明了一個詞具有上述功能, 則可以將它歸入形容詞。反之, 如果能從漢語語法信息詞典查得某個詞的詞類代碼是“a”, 則知它很可能具有上述語法功能, 除非漢語語法信息詞典對其中某些詞的某些語法功能另有更準(zhǔn)確的描述。參照上述語法功能, 可以將形容詞同其它詞類區(qū)分開。如名詞不具備上述功能中的b,c, d, f, g, 一般地說,也不具備功能a。同時名詞的語法功能中也有一些是形容詞所不具備的。劃分漢語詞類的本質(zhì)依據(jù)就是這些語法功能的異同。劃分詞類的本質(zhì)依據(jù)只能是詞的語法功能, 詞的意義不能作為劃分詞類的依據(jù), 這與劃分詞類的目的是緊密相關(guān)的, 因為表示同類概念的詞的語法功能并不一定相同。例如,“戰(zhàn)爭”與“打仗”指的是同一個概念, 可是“戰(zhàn)爭”是名詞, “打仗”是動詞。漢語不象印歐語那樣有豐富的形態(tài), 也不能根據(jù)形態(tài)給漢語的詞語分類。在第1章描述的分類體系中,有一些詞類(如代詞、數(shù)詞、擬聲詞和嘆詞), 不是嚴格根據(jù)它們的語法功能分布劃分出來的。這種情況不會給詞類劃分理論造成困難。以代詞為例, 它是根據(jù)一個詞是否具有指代功能劃分出來的, 這實際上是語義范疇的功能。如果嚴格按功能劃分, 不妨細分為體詞性代詞(過去叫代名詞)和謂詞性代詞。現(xiàn)在仍將它們歸入一類, 是為了同傳統(tǒng)的說法銜接,同時也適合信息處理的需要。 關(guān)于分類問題的若干說明 詞的同一性問題 雖然說劃分詞類不是依據(jù)意義, 但是需要認識到, 劃分詞類只能在確定了詞的同一性的基礎(chǔ)上進行。所謂同一性指的是在不同的語言環(huán)境中出現(xiàn)的詞形相同的若干個詞應(yīng)該算同一個詞還是應(yīng)該算不同的詞。書面漢語的同形詞限定為漢字相同的詞, 也可以直接叫做同字詞。同字詞又可分為同字異音詞與同字同音詞。如“好人好事”中的“好”與“好管閑事”的“好”是同字異音詞, 而“很好”與“好狠”中的“好”卻是同字同音詞。同字異音詞當(dāng)然是不同的詞。因此, 同一性問題的研究對象是同字同音詞。例1 門上掛著一把鎖。例2 請把門鎖好。例1與例2中的兩個“鎖”的意義區(qū)別很明顯, 并且語法功能也有明顯的不同, 因而有理由說它們是不同的兩個詞, 一個屬名詞, 另一個屬動詞。例3 村里死了一口豬。例4 這個辦法很死。例3中的“死”是失去生命的意思,可以帶體詞性賓語, 例4中的“死”是呆板、不靈活的意思, 可以受“很”一類程度副詞修飾。如果認為“失去生命”與“不靈活”就是不同的意思, 那就可以認為例3與例4中的兩個“死”是不同的詞,一個是動詞,一個是形容詞。如果認為“不靈活”的意思是由“失去生命”的意思引申出來的,把例3與例4的兩個“死”看成同一個詞,這時就需要把有關(guān)“死”的種種語法功能合在一起, 由此來確定“死”的詞類, 采取這種觀點, “死”兼屬動詞和形容詞這兩類詞。不過, 對于計算機來說, 在句法分析的范圍內(nèi), 只要能在電子詞典中查到“鎖”既是名詞又是動詞, “死”既是動詞又是形容詞就達到要求了。至于分屬名詞與動詞的“鎖”, 分屬動詞與形容詞的“死”是兩個不同的詞還是同一詞兼屬不同詞類的區(qū)別就不那么重要了。 各類詞的劃類準(zhǔn)則既然劃分詞類的本質(zhì)依據(jù)只能是詞的語法功能, 那么在確定各類詞的分類標(biāo)準(zhǔn)時, 是否都要列舉各類詞的全部語法功能呢? 這是不必要的, 也是不可能的。因為全部語法功能中當(dāng)然也包括了這一類詞與其它類詞的某些相同的語法功能, 而這些相同的語法功能對劃分詞類是沒有作用的。劃分詞類時必須注意不同詞類之間那些互相有區(qū)別的特征, 即各個詞類的語法特點。在進行將具體的一個詞劃歸某個詞類的實際操作時, 檢驗該詞是否具備該類詞的全部語法特點往往也是不容易的, 通常只要抓住最重要的語法特點即可。例如,(當(dāng)然還不是全部), 其中象“做定語”這樣的功能就算不上是形容詞的語法特點, 因為名詞、動詞同樣可以做定語。形容詞的劃類準(zhǔn)則可以選這樣兩條: ;“很”修飾。選擇分類標(biāo)準(zhǔn)的原則應(yīng)當(dāng)是由此建立起來的詞類, 其所屬的詞語在語法功能上要有足夠多的共同點, 同時跟別的詞類又要有足夠多的不同點。劃類標(biāo)準(zhǔn)也不是絕對的, 不是一成不變的。若選擇的劃類標(biāo)準(zhǔn)不同, 建立的詞語分類體系也會有所不同。不同類的詞之間必須要有相互區(qū)別的語法特點, 但不是說不同類的詞之間毫無共同之處。動詞與形容詞都可以做謂語, 后面都可以接“了”及趨向動詞“起來”, 就是它們共同的語法功能。如果以這些共同的語法功能作為劃類標(biāo)準(zhǔn), 則可以將動詞與形容詞(還包括狀態(tài)詞)合并為一個更大的類, 即謂詞。 典型性問題在一個確定的分類體系中, 同類的詞有共同的語法功能,但不等于說,同類的詞的語法功能完全相同。對于任何一種自然語言, 實際可行的、有價值的分類只能做到把語法功能相同或相近的詞歸在一起。這樣一來,同類的詞,有些是典型的, 符合分類的全部標(biāo)準(zhǔn)或最重要的標(biāo)準(zhǔn),有些是不典型的,只符合其中一部分標(biāo)準(zhǔn)。例如, “蘋果、水泥、勇氣、心胸”都是名詞, 它們的共同特征是能做句子的主語與賓語,不受副詞修飾。一般地說,名詞可以受數(shù)量詞修飾, 不過量詞的類型又有差別。如修飾“蘋果”的數(shù)量結(jié)構(gòu)中的量詞可以是個體量詞、度量詞、容器量詞與種類量詞等, 與“水泥”搭配的就沒有個體量詞, 與“勇氣”搭配的只有種類量詞和不定量詞,而“心胸”卻不能受任何數(shù)量結(jié)構(gòu)或數(shù)詞修飾。在列舉各個詞類的劃類準(zhǔn)則時,應(yīng)盡可能地把那些重要的列在前面。當(dāng)判斷一個具體的詞是否屬于某個詞類時, 就可以看它是否符合這些判斷標(biāo)準(zhǔn)。越符合多項標(biāo)準(zhǔn)或者前面的標(biāo)準(zhǔn), 越是該類典型的詞。反之, 雖將一個詞劃入了該類, 但它只符合少數(shù)幾項標(biāo)準(zhǔn)或者只符合較后面的標(biāo)準(zhǔn), 那么這個詞在該類中就不是典型的。這也是語言現(xiàn)象的模糊性的一種表現(xiàn)。 詞語的兼類在“”中已經(jīng)涉及了詞的兼類, 這里更集中地討論一下這個問題。詞的兼類指的是如果同字同音同義的同一個詞具有不同詞類的語法功能,則認為這個詞兼屬不同的詞類,簡稱兼類。兼類問題可用表征形容詞與動詞關(guān)系的圖1來說明。在圖1中,左邊的圓代表形容詞的集合,右邊的圓代表動詞的集合。這兩個圓不相重合部分分別用a,v表示,相重合的陰影部分用$表示。形容詞與動詞雖然都是謂詞,但它們有相互區(qū)別的語法特點,如形容詞可以受“很”修飾且不能帶真賓語,而動詞或者不能受“很”修飾或者能帶真賓語。根據(jù)這些語法特點,可以把絕大部分形容詞與動詞區(qū)分開來。但是,漢語中確實有一些詞處于兩個圓重合的陰影部分, 如“端正,鞏固,方便,壯大,繁榮,豐富”等,這些詞既具有形容詞的語法功能,又具有動詞的語法功能,并且看不出它們作為形容詞或者作為動詞,在意義上有什么區(qū)別。因此,本研究報告認為這些詞兼屬形容詞與動詞。前面已經(jīng)提到,劃類標(biāo)準(zhǔn)有一定的相對性。仍以圖1為例,關(guān)于a,v,$可以有以下4種處理意見。(一)將a,v,$各自處理成獨立的類,這就需要為$起個合適的名字。本研究報告維持已經(jīng)劃定了的18個基本詞類的穩(wěn)定性,不主張這樣做。(二)將陰影部分$與a合并,形容詞的集合就是左邊的完整的圓。動詞的集合只剩下v, 動詞集合內(nèi)的各個元素間語法功能的一致性就加大了。(三)與(二)反過來,將$與v合并。動詞的集合就是右邊的完整的圓。形容詞的集合只剩下了a。(四)a為形容詞, v為動詞, $為兼類,既是形容詞的子集,又是動詞的子集。反映在漢語語法信息詞典中就是將同一個詞如“端正,鞏固,方便??”區(qū)分成兩個登錄項(即詞語), 分別歸入形容詞與動詞。如果將a,v,$抽象為任意兩個不同的詞類及它們的交集,那么在以上4種處理意見中,究竟哪一種更妥當(dāng)一些呢? 這不能一概而論。對形容詞與動詞的交集中的 “端正, 鞏固, 方便??”這些詞,本研究報告采用了第4種處理意見,但不等于說,對其它詞類也一律這么辦。在劃分詞類中, 應(yīng)當(dāng)確立這樣一條原則, 即在整個詞類系統(tǒng)中,只有少數(shù)詞是兼類的。這條原則同樣適合電子詞典的開發(fā), 因為堅持這個原則可以保證詞典的冗余度小。與“端正,鞏固,方便??”這些詞相似,象“研究,教育,批評,建設(shè),團結(jié)”這一類兼有動詞與名詞的功能,但這類詞在動詞中的比重較大,本技術(shù)報告不將它們看作兼類,只將它們劃歸動詞,是動詞的一個特殊的子類,叫“名動詞”,在電子詞典中有關(guān)這些動詞的名詞特性另列專門的語法屬性字段加以描述。關(guān)于種種兼類現(xiàn)象,本技術(shù)報告在第3章“各類詞的劃分方法及有關(guān)說明”中將具體介紹。前面已經(jīng)指出“一把鎖”中的指物的“鎖”與“鎖門”中的指行為動作的“鎖”是兩個不同的詞,在漢語語法信息詞典中,在名詞“鎖”的記錄中需指明還有一個同字同音的動詞“鎖”, 同樣在動詞“鎖”記錄中也需要指明另有一個同字同音的名詞的“鎖”。應(yīng)該首先區(qū)分漢語中的實詞與虛詞,繼之區(qū)分實詞中的體詞與謂詞, 然后再逐一說明各個基本詞語類別的劃分準(zhǔn)則。限于篇幅, 這里只能選擇若干詞類作為例子加以介紹。名詞是最重要的一類體詞。大多數(shù)語法論著認為時間詞、處所詞、方位詞是名詞的子類。本文介紹的分類體系將它們處理成與名詞平行的類,下面只以時間詞與方位詞為例。在謂詞中, 本文只介紹從形容詞中分化出來的狀態(tài)詞。本文還介紹了實詞中的區(qū)別詞。對于虛詞, 本文只選了介詞。另外,對前接成分、后接成分、語素字、非語素字也作了說明。 時間詞(1)時間詞是從名詞中分化出來的一類體詞,如“昨天,現(xiàn)在,今后, 宋朝”等。(2)時間詞能做“在”、“到”和“等到”的賓語。(3)時間詞可用“什么時候”、“這(個)時候”或“那(個)時候”提問或指代。(4)普通時間詞可以作狀語,且作狀語時無需加“地”,也不能加“地”。如“我昨天看了電影”。專有時間詞,象“宋朝”,不能單獨作狀語。(5)時間詞都表示時間。但語義與時間有關(guān)的詞不一定是時間詞。如“時間、時候、功夫” 是名詞(雖然可以說:“時間到了”但不能說“在時間”或“等到時間”), “已經(jīng),剛,忽然”是副詞,“半天,三年”是數(shù)量詞(組)。(6)時間詞通常表示“時點”, 即時間的位置或早晚,當(dāng)然,這里說的“時點”并不是數(shù)學(xué)中時間軸上的一個點。而表示“時量”(即時間的長短
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1