freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

機(jī)器翻譯imachinetranslationi(參考版)

2024-10-11 14:39本頁面
  

【正文】 ” 寫一個程序?qū)崿F(xiàn)英語數(shù)字、漢語數(shù)字和阿拉伯?dāng)?shù)字之間的互譯 寫一個程序?qū)崿F(xiàn)英語和漢語之間時間表達(dá)式的互譯 。 我國清華大學(xué)計算機(jī)系的基于實(shí)例的日漢機(jī)器翻譯系統(tǒng)。 ETOC和 EBMT系統(tǒng):由日本口語翻譯通信研究實(shí)驗(yàn)室 ATR研制。 PANGLOSS系統(tǒng):由美國卡內(nèi)基 梅隆大學(xué)研制,這是一個多引擎機(jī)器翻譯系統(tǒng) (Multiengine Machine Translation)。該系統(tǒng)的翻譯過程分為分解 (deposition)、轉(zhuǎn)換 (transfer)、合成(position)三步。由于分析的語言單位的顆粒度比較大,歧義就比較少,有利于提高雙語對齊的準(zhǔn)確度。 根據(jù)檢索到的實(shí)例生成與源語言句子相對應(yīng)的譯文:由于基于實(shí)例的機(jī)器翻譯對源語言的分析比較粗,生成譯文時往往缺乏必要的信息,為了提高譯文生成的質(zhì)量,可以考慮把基于實(shí)例的機(jī)器翻譯與傳統(tǒng)的基于規(guī)則的機(jī)器翻譯方法結(jié)合起來,對源語言也進(jìn)行一定深度的分析。 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 54 基于實(shí)例的機(jī)器翻譯 需要研究的問題 正確地進(jìn)行雙語自動對齊 (alignment):在實(shí)例庫中要能準(zhǔn)確地由源語言例句找到相應(yīng)的目標(biāo)語言例句,在基于實(shí)例的機(jī)器翻譯系統(tǒng)的具體實(shí)現(xiàn)中,不僅要求句子一級的對齊,而且還要求詞匯一級甚至短語一級的對齊。 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 51 基于實(shí)例的機(jī)器翻譯( 3) 優(yōu)點(diǎn) –直接使用對齊的語料庫作為知識表示形式,知識庫的擴(kuò)充非常簡單 –不需要進(jìn)行深層次的語言分析,也可以產(chǎn)生高質(zhì)量的譯文 缺點(diǎn) –覆蓋率低,實(shí)用的系統(tǒng)需要的語料庫規(guī)模極大(百萬句對以上) 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 52 基于實(shí)例的機(jī)器翻譯系統(tǒng)結(jié)構(gòu) 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 53 基于實(shí)例的機(jī)器翻譯-舉例 要翻譯句子: (E1) He bought a book on physics. 在語料庫中查到相似英語句子及其漢語譯文是: (E2) He wrote a book on history. (C2) 他寫了一本關(guān)于歷史的書。 基于實(shí)例的機(jī)器翻譯系統(tǒng)中,翻譯知識以實(shí)例和義類詞典的形式來表示,易于增加或刪除,系統(tǒng)的維護(hù)簡單易行,如果利用了較大的翻譯實(shí)例庫并進(jìn)行精確的對比,有可能產(chǎn)生高質(zhì)量譯文,而且避免了基于規(guī)則的那些傳統(tǒng)的機(jī)器翻譯方法必須進(jìn)行深層語言學(xué)分析的難點(diǎn)。 因此,我們應(yīng)該在計算機(jī)中存儲一些實(shí)例,并建立由給定的句子找尋類似例句的機(jī)制,這是一種由實(shí)例引導(dǎo)推理的機(jī)器翻譯方法,也就是基于實(shí)例的機(jī)器翻譯。參照這個學(xué)習(xí)過程,在機(jī)器翻譯中,如果我們給出一些英語句子的實(shí)例以及相對應(yīng)的日語句子,機(jī)器翻譯系統(tǒng)來識別和比較這些實(shí)例及其譯文的相似之處和相差之處,從而挑選出正確的譯文。 說明:這里 后面表示的是概念,而不是英語詞。 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 24 機(jī)器翻譯的范式( Paradigm) 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 25 直接翻譯方法 通過詞語翻譯、插入、刪除和局部的詞序調(diào)整來實(shí)現(xiàn)翻譯,不進(jìn)行深層次的句法和語義的分析,但可以采用一些統(tǒng)計方法對詞語和詞類序列進(jìn)行分析 早期機(jī)器翻譯系統(tǒng)常用的方法,近期 IBM提出的統(tǒng)計機(jī)器翻譯模型也可以認(rèn)為是采用了這一范式 著名的機(jī)器翻譯系統(tǒng) Systran早期也是采用這種方法,后來逐步引入了一些句法和語義分析 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 26 轉(zhuǎn)換方法 1 整個翻譯過程分為“分析”、“轉(zhuǎn)換”、“生成”三個階段; 分析:源語言句子 → 源語言深層結(jié)構(gòu) – 相關(guān)分析:分析時考慮目標(biāo)語言的特點(diǎn) – 獨(dú)立分析:分析過程與目標(biāo)語言無關(guān) 轉(zhuǎn)換:源語言深層結(jié)構(gòu) → 目標(biāo)語言深層結(jié)構(gòu) 生成:目標(biāo)語言深層結(jié)構(gòu) → 目標(biāo)語言句子 – 相關(guān)生成:生成時考慮源語言的特點(diǎn) – 獨(dú)立生成:生成過程與源語言無關(guān) 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 27 轉(zhuǎn)換方法 2 理想的轉(zhuǎn)換方法應(yīng)該做到獨(dú)立分析和獨(dú)立生成,這樣在進(jìn)行多語言機(jī)器翻譯的時候可以大大減少分析和生成的工作量; 轉(zhuǎn)換方法根據(jù)深層結(jié)構(gòu)所處的層面可分為: – 句法層轉(zhuǎn)換:深層結(jié)構(gòu)主要是句法信息 – 語義層轉(zhuǎn)換:深層結(jié)構(gòu)主要是語義信息 分析深度的權(quán)衡 – 分析的層次越深,歧義排除就越充分 – 分析的層次越深,錯誤率也越高 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 28 轉(zhuǎn)換方法 3 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 29 句法層面的轉(zhuǎn)換方法 1 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 30 句法層面的轉(zhuǎn)換方法 2 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 31 句法層面的轉(zhuǎn)換方法 3 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 32 句法層面的轉(zhuǎn)換方法 4 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 33 句法層面的轉(zhuǎn)換方法 5 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 34 中間語言方法 1 利用一種中間語言( interlingua)作為翻譯的中介表示形式; 整個翻譯的過程分為“分析”和“生成”兩個階段 分析:源語言 → 中間語言 生成:中間語言 → 目標(biāo)語言 分析過程只與源語言有關(guān),與目標(biāo)語言無關(guān) 生成過程只與目標(biāo)語言有關(guān),與源語言無關(guān) 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 35 中間語言方法 2 中間語言方法的優(yōu)點(diǎn)在于進(jìn)行多語種翻譯的時候,只需要對每種語言分別開發(fā)一個分析模塊和一個生成模塊,模塊總數(shù)為 2*n,相比之下,如果采用轉(zhuǎn)換方法就需要對每兩種語言之間都開發(fā)一個轉(zhuǎn)換模塊,模塊總數(shù)為 n*(n1) 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 36 中間語言方法 3 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 37 中間語言方法 4 中間語言的類型 –自然語言:如英語、漢語 –人工語言:如世界語 –某種知識表示形式:如語義網(wǎng)絡(luò) 以某種知識表示形式作為中間語言的機(jī)器翻譯方法有時也稱為基于知識的機(jī)器翻譯方法 2022年 10月 23日 6時 9分 語言信息處理 機(jī)器翻譯 I 38 中間語言方法 5 Makoto Nagao (Kyoto University
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1