【正文】
/f)和 l(f/e)167。 新聞 2023 SSMT英中翻譯測試集167。 2個(gè)來自于基于短語的系統(tǒng) (PB)中國科學(xué)院自動(dòng)化所Institute of Automation, Chinese Academy of Sciences總結(jié)v新聞?lì)I(lǐng)域167。 2個(gè)來自于基于分層短語的翻譯系統(tǒng) (HPB)167。 格式轉(zhuǎn)換:去除中文中的空格167。 IBM扭曲模型 [4]中國科學(xué)院自動(dòng)化所Institute of Automation, Chinese Academy of Sciences技術(shù)說明 分層短語系統(tǒng)v主要借鑒了 Wei[5]的基本思想,引入分層短語的概念v有效地結(jié)合了短語模型和同步上下文無關(guān)文法v分層短語模型將語序信息包含在模型之中,克服了傳統(tǒng)短語翻譯的調(diào)序問題v沿用了統(tǒng)計(jì)線性對(duì)數(shù)方法進(jìn)行概率計(jì)算,使用了如下 6個(gè)特征:167。 短語系統(tǒng)167。 4gram語言模型167。 科技 CWMT08提供的 Special語料中隨機(jī)挑選 200句v 翻譯模型訓(xùn)練數(shù)據(jù):167。 借鑒了漢英評(píng)測的經(jīng)驗(yàn),加入了英文命名實(shí)體翻譯及前后處理模塊;167。 采用基于 MBR解碼和混淆網(wǎng)絡(luò)解碼的多系統(tǒng)融合策略,融合 6個(gè)結(jié)果167。 大小寫轉(zhuǎn)換:未翻譯詞保留其原始格式167。 方向概率 [3]167。 分層短語系統(tǒng)167。 句子長度懲罰中國科學(xué)院自動(dòng)化所Institute of Automation, Chinese Academy of Sciences技術(shù)說明 依存樹到串系統(tǒng)v 在源語言端運(yùn)用依存結(jié)構(gòu)進(jìn)行統(tǒng)計(jì)翻譯的新模型:DependencyString Structure Model (DSS模型 ) v 由于計(jì)算資源和時(shí)間的限制,參加本次評(píng)測的系統(tǒng)仍然沿用和分層短語相同的文法 vDSS解碼算法的輸入是一棵樹,而不是一個(gè)串,所以線圖是按照樹節(jié)點(diǎn)來索引的,而不是按照串中的跨距 (span)來建立索引的v