【導(dǎo)讀】技術(shù)說(shuō)明與參評(píng)系統(tǒng)。非單調(diào)解碼,任意跳轉(zhuǎn)。雙向短語(yǔ)翻譯概率p(e/f)和p(f/e). 主要借鑒了Wei[5]的基本思想,引入分層短語(yǔ)的。有效地結(jié)合了短語(yǔ)模型和同步上下文無(wú)關(guān)文法。分層短語(yǔ)模型將語(yǔ)序信息包含在模型之中,克服。沿用了統(tǒng)計(jì)線性對(duì)數(shù)方法進(jìn)行概率計(jì)算,使用了。由于計(jì)算資源和時(shí)間的限制,參加本次評(píng)測(cè)的系統(tǒng)仍然沿。DSS解碼算法的輸入是一棵樹(shù),而不是一個(gè)串,所以線圖。解碼時(shí)使用了8個(gè)特征,最后兩個(gè)為依存子樹(shù)的懲罰。不符合依存子樹(shù)懲罰。地名,人名,機(jī)構(gòu)名處理模塊。亂碼過(guò)濾(中文中的亂碼、英文中的亂碼以及包含中文詞的句。標(biāo)點(diǎn)符號(hào)及數(shù)字變換(中文中的部分標(biāo)點(diǎn)符號(hào)、英文中的雙字。英文詞性標(biāo)注工具:StanfordLog-linear. 英文依存樹(shù)分析工具:Minimum-Spanning. 科技-CWMT08提供的Special語(yǔ)料中隨機(jī)挑選200句。新聞-CWMT08提供的Common,約85萬(wàn)句對(duì)和;將NIST語(yǔ)料根據(jù)科技任務(wù)發(fā)布的訓(xùn)練語(yǔ)料進(jìn)行過(guò)濾的