【導(dǎo)讀】技術(shù)說明與參評系統(tǒng)。非單調(diào)解碼,任意跳轉(zhuǎn)。雙向短語翻譯概率p(e/f)和p(f/e). 主要借鑒了Wei[5]的基本思想,引入分層短語的。有效地結(jié)合了短語模型和同步上下文無關(guān)文法。分層短語模型將語序信息包含在模型之中,克服。沿用了統(tǒng)計線性對數(shù)方法進(jìn)行概率計算,使用了。由于計算資源和時間的限制,參加本次評測的系統(tǒng)仍然沿。DSS解碼算法的輸入是一棵樹,而不是一個串,所以線圖。解碼時使用了8個特征,最后兩個為依存子樹的懲罰。不符合依存子樹懲罰。地名,人名,機(jī)構(gòu)名處理模塊。亂碼過濾(中文中的亂碼、英文中的亂碼以及包含中文詞的句。標(biāo)點符號及數(shù)字變換(中文中的部分標(biāo)點符號、英文中的雙字。英文詞性標(biāo)注工具:StanfordLog-linear. 英文依存樹分析工具:Minimum-Spanning. 科技-CWMT08提供的Special語料中隨機(jī)挑選200句。新聞-CWMT08提供的Common,約85萬句對和;將NIST語料根據(jù)科技任務(wù)發(fā)布的訓(xùn)練語料進(jìn)行過濾的