【正文】
任務(wù)發(fā)布的訓(xùn)練語(yǔ)料進(jìn)行過(guò)濾的 167。 翻譯模型最后使用的語(yǔ)料為 468萬(wàn)句對(duì)167。 語(yǔ)言模型也同樣使用了過(guò)濾技術(shù) ,最后過(guò)濾剩余 1000萬(wàn)句中國(guó)科學(xué)院自動(dòng)化所Institute of Automation, Chinese Academy of Sciences測(cè)試結(jié)果v新聞?lì)I(lǐng)域167。 采用基于 MBR解碼和混淆網(wǎng)絡(luò)解碼的多系統(tǒng)融合策略,融合 6個(gè)結(jié)果167。 3個(gè)來(lái)自于基于分層短語(yǔ)的翻譯系統(tǒng) (HPB)167。 3個(gè)來(lái)自于基于依存樹到串的翻譯系統(tǒng) (DHPB)中國(guó)科學(xué)院自動(dòng)化所Institute of Automation, Chinese Academy of Sciences測(cè)試結(jié)果v科技領(lǐng)域167。 采用基于 MBR解碼和混淆網(wǎng)絡(luò)解碼的多系統(tǒng)融合策略,融合 6個(gè)結(jié)果167。 2個(gè)來(lái)自于基于分層短語(yǔ)的翻譯系統(tǒng) (HPB)167。 2個(gè)來(lái)自于基于依存樹到串的翻譯系統(tǒng) (DHPB)167。 2個(gè)來(lái)自于基于短語(yǔ)的系統(tǒng) (PB)中國(guó)科學(xué)院自動(dòng)化所Institute of Automation, Chinese Academy of Sciences總結(jié)v新聞?lì)I(lǐng)域167。 借鑒了漢英評(píng)測(cè)的經(jīng)驗(yàn),加入了英文命名實(shí)體翻譯及前后處理模塊;167。 并且針對(duì)英文的特點(diǎn),在解碼中融入句法分析樹,在不增加時(shí)空復(fù)雜度的前提下提高了翻譯質(zhì)量 v科技領(lǐng)域167。 由于缺乏這方面的語(yǔ)料資源,我們只能借用新聞?lì)I(lǐng)域的語(yǔ)料,利用數(shù)據(jù)過(guò)濾技術(shù)得到相關(guān)資源167。 但由于在選取開發(fā)集時(shí),其規(guī)模和相關(guān)性受到制約,所以最后的參數(shù)訓(xùn)練并不能有效得收斂到最優(yōu)167。 如何能夠充分利用有限的資源,開發(fā)出更加魯棒的訓(xùn)練及解碼算法,是我們下一步要思考的問題中國(guó)科學(xué)院自動(dòng)化所Institute of Automation, Chinese Academy of Sciences參考文獻(xiàn)[1] 中科院自動(dòng)化所評(píng)測(cè)技術(shù)報(bào)告 (SYSTEM II),第四屆機(jī)