【導(dǎo)讀】中英SMT系統(tǒng)中的兩個問題。詞對齊中引入啟發(fā)式規(guī)則,加入ITG約束。重定序模型中結(jié)合ITG和句法知識。中-英詞序差別大。為每個源短語創(chuàng)建的翻譯選項列表。分詞:中文ICTCLAS,英文WMT05的Tokenizer工具。英文的詞根化處理:詞對齊過程中使用。同構(gòu)模型對于翻譯結(jié)果產(chǎn)生的積極的影響,各個指標(biāo)均比兩。方向偏好產(chǎn)生了負(fù)面的影響,原因可能有:。具有解釋能力,反而影響了模型的穩(wěn)定性;CWMT08提供的科技語料作為訓(xùn)練集。采用類似的預(yù)處理后,共:616597個句對。參與了兩個單元的評測。在英-中科技任務(wù)中,同構(gòu)模型的采用產(chǎn)生了負(fù)面影響,具體