【導(dǎo)讀】中英SMT系統(tǒng)中的兩個(gè)問題。詞對(duì)齊中引入啟發(fā)式規(guī)則,加入ITG約束。重定序模型中結(jié)合ITG和句法知識(shí)。中-英詞序差別大。為每個(gè)源短語(yǔ)創(chuàng)建的翻譯選項(xiàng)列表。分詞:中文ICTCLAS,英文WMT05的Tokenizer工具。英文的詞根化處理:詞對(duì)齊過程中使用。同構(gòu)模型對(duì)于翻譯結(jié)果產(chǎn)生的積極的影響,各個(gè)指標(biāo)均比兩。方向偏好產(chǎn)生了負(fù)面的影響,原因可能有:。具有解釋能力,反而影響了模型的穩(wěn)定性;CWMT08提供的科技語(yǔ)料作為訓(xùn)練集。采用類似的預(yù)處理后,共:616597個(gè)句對(duì)。參與了兩個(gè)單元的評(píng)測(cè)。在英-中科技任務(wù)中,同構(gòu)模型的采用產(chǎn)生了負(fù)面影響,具體