【正文】
167。 大小寫轉(zhuǎn)換:未翻譯詞保留其原始格式167。 未登錄詞中國科學(xué)院自動化所Institute of Automation, Chinese Academy of Sciences技術(shù)說明 系統(tǒng)融合 [6][7]中國科學(xué)院自動化所Institute of Automation, Chinese Academy of Sciences技術(shù)說明 外部技術(shù)v 漢語分詞工具:計算所開發(fā)的 v 雙語詞對齊工具: GIZA++v 語言模型訓(xùn)練工具: SRILM工具包v 英文詞性標注工具: Stanford Loglinear PartOfSpeech Taggerv 英文依存樹分析工具: MinimumSpanning Tree Parser (MSTparser)中國科學(xué)院自動化所Institute of Automation, Chinese Academy of Sciences參評系統(tǒng) CASIA_SYSTEM II中國科學(xué)院自動化所Institute of Automation, Chinese Academy of Sciences評測環(huán)境概要v軟硬件環(huán)境v運行時間 (約 4000句測試集 )運行平臺 操作系統(tǒng) 數(shù)量 CPU RAMPC機 Windows 2023 2 Pentium 4, 服務(wù)器 Linux (Ubuntu) 1 Xeon 2 系統(tǒng) 新聞領(lǐng)域 (小時) 科技領(lǐng)域 (小時)短語系統(tǒng) 16分層短語 20 18依存樹到串 18 16中國科學(xué)院自動化所Institute of Automation, Chinese Academy of Sciences數(shù)據(jù)v 開發(fā)數(shù)據(jù):167。 科技 CWMT08提供的 Special語料中隨機挑選 200句v 翻譯模型訓(xùn)練數(shù)據(jù):167。 科技 CWMT08提供的 Special部分語料,約 52萬句對; NIST MT08評測提供語料,大約 670萬句