【文章內(nèi)容簡(jiǎn)介】
i a l P h r a s e分 層 短 語(yǔ) 系統(tǒng) , 抽 取 帶 變量 短 語(yǔ) 與 概 率計(jì) 算轉(zhuǎn) 換 數(shù) 據(jù) 結(jié)構(gòu) , 二 進(jìn) 制 存儲(chǔ)轉(zhuǎn) 換 數(shù) 據(jù) 結(jié)構(gòu) , 二 進(jìn) 制 存儲(chǔ)多 個(gè) 1 b e s t 結(jié)果 以 替 代 N b e s t 結(jié) 果多 個(gè) 1 b e s t 結(jié)果生 成 1 b e s t構(gòu) 建 混 淆 網(wǎng) 絡(luò)M B R 解 碼 器調(diào) 序模 型融合模塊短語(yǔ)系統(tǒng)分層短語(yǔ)系統(tǒng)數(shù) 據(jù) 過(guò) 濾依存樹(shù)到串系統(tǒng)轉(zhuǎn) 換 數(shù) 據(jù) 結(jié)構(gòu) , 二 進(jìn) 制 存儲(chǔ)采 用 和 分 層 短語(yǔ) 相 同 的 文 法解 碼 算 法 輸 入是 樹(shù) , 線 圖按 照 樹(shù) 節(jié) 點(diǎn) 來(lái)索 引多 個(gè) 1 b e s t 結(jié)果 以 替 代 N b e s t 結(jié) 果源 語(yǔ) 言 依 存 句法 分 析中國(guó)科學(xué)院自動(dòng)化所 Institute of Automation, Chinese Academy of Sciences 評(píng)測(cè)環(huán)境概要 ?軟硬件環(huán)境 ?運(yùn)行時(shí)間 (約 4000句測(cè)試集 ) 運(yùn)行平臺(tái) 操作系統(tǒng) 數(shù)量 CPU RAM PC機(jī) Windows 2023 2 Pentium 4, 服務(wù)器 Linux (Ubuntu) 1 Xeon 2 系統(tǒng) 新聞?lì)I(lǐng)域 (小時(shí)) 科技領(lǐng)域 (小時(shí)) 短語(yǔ)系統(tǒng) 16 分層短語(yǔ) 20 18 依存樹(shù)到串 18 16 中國(guó)科學(xué)院自動(dòng)化所 Institute of Automation, Chinese Academy of Sciences 數(shù)據(jù) ? 開(kāi)發(fā)數(shù)據(jù): ? 新聞 2023 SSMT英中翻譯測(cè)試集 ? 科技 CWMT08提供的 Special語(yǔ)料中隨機(jī)挑選 200句 ? 翻譯模型訓(xùn)練數(shù)據(jù): ? 新聞 CWMT08提供的 Common,約 85萬(wàn)句對(duì)和;NIST MT08評(píng)測(cè)提供語(yǔ)料,大約 670萬(wàn)句對(duì) ? 科技 CWMT08提供的 Special部分語(yǔ)料,約 52萬(wàn)句對(duì); NIST MT08評(píng)測(cè)提供語(yǔ)料,大約 670萬(wàn)句對(duì) ? 語(yǔ)言模型訓(xùn)練數(shù)據(jù): ? LDC2023T38提供的 C