freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

多語種的拼音到漢字的轉(zhuǎn)換和翻譯(已修改)

2024-10-28 10:18 本頁面
 

【正文】 多語種的拼音到漢字的 轉(zhuǎn)換和翻譯 趙 海 上海交通大學(xué) 長沙 目錄 ? 問題概述 ? 拼音輸入法 ? 機(jī)器翻譯:服務(wù)于漢字文化圈語言 ? 結(jié)語 漢字文化圈 ? 漢字亦稱中文字、中國字,是世界上仍被廣泛使用的高度發(fā)展的表意文字。仍在使用和曾經(jīng)使用漢字的國家和地區(qū)包括漢字的誕生地中國、周邊深受其影響的越南、朝鮮半島和日本,以及近代華人移民聚集的新加坡、馬來西亞等東南亞國家。接受漢字及中國文化影響的地理區(qū)域在某些文獻(xiàn)中被非正式地稱為 漢字文化圈 漢字文化圈的拼音化 中國 等 日本 朝鮮 /韓國 越南 拼音文字 ( 羅馬字 ) 漢語拼音 日文羅馬字方案 韓文羅馬字方案 越南語國語字 拼音文字 ( 民族文字 ) 假名 諺文 漢字 漢字 日文漢字 韓文漢字 漢字和字喃 ? 漢字文化圈各語言均是世界意義上的大語種 ? 漢語有超過 13億人使用,是使用人口最多的語言 ? 日語有 ? 朝鮮語 /韓語有超過 7,000萬的使用人口 ? 越南語則擁有世界范圍內(nèi)約 8,000萬的使用者 使用人數(shù) 應(yīng)用驅(qū)動(dòng)的音字轉(zhuǎn)化任務(wù) ? 中文的拼音輸入法 ? 從漢語拼音到漢字句子 ? 機(jī)器翻譯 ? 從假名、諺文或者越南語國語字到漢字串 ? 從語義等價(jià)的角度,觀察不同語言的讀音差異和演化軌跡 目錄 ? 問題概述 ? 拼音輸入法 ? 機(jī)器翻譯:服務(wù)于漢字文化圈語言 ? 結(jié)語 基于拼音的中文輸入法 ? 主流的輸入法大部分是基于拼音的 ? 不考慮聲調(diào),漢語拼音的音節(jié)數(shù)少于 500個(gè) ? 漢字,則有 300020200個(gè),根據(jù)應(yīng)用場(chǎng)合不同而不同 ? 無論哪種情形,基于拼音輸入面臨的主要問題是:針對(duì)輸入拼音音節(jié),快速選定漢字。 通用策略 ? 輸入一個(gè)拼音音節(jié),會(huì)有幾十個(gè)漢字對(duì)應(yīng) ? 輸入雙音節(jié)詞對(duì)應(yīng)的拼音,則會(huì)快速降低到只有幾個(gè)合法的漢字詞對(duì)應(yīng) ? 所以 ? 輸入盡可能長的音節(jié)串! 拼音輸入法作為漢字串解碼任務(wù) ? 輸入:漢語拼音串 ? 輸出:一一對(duì)應(yīng)的(合乎漢語語法語義的)漢字串 ? 串標(biāo)注任務(wù) ? 最大熵模型解碼 ? 統(tǒng)計(jì)機(jī)器翻譯解碼 zi ran yu yan chu li 字 然 與 嚴(yán) 出 理 子 染 語 眼 除 離 自 燃 于 煙 處 力 紫 冉 魚 言 初 李 資 髯 雨 演 觸 利 作為機(jī)器翻譯的漢字串解碼 PACLIC 2020 ? 流程: ? 沒有對(duì)齊過程 ? 僅適用標(biāo)準(zhǔn)的 MERT調(diào)試以及MOSES解碼 ? 有效集成語言模型等豐富特征 ? 精度和整句正確率均優(yōu)于標(biāo)準(zhǔn)的最大熵模型 10K 100K 1M ME SMT 10K 100K 1M ME SMT 不僅僅是串解碼任務(wù) ? 我們使用字的精度來評(píng)估漢字串解碼任務(wù) ? 對(duì)于串解碼任務(wù)這是標(biāo)準(zhǔn)度量,因而它不是問題 ? 但是,我們服務(wù)于中文輸入法,它的真正目標(biāo)是最少的擊鍵選擇來完成輸入 新型的漢字串解碼評(píng)估度量 ? 基于擊鍵次數(shù) ? 解碼不可能 100%正確,如果 1
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1