【導(dǎo)讀】漢字亦稱中文字、中國(guó)字,是世界上仍被廣泛使用的高度發(fā)展的表意文字。及近代華人移民聚集的新加坡、馬來西亞等東南亞國(guó)家。接受漢字及中國(guó)文化影響的地理區(qū)。漢語有超過13億人使用,是使用人口最多的語言。越南語則擁有世界范圍內(nèi)約8,000萬的使用者。從假名、諺文或者越南語國(guó)語字到漢字串。從語義等價(jià)的角度,觀察不同語言的讀音差異和演化軌跡。主流的輸入法大部分是基于拼音的。不考慮聲調(diào),漢語拼音的音節(jié)數(shù)少于500個(gè)。漢字,則有3000-20200個(gè),根據(jù)應(yīng)用場(chǎng)合不同而不同。無論哪種情形,基于拼音輸入面臨的主要問題是:針對(duì)輸入拼音。輸入雙音節(jié)詞對(duì)應(yīng)的拼音,則會(huì)快速降低到只有幾個(gè)合法的漢字。統(tǒng)計(jì)機(jī)器翻譯解碼。僅適用標(biāo)準(zhǔn)的MERT調(diào)試以及。精度和整句正確率均優(yōu)于標(biāo)準(zhǔn)。優(yōu)化候選長(zhǎng)度、排序等以降低以上的度量。明治維新后,中國(guó)衰落,漢字的使用的合法性和合理性引起爭(zhēng)議。1974年,文教省又公布“教科書韓漢并書方針”,結(jié)束了“禁用漢字”政策。2020年開始,韓國(guó)把漢字重新列入中小學(xué)的課程。