freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第五章中文信息處理(編輯修改稿)

2024-08-28 13:12 本頁面
 

【文章內(nèi)容簡介】 文本校對、機器翻譯、自然語言理解、中文人機界面、語義網(wǎng)、電子字典、電腦輔助翻譯等 ? 中文化:軟件的國際化( internationalization)和本土化( localization)。 ? 中文編程:目前有兩種發(fā)展,一種是英文 coding直接翻譯,以降低開發(fā)人員的語言學習成本;一種是根據(jù)中文特點,發(fā)展出融合中國人思維模式的新的計算機語言。 ? 為了用 0、 1代碼串表示漢字,在漢字系統(tǒng)或通信系統(tǒng)之間交換信息,必須給每個漢字規(guī)定一個統(tǒng)一的代碼。這就是漢字的 交換碼 。 ? 1981年 5月,我國國家標準總局頒布 《 信息交換用漢字編碼字符集 》(GB 231280),作為漢字交換碼編碼的國家標準,簡稱國家標準漢字編碼,或 國標碼 。 ? 收進該標準的字符共有 7 445個。其中一級漢字 3 755個,二級漢字 3 008個,共計 6 763個。一、二級漢字約占近代文獻漢字累計使用頻度的 %。 ? 為便于查找,一級漢字按漢語拼音順序排列;二級漢字一般不易熟記它們的發(fā)音,故按部首和筆畫排列。另外還包括常用符號、序號、GB 1988圖形字符集、日文假名、希臘字母、俄文字母、漢語拼音、注音字符、制表符號等。 四、漢字編碼標準 ? 累計使用頻度不足 %的漢字數(shù)量接近 1萬個。為了滿足計算機實際應(yīng)用的需要,我國在 GB 231280的基礎(chǔ)上擴大收字的范圍,制定了“ 漢字內(nèi)碼規(guī)范 ” GBK,包含了 20 902個漢字,又稱為擴展的國標碼。在 Windows 95/98和其后的 Windows 2022中,裝入了 GBK的全部漢字和符合 GBK和 GB 231280的輸入法。 ? 由于漢字的字符多,一個字節(jié)八位二進制代碼不足以表示所有的常用的漢字。為了不與西文的 ASCII 碼混淆,在微型機漢字系統(tǒng)中,國標碼的每個符號都用兩個字節(jié)(十六位)代碼來表示,并作為轉(zhuǎn)換為機內(nèi)碼或其他漢字處理代碼的依據(jù)。 漢字編碼標準 ? 漢字國標碼就是 GB 231280為漢字規(guī)定的代碼,也稱為交換碼。 ? 國標碼是漢字編碼的國家標準。在 GB 231280代碼表中,縱向分為0~93,共 94行;橫向也是 0~93,共 94列。行與列分別用七位二進制碼表示,第一字節(jié)表示行,第二字節(jié)表示列。其值都從 0100001到1111110。這正是 ASCII 碼的可打印字符的編碼。其范圍為十六進制的 21~7E。漢字國標碼是將第一字節(jié)和第二字節(jié)連寫而得到的。由于二進制形式太長,通常用十六進制表示。 ? 例如: ? 漢字 第一字節(jié) 第二字節(jié) 十六進制 區(qū)位碼 ? 啊 0110000 0100001 3021 1601 ? 保 0110001 0100011 3123 1703 ? 播 0110010 0100101 3225 1805 國標碼 ? 國標碼還可以表示成區(qū)位碼的形式。在 GB231280代碼表中,將行號稱為區(qū)號,列號稱為位號,分別有 94個區(qū)和94個位。將漢字置于其中
點擊復制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1