freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第五章中文信息處理(更新版)

2025-09-09 13:12上一頁面

下一頁面
  

【正文】 我國在 GB 231280的基礎(chǔ)上擴(kuò)大收字的范圍,制定了“ 漢字內(nèi)碼規(guī)范 ” GBK,包含了 20 902個漢字,又稱為擴(kuò)展的國標(biāo)碼。其值都從 0100001到1111110。 ? 區(qū)號與位號都用兩位十進(jìn)制數(shù)表示,不足兩位的前面補(bǔ)零。 ? 漢字機(jī)內(nèi)碼 是在計算機(jī)內(nèi)部實(shí)際用來表示漢字的代碼。 ? 如 “ 大 ” 字的區(qū)位碼為 2083,國標(biāo)碼為 3473H,機(jī)內(nèi)碼為3473H+8080H=B4F3H。 ? 為了能使?jié)h字能夠在計算機(jī)中通行,國際標(biāo)準(zhǔn)組織( ISO)、國際電子電氣工程師協(xié)會( IEEE)以及各個使用漢字的國家和地區(qū),在計算機(jī)技術(shù)發(fā)展中,都制定了各種各樣的漢字編碼字符集。其他擴(kuò)充的漢字輸入法,如五筆字型,需要另行安裝后方可使用。 ? 絕大多數(shù)計算機(jī)系統(tǒng)所采用的字符集,都是以 ISO/IEC 2022為基礎(chǔ)的。 ? 8080H等于二進(jìn)制的 1000000010000000,國標(biāo)碼加上8080H,可以保證機(jī)內(nèi)碼每個字節(jié)首位均為1。在微型機(jī)中,多采用兩字節(jié)代碼作為機(jī)內(nèi)碼。 ? 這樣,每個漢字或其他符號都可以用4位十進(jìn)制數(shù)表示。其范圍為十六進(jìn)制的 21~7E。 ? 由于漢字的字符多,一個字節(jié)八位二進(jìn)制代碼不足以表示所有的常用的漢字。 ? 收進(jìn)該標(biāo)準(zhǔn)的字符共有 7 445個。 ? 輸出技術(shù):漢字字模技術(shù)(字體庫)、漢字激光照排、漢語語音合成、動態(tài)組字等。輸出時,這些代碼必須轉(zhuǎn)換成字符字形的點(diǎn)陣,以便顯示或打印。利用計算機(jī)能夠調(diào)整處理數(shù)據(jù)的性能,使文字信息處理也能夠分享計算機(jī)技術(shù)的這一獨(dú)特優(yōu)點(diǎn),從而實(shí)現(xiàn)文字信息處理的高效化。 第五章 中文信息處理 概 述 一、中文信息處理 ? 《 計算機(jī)科學(xué)技術(shù)百科全書 》 (清華大學(xué)出版社, 1998) – 中文信息處理 是用計算機(jī)對漢語的 音、形 、 義 等語言文字信息進(jìn)行的加工和操作,包括對字、詞、短語、句、篇章的輸入、輸出、識別、轉(zhuǎn)換、壓縮、存儲、檢索、分析、理解和生成等各方面的處理技術(shù)。處理完畢后,再把替代的數(shù)碼還原成相應(yīng)的字母或文字。 ? 經(jīng)過編輯的文本仍然以 ASCII碼 表示。 漢字信息處理的基本問題 三、中文信息處理主要研究對象 ? 基礎(chǔ)研究:漢字字頻統(tǒng)計、詞頻統(tǒng)計、漢語自動分詞、句法屬性研究、漢字編碼字符集、通用漢字樣本庫、漢字屬性字典、語料庫等 ? 輸入技術(shù):中文輸入法、中文手寫輸入、中文語音輸入、光學(xué)字符識別等。 ? 1981年 5月,我國國家標(biāo)準(zhǔn)總局頒布 《 信息交換用漢字編碼字符集 》(GB 231280),作為漢字交換碼編碼的國家標(biāo)準(zhǔn),簡稱國家標(biāo)準(zhǔn)漢字編碼,或 國標(biāo)碼 。在 Windows 95/98和其后的 Windows 2022中,裝入了 GBK的全部漢字和符合 GBK和 GB 231280的輸入法。這正是 ASCII 碼的可打印字符的編碼。每個漢字或符號的區(qū)號和位號連起來就組成這個漢字或符號的區(qū)位碼。不同的計算機(jī)系統(tǒng)使用的機(jī)內(nèi)碼是不同的。將 B4F3H 化為二進(jìn)制數(shù)得:1011010011110011,這就是在計算機(jī)中實(shí)際使用的機(jī)內(nèi)碼的二進(jìn)制形式。 – ISO/IEC 2022定義了七位代碼和八位代碼的空間及其代碼空間擴(kuò)充的技術(shù)。 本 章 結(jié) 束
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1