freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

了解文本媒體的編碼方式培訓資料(存儲版)

2025-01-30 09:05上一頁面

下一頁面
  

【正文】 百度檢索。 GB2312漢字的編碼 ? 每一個 GB2312漢字使用 16位 (2個字節(jié) )表示 ? 為了與 ASCII字符相區(qū)別,每個字節(jié)的最高位均為 “ 1” ? 例如: “ 南 ” 字的代碼是 11000100 11001111 (用十六進制表示為 C4CF) 1 1 第 1字節(jié) 第 2字節(jié) X X X X X X X X X X X X X X GBK漢字 內碼擴充規(guī)范 ? GB2312的不足: ? 漢字字數太少,缺少繁體字 ,無法滿足人名、地名、古籍整理、古典文獻研究等應用的需要;與 ASCII碼不兼容 ? GBK漢字 內碼擴充規(guī)范( 1995): ? 在 GB2312基礎上,增加了 1萬多漢字 (包括繁體字 )和符號 ? 共有 21003個漢字和 883個圖形符號,如 “ 計 算 機 ” 、冃 、 冄 、 円 、 冇 等繁體字和生僻字 ? 與 GB8312保持向下兼容,也使用雙字節(jié)表示,第 1字節(jié)最高位必須為 “ 1”: 1 X 第 1字節(jié) 第 2字節(jié) X X X X X X X X X X X X X X UCS/Unicode多文種大字符集 ? 背景:為了實現全球數以千計的不同語言文字的統一編碼 ? 方案: ISO將全球所有文字字母和符號集中在一個字符集中進行統一編碼 (目前共收集了 17x216= 1,114,112 個 ) ,稱為UCS/Unicode ? UCS/Unicode的編碼方案: ? 先實現部分字符的編碼(近 11萬個字符) ? 盡量與已有編碼標準兼容 ? 包含有中、日、韓統一整理出來的約 7萬漢字(稱 CJK漢字) ? 允許有若干不同的編碼方案 , 常用的兩種是: 單字節(jié): ASCII字符 雙字節(jié):拉丁、希臘、阿拉伯, 西文字符的編碼 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 8 9 A B C D E F b6b5b4 b3b2b1b0 標準 ASCII字符集及其編碼 32個控制字符,不可打印 空格 通常一個 ASCII碼值占一個字節(jié)( 8個二進制位 ),每個字節(jié)中多余出來的一位(最高位)可設為 “ 0”,用作數據傳輸時的奇偶校驗。 ? 人工輸入速度慢、成本高、使用方便。 ? 在豐富格式文本中,除正文之外,還有許多用來說明文本的版面結構、內容組織、文字屬性的信息,這些信息被稱為 “ 標記 ” ,這些標記及其使用規(guī)則被稱為“ 標記語言 ” 。 ? 文字信息在計算機中稱為 “ 文本 ” ,它是計算機中最常用的一種數字媒體,在計算機中采用二進制編碼表示。 豐富格式文本 本書由南京大學出版社 (Publishing House of Nanjing University)出版 ?舉例:下面標題的格式為:中文用黑體,西文用 Arial Black體,居中 ? 使用 HTML語言描述為: p align=centerfont face=黑體 本書由南京大學出版社/fontfont face=Arial Black(Publishing House of Nanjing University)/fontfont face=黑體 出版 /font/p 用一對 指出的是標記,如 font face=“ 黑體 ” 和 /font等,用于說明排版的格式和文字屬性,它們不屬于正文內容 正文內容 文本的分類 ? 超文本 :它是用超鏈接的方法,將各種不同空間的文字信息組織在一起的網狀文本。 文字符號輸入計算機的方法 印刷體識別 手寫體識別 鍵盤輸入 聯機手寫輸入 語音輸入 自動識別輸入 字符信息的輸入 人工輸入 – 技術上非常困難 , 還無法實用 –目前準備先突破工整的楷書手寫體的識別 ! 漢字的鍵盤輸入 ? 漢字與鍵盤上的鍵無法一一對應,因此必須使用幾個鍵來表示一個漢字,這就稱為漢字的 “ 鍵盤輸入編碼 ” ? 優(yōu)秀的漢字鍵盤輸入編碼應具有的特點: ?易學習、易記憶 ?效率高 (平均擊鍵次數較少 ) ?重碼少 ?容量大 (可輸入的漢字字數多 ) 漢字鍵盤輸入方法的比較 類型 原理 舉例 優(yōu)點 缺點 數字 編碼 使用一串數字來表示漢字 電報碼 區(qū)位碼 僅使用 10個數字鍵 難記憶 字音 編碼 把漢語的拼音作為漢字的輸入編碼 智能 ABC 紫光華宇 微軟拼音輸入 簡單易學,適合于非專業(yè)人員 重碼多,需增加選擇操作,不會漢語拼音或不知道讀音時無法使用 字形 編碼 把漢字的部件或筆畫作為碼元,按照漢字結構及其切分規(guī)則作為編碼依據,確定每個漢字的輸入代碼 五筆字形 表形碼 鄭碼 重碼少、輸入速度較快,適合于專業(yè)
點擊復制文檔內容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1