freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

中文信息處理chineseinformationprocessing(存儲版)

2025-08-17 06:28上一頁面

下一頁面
  

【正文】 5),北京航空學院主持,中國人民大學等十幾個院校,研究機構(gòu)參加的“現(xiàn)代漢語詞頻統(tǒng)計”工程是這一階段代表性的重大科研成果,這是國內(nèi)首次使用計算機進行大規(guī)模語料 (2022萬字 )的詞頻統(tǒng)計研究的大型語言工程 ? 第一個漢語自動分詞系統(tǒng) —— CDWS,建立了一個有 13萬余詞條的計算機詞典,研制了一個有 52個屬性的漢字信息庫 ? 1988年初,北京航空航天大學在承擔國家“七五”科技攻關項目 《 信息處理用規(guī)范現(xiàn)代漢語詞庫 》 的同時,制定了 《 信息處理用規(guī)范現(xiàn)代漢語分詞規(guī)范 》 2022年 8月 15日 1時 29分 中文信息處理 緒論 30 中文信息處理的發(fā)展 ?句法和語義等深層處理為代表的中期階段 ?“八五”期間, 中文信息處理 技術的研究開發(fā)重點逐步由字,詞的表層處理轉(zhuǎn)向了以句法,語義分析為核心的深層處理 2022年 8月 15日 1時 29分 中文信息處理 緒論 31 中文信息處理的發(fā)展 ? 語料庫統(tǒng)計方法興起的近期階段 ? 1979年,武漢大學建設的漢語現(xiàn)代文學作品語料庫,共計 527萬字,是我國最早的機器可讀語料庫 ? 《 人民日報 》 收集了 48年的全部文字和圖像內(nèi)容,公開發(fā)行 ? 北京大學計算語言學研究所與富士通公司 (Fujitsu)合作,加工 2700萬字的《 人民日報 》 語料庫 ? 1998年,清華大學建立了 1億漢字的語料庫 ,著重研究歧義切分問題,現(xiàn)在生語料庫已達 78億字 ? 香港城市理工大學語言資訊科學研究中心建立了 LIVAC(Linguistic variety in Chinese munities)語料庫,其宗旨在于研究使用中文的各個地區(qū)使用語言的異同。中文信息處理 Chinese Information Processing 張宇 哈爾濱工業(yè)大學計算機科學與技術學院 2022年 8月 15日 1時 29分 中文信息處理 緒論 2 主要教材 ?朱巧明,李培峰,吳嫻,朱曉旭等編著。 《 計算機科學技術百科全書 》 清華大學出版社, 1998 2022年 8月 15日 1時 29分 中文信息處理 緒論 9 計算機中文信息處理主要研究對象 ? 漢字鍵盤輸入技術 ? 漢字輸出技術 ? 軟件漢化技術 ? 漢字字形識別技術 ? 漢語語音識別技術 ? 激光照排技術 ? 中文平臺 ? 文本分類 ? 信息檢索 2022年 8月 15日 1時 29分 中文信息處理 緒論 10 漢字鍵盤輸入技術 ? 漢字鍵盤輸入技術是一種通過鍵盤使?jié)h字進入計算機的技術 ? 漢字編碼 ? 采用四位十進制數(shù)把常用的漢字用“ 0”— ”9”十個數(shù)字按照次序進行編碼 ? 四角碼(字形碼) ? 用“ 0”— ”9”十個數(shù)字鍵對漢字的四個角的形狀進行編碼 ? 機內(nèi)碼 ? 用 2字節(jié)、 3字節(jié)、 4字節(jié)來表示一個漢字的機器內(nèi)部碼 ? 國際標準化組織( ISO)、 Unicode聯(lián)盟以及 IEEE下屬的專門
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1