freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別是機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄?展示頁

2024-09-16 18:42本頁面
  

【正文】 變?yōu)橄鄳?yīng)的文本文件或命令的高技術(shù)。作為專門的研究領(lǐng)域,語音識別又是一門交叉學科,它與聲學、語音學、語言學、數(shù)字信號處理理論、信息論、計算機科學等眾多學科緊密相連。 南山高科語音技術(shù)事業(yè)部主要致力于語音識別和語音合成及編碼技術(shù)的開發(fā)和應(yīng)用。南山高科憑借多年來在語音技術(shù)的研究和產(chǎn)品開發(fā)方面的深厚積累,推出了多種涵蓋語音識別、說話人識別 、語音合成以及語音壓縮等方面的豐富的產(chǎn)品。南山高科的核心技術(shù)是具有自主知識產(chǎn)權(quán)的 V9?輸入法和語音識別技術(shù),秉承了三十多年來中科院聲學所相關(guān)領(lǐng)域的研究經(jīng)驗,目前在國際上處于領(lǐng)先地位,并已申請多項國家專利。鑒定委員會聽取和審查了技術(shù)總結(jié)報告、專家組測試報告、科技查新報告等鑒定文件,并觀看了現(xiàn)場演示,考察了公司的開發(fā)環(huán)境。 在漢語全音節(jié)與詞組混合的語音識別任務(wù)中,得 到的初步實驗結(jié)果為: PC微機浮點算法條件下正確覆蓋率不低于 98%,定點算法的正確覆蓋率不低于97%。系統(tǒng)的響應(yīng)時間滿足實時識別的要求。 2 該成果在手機等移動(便攜式)電子設(shè)備上實現(xiàn)漢語全音節(jié)和詞組混合的語音漢字輸入方法、在漢語語音識別詞庫的處理方法和在具有精簡鍵盤設(shè)備上語音輸入漢字的方法和裝置上,具有創(chuàng)新性,處于國際領(lǐng)先地位。) V9 手機輸入法的突出優(yōu)勢是進行了獨到的系統(tǒng)和交互設(shè)計,使得整個系統(tǒng)模型的大小僅有 100~ 300KB,非常適合象手機這樣的嵌入式系統(tǒng)的實現(xiàn)。 二、 V9?漢語語音識別系統(tǒng)的設(shè)計 V9?漢語語音識別系統(tǒng)是一個非特定人的、孤立音語音識別系統(tǒng)。識別系統(tǒng)主要用于手持設(shè)備,如手機、掌上電腦。那么,對系統(tǒng)各個部分的設(shè)計首要考慮的是系統(tǒng) 對硬件資源的開銷必須盡量的小,不能超過這些設(shè)備的限制。 一般的語音處理流程圖如圖 1 所示: 預(yù)處理模型庫測度估計特征提取語音輸入?yún)⒖寄P蜏y試特征后處理識別結(jié)果模型庫 圖 語音識別系統(tǒng)的處理流圖 在語音識別系統(tǒng)中 , 模擬的語音信號在完成 A/D轉(zhuǎn)換后成為數(shù)字信號 , 但時域上的語音信號很難直接用于識別 , 因此我們需要從語音信號中提取語音的特征,一方面可以獲得語音的本質(zhì)特征 , 另一方面也起到數(shù)據(jù)壓縮的作用。語音識別系統(tǒng)的模型通常由聲學模型和語言模型兩部分組成,分別對應(yīng)于語音到半音節(jié)概率的計算和半音節(jié)到字概率的計算。由于 V9 技術(shù)方案采用的語音庫采樣率為 8kHz,因此我們采用的幀長為 256 個采樣點 (即 32ms),幀步長或幀移(即每一幀語音與上一幀語音不重疊的長度)為 80 個采樣點 (即 10ms)。 該特征是基于語音信號為自回歸信號的假設(shè),利用線性預(yù)測分析獲得倒譜參數(shù)。 Mel 頻標倒譜參數(shù) (Mel Frequency Cepstrum Coefficient, MFCC)。由于充分模擬了人的聽覺特性,而且沒有任何前提假設(shè), MFCC 參數(shù)具有識別性能和抗噪能力,實驗證明在漢語數(shù)碼語音識別中 MFCC 參數(shù)的性能明顯優(yōu)于 LPCC 參數(shù),因此本技術(shù)方
點擊復制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1