freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別是機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄?文庫吧資料

2024-09-12 18:42本頁面
  

【正文】 ?? iiiiFFkFFk kiiikiiii XFF kFXFF FkY111 1111, i=1,2,....,24 其中 kX 為頻譜上第 k 個頻譜點(diǎn)的能量 , iY 為第 i 個濾波器的輸出 , iF 為第 i 個濾波器的中心頻率。轉(zhuǎn)化方法是將頻域信號通過 24 個三角濾波器,其中中心頻率在 1000Hz 以上和以下的各 12 個。 求 MFCC 參數(shù)的大致過程為: 對輸入語音幀加 Hamming 窗后作(快速傅利葉變換, Fast Fourier Transformation, FFT),將時域信號轉(zhuǎn)化為頻域信號。 該特征考慮了人耳的聽覺特性,將頻譜轉(zhuǎn)化為基于 Mel 頻標(biāo)的非線性頻譜,然后轉(zhuǎn)換到倒譜域上。 LPCC 參數(shù)的優(yōu)點(diǎn)是計算量小,對元音有較好的描述能力,其缺點(diǎn)在于對輔音的描述能力較差,抗噪聲性能較差。 3 現(xiàn)有語音識別系統(tǒng)采用的最主要的兩種語音特征包括: 線性預(yù)測倒譜參數(shù) (Linear Prediction Cepstrum Coefficient, LPCC)。 目前通用的特征提取方法是基于語音幀的,即將語音信號分為有重疊的若干幀,對每一幀提取語音特征。輸入的模擬語音信號首先要進(jìn)行預(yù)處理,包括預(yù) 濾波、采樣和量化、加窗、端點(diǎn)檢測、預(yù)加重等。硬件資源的開銷包括存儲模型參數(shù)的開銷,以及識別過程中對內(nèi)存、 DSP 的運(yùn)行時間的開銷。這些設(shè)備的 CPU 一般是 DSP,硬件資源十分有限,而且大多不支持浮點(diǎn)運(yùn)算。其中孤立音至少包括漢語的 400 多個調(diào)音節(jié) (不考慮聲調(diào) )以及一些常用的詞組。 鑒定委員會一致同意通過技術(shù)鑒定。(這一結(jié)論基于信息產(chǎn)業(yè)部電子科技情報所出據(jù)的查新 報告。通過測試組嚴(yán)格的檢查及抽樣測試,證明上述結(jié)果真實(shí)可靠,該輸入法基本達(dá)到實(shí)用化要求。 DSP嵌入系統(tǒng)定點(diǎn)條件下正確覆蓋率不低于 96%。鑒定委員會經(jīng)過充分討論,一致認(rèn)為: 手機(jī)語音漢字輸入技術(shù)的研發(fā)是具有重大經(jīng)濟(jì)和社會意義的課題,該項(xiàng)目組采用孤立語音的全音節(jié)和詞組的混合識別模式,使用連續(xù)概率分布非特定人的聲學(xué)模型,并輔以多候選的人機(jī)交互方式,較好地實(shí)現(xiàn)了在移動(便攜式)電子設(shè)備上資源有限的條件下方便快捷的漢字語音輸入。 信息產(chǎn)業(yè)部科技司于 2020年 9月 25日在北京組織召開了北京南 山高科技有限公司研制開發(fā)的“ V9?手機(jī)語音漢字輸入法軟件”鑒定會。語音技術(shù)核心研發(fā)隊(duì)伍主要由來自清華、北大和中科院等 著名重點(diǎn)高等院校的博士后、博士及碩士組成 ,并且具有英特爾 \貝爾實(shí)驗(yàn)室等國際大公司工作經(jīng)驗(yàn)。首席科學(xué)家俞鐵城教授為中國語音識別技術(shù)鼻祖, 1972年開始在計算機(jī)上研究語音識別, 1986年受命籌備設(shè)立國家八六三項(xiàng)目語音方 向。語音識別經(jīng)過四十多年的發(fā)展,已經(jīng)顯示出巨大的應(yīng)用前景。 1 南山嵌入式語音文字輸入技術(shù)介紹 一、概述 語音識別是機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1