freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音識別是機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄?在線瀏覽

2024-11-07 18:42本頁面
  

【正文】 案采用 MFCC 參數(shù)為語音特征參數(shù)。 將線性頻標(biāo)轉(zhuǎn)化為 Mel 頻標(biāo)。濾波器的中心頻率間隔特點(diǎn)是在 1000Hz 以下為線性分布, 1000Hz 以上 為等比數(shù)列分布。 用離散余弦變換( Discrete Cosine Transformation, DCT)將濾波器輸出變換到倒譜域: ?? ?? 24 1 ]24)21(c os [)log (j jk jkYC ? k = 1,2,...,P 4 其中 P 為 MFCC 參數(shù)的階數(shù),我們?nèi)?P= 12。 為體現(xiàn)語音的動態(tài)特性,我們還在語音特征中加入了一階差分倒譜,其計算方法如下式所示: ??? ??? 2 2 )()( k kll mkcmc Pm??1 其中下標(biāo) l 與 lk 表示第 l 與 lk 幀, m 表示第 m 維。 M 為濾波器個數(shù), N 為一幀語音信號的點(diǎn)數(shù)。在線性頻率上,當(dāng) m 較小時相鄰的 fm 間隔很小,隨著 m 的增加相鄰的 fm 間隔逐漸拉開。 ? ?700/100 01ln 100 07001ln ???????? ?? fm e l 這些帶通濾波器的參數(shù)是事先計算好的。 5 0 20 40 60 80 100 120 14000 . 10 . 20 . 30 . 40 . 50 . 60 . 70 . 80 . 91 圖 利用人耳仿生學(xué)特性設(shè)計的 Mel尺度濾波器組 測度估計技術(shù)可以采用動態(tài)時間彎折 DTW、隱馬爾可夫模型 HMM 或人工神經(jīng)網(wǎng) ANN等算法,我們采用國際上最先進(jìn)的 HMM,這樣我們能夠比較容易的實(shí)現(xiàn)非特定人,而且系統(tǒng)結(jié)構(gòu)也比較靈活、一致。 根據(jù)描述的語音單位的大小, HMM 可分為: 基于整詞模型的 HMM(Word based HMM)。因此很多小詞匯量語音識別系統(tǒng)均采用整詞模型HMM。 基于子詞模型的 HMM(Sub Word based HMM)。其優(yōu)點(diǎn)為模型總數(shù)少,所以在大詞匯量語音識別中得到了廣泛的應(yīng)用。本技術(shù)方案采用基于半音節(jié)(即聲、韻母)的語音建模方法,其識別模型拓?fù)浣Y(jié)構(gòu)如圖 6 所示,其中靜音 HMM 采用 1 個狀態(tài),每一聲母模型采用2 個狀態(tài),每一韻母模型采用 4 個狀態(tài)。其輸出概率是基于一套碼本的離散概率分布,其優(yōu)點(diǎn)在于由于實(shí)現(xiàn)了存儲量和計算量都較小,所需的訓(xùn)練語音也較少,但其矢量量化的過程會造成性能的損失。 其輸出概率是連續(xù)概率密度函數(shù) (一般是高斯混合密度函數(shù) )。 半連續(xù) HMM(Semi Continuous HMM, SCHMM)。其性能和所需的訓(xùn)練語音等均介于 DHMM 和 CDHMM 之間。 狀態(tài)輸出概率分布為混合高斯密度函數(shù)。 靜 音 模 型聲 母 N 模 型靜 音 模 型圖 6 , 識 別 模 型
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1