freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于dtw算法的語音識(shí)別原理與實(shí)現(xiàn)(完整版)

2025-07-31 01:26上一頁面

下一頁面
  

【正文】 預(yù)濾波、采樣和量化、分幀、加窗、預(yù)加重、端點(diǎn)檢測等。分幀小能清楚地描繪語音信號(hào)的時(shí)變特征但計(jì)算量大;分幀大能減少計(jì)算量但相鄰幀間變化不大,容易丟失信號(hào)特征。預(yù)加重濾波器在Matlab中可由語句x=filter([],1,x)實(shí)現(xiàn)。本系統(tǒng)中的端點(diǎn)檢測采用時(shí)域方法故加矩形窗,計(jì)算MFCC系數(shù)時(shí)加漢明窗。語音段的能量比噪聲段的大,語音段的能量是噪聲段能量疊加語音聲波能量的和。過零率就是樣本改變符號(hào)次數(shù),定義語音信號(hào)壽(m)的短時(shí)過零率Zn為: (33)1 (x≥0)1 (x≤0)sgn[x]={ (34)清音的能量多集中在較高的頻率上,它的平均過零率要高于濁音,故短時(shí)過零率可以用來區(qū)分清音、濁音以及無聲。整個(gè)語音端點(diǎn)檢測分為四部分:靜音段、過度段、語音段、結(jié)束段。本系統(tǒng)中EHigh,ELow,ZHigh,ZLow的取值分別為:EHigh=max([min(amp)*10,mean(amp)*,max(amp)*])。LPCC(Linear Prediction Cepstrum Coefficient,線性預(yù)測倒譜系數(shù))是LPC在倒譜域中的表示。這需要在計(jì)算之前先在語音的頻譜范圍內(nèi)設(shè)置若干個(gè)帶通濾波器:Hm(n) m=0,1,…,M1。5 DTW算法實(shí)現(xiàn)DTW(Dynamic Time Warping,動(dòng)態(tài)時(shí)間規(guī)整)是語音識(shí)別中較為經(jīng)典的一種算法。如圖51所示為三種匹配模式對(duì)同一詞兩次發(fā)音的匹配距離(兩條曲線間的陰影面積),顯然D3D2D1。DTW算法分兩步進(jìn)行,一是計(jì)算兩個(gè)模式各幀之間的距離,即求出幀匹配距離矩陣,二是在幀匹配距離矩陣中找出一條最佳路徑。 搜索寬度限制以圖53中的局部約束路徑為例,待測模板軸上每前進(jìn)一幀,對(duì)于點(diǎn)(in,im)只需要用到前一列(in1,im)、(inl,iml)和(in1,im2)三點(diǎn)的累積距離,也就是im1和im2兩行的累積距離。一般情況下,起點(diǎn)和終點(diǎn)在縱橫兩個(gè)方向只要放寬23幀就可以,也就是起點(diǎn)可以在(1,1),(l,2),(1,3),(2,1),(3,l),終點(diǎn)類似。圖62為4組語音的識(shí)別測試結(jié)果圖,詳細(xì)數(shù)據(jù)如下表:數(shù)字01234567890~9正確數(shù)424434334233錯(cuò)誤數(shù)02001011027正確率圖62 語音識(shí)別測試結(jié)果參考文獻(xiàn)[1] 詹新明,黃南山,楊燦. 語音識(shí)別技術(shù)研究進(jìn)展[J]. 現(xiàn)代計(jì)算機(jī)(專業(yè)版), 2008,(09)[2] 相征,朗朗,王靜. 基于基音頻能值的端點(diǎn)檢測算法[J]. 安徽工程科技學(xué)院學(xué)報(bào), 2008,(09)[3] 沈宏余,李英. 語音端點(diǎn)檢測方法的研究[J]. 科學(xué)技術(shù)與工程, 2008,(08)[4] 李景川,董慧穎. 一種改進(jìn)的基于短時(shí)能量的端點(diǎn)檢測算法[J]. 沈陽理工大學(xué)學(xué)報(bào),2008,(06)[5] 蔡妍. 語音信號(hào)端點(diǎn)檢測方法的研究[碩士學(xué)位論文][D]. 江南大學(xué), 2008[6] 吳亞棟. 語音識(shí)別基礎(chǔ)[R]. 上海交通大學(xué)計(jì)算機(jī)系, 200701[7] 吳曉平,崔光照,路康. 基于DTW算法的語音識(shí)別系統(tǒng)實(shí)現(xiàn)[J]. 電子工程師, 2004,(07)[8] 譚保華,熊健民,劉幺和. 語音識(shí)別技術(shù)概述[J]. 鄖陽師范高等??茖W(xué)校學(xué)報(bào), 2004,(06)[9] 朱淑琴. 語音識(shí)別系統(tǒng)關(guān)鍵技術(shù)研究[碩士學(xué)位論文] [D]. 西安電子科技大學(xué), 2004[10] 何強(qiáng),何英. MATLAB擴(kuò)展編程[M]. 清華大學(xué)出版社, 200206第 17 頁 共 17 頁。圖56 改進(jìn)的DTW算法原理圖Ck=(ik, jk)C1=(1, 1)CK=(I, J)j = i rj = i + r時(shí)間規(guī)整函數(shù) width ijt1 t2 t3 ti tI TRr1 r2 rj rJ 在放寬端點(diǎn)限制的DTW算法中,累積距離矩陣中的元素(1,l),(l,2),(l,3),(2,l),(3,1)不是根據(jù)局部判決函數(shù)計(jì)算得到的,而是直接將幀匹配距離矩陣的元素填入,自動(dòng)從其中選擇最小的一個(gè)作為起點(diǎn),對(duì)于終點(diǎn)也是從松弛終點(diǎn)的允許范圍內(nèi)選擇一個(gè)最小值作為參考模式和未知模式的匹配距離。基于這種循環(huán)遞推計(jì)算,只需分配3N的存儲(chǔ)空間重復(fù)使用,而不需要保存幀匹配距離矩陣和所有的累積距離矩陣。那么(in,im)一定選擇這三個(gè)距離中的最小者所對(duì)應(yīng)的點(diǎn)作為其前續(xù)格點(diǎn),這時(shí)此路徑的累積距離為:D(in,im)=d(T(in),R(im))+min{D(in1,im),D(in1,im1),D(in1,im2)} (55)這樣從(l,1)點(diǎn)出發(fā)(令D(1,1)=0)搜索,反復(fù)遞推,直到(N,M)就可以得到最優(yōu)路徑,而且D(N,M)就是最佳匹配路徑所對(duì)應(yīng)的匹配距離。由于DTW不斷地計(jì)算兩矢量的距離以尋找最優(yōu)的匹配路徑,所以得到的是兩矢量匹配時(shí)累積距離最小所對(duì)應(yīng)的規(guī)整函數(shù),這就保證了它們之間存在
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1