freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

特定人孤立詞語(yǔ)音識(shí)別的研究畢業(yè)論文(參考版)

2025-06-25 16:00本頁(yè)面
  

【正文】 elsei。 else % 語(yǔ)音將結(jié)束 silence = silence+1。 count = 0。 count = count + 1。 count = count + 1。 status = 2。for n=1:length(zcr) goto = 0。%開始端點(diǎn)檢測(cè)x1 = 0。amp1 = 3*temp。end。 t=amp(i)。%調(diào)整能量門限t=0。zcr = sum(signs.*diffs, 2)。signs = (tmp1.*tmp2)0。%計(jì)算過零率tmp1 = enframe(x(1:end1), FrameLen, FrameInc)。count = 0。 % 6*10ms = 30msminlen = 15。zcr2 = 5。amp2 = 2。FrameInc = 80。x = x / max(abs(x))。參 考 文 獻(xiàn)[1] 鐘林,劉加,劉潤(rùn)生.多層前向感知機(jī)漢語(yǔ)孤立數(shù)碼語(yǔ)音識(shí)別[J].電路與系統(tǒng)學(xué)報(bào),第5 卷第2 期,10070249(2000)02008205.[2] Oppenbeim AV,Schafer RW.Digital signal Processing[M].Prentice Hall,Inc,1975.[3] 王倩,吳國(guó)平,陳琳.特定人語(yǔ)音識(shí)別算法——DRW算法[J].中國(guó)地質(zhì)大學(xué)(武漢)通信工程學(xué)院,湖北 武漢 430074.[4] 徐文盛,戴蓓倩,方紹武,陸偉.特定人漢語(yǔ)數(shù)碼語(yǔ)音抗噪識(shí)別方法[J].電路與系統(tǒng)學(xué)報(bào),第5 卷第2 期,10070249(2000)02005804.[5] 陳立萬(wàn).基于語(yǔ)音識(shí)別系統(tǒng)中DTW 算法改進(jìn)技術(shù)研究[J].中文核心期刊《微計(jì)算機(jī)信息》(嵌入式與SOC)2006 年第22 卷第22 期.[6] 李瀟,王大堃.基于MATLAB 的孤立字語(yǔ)音識(shí)別試驗(yàn)平臺(tái)[J].四川理工學(xué)院學(xué)報(bào)(自然科學(xué)版),第19 卷 第3 期,16731549(2006)03009704.[7] 黃文梅,楊勇,熊桂林,成曉明.系統(tǒng)仿真分析與設(shè)計(jì)——Matlab語(yǔ)音工程應(yīng)用[M].國(guó)防科技大學(xué)出版社.[8] 林波, 呂明.基于DTW改進(jìn)算法的孤立詞識(shí)別系統(tǒng)的仿真與分析[J].信息技術(shù),2006年第4期.[9] Tretter TJ.Inrtoduction to Discreted Time Signal Processing[M].John Wileyamp。 四狀態(tài)端點(diǎn)檢測(cè)法是針對(duì)單字詞的端點(diǎn)檢測(cè),按照本文中講述的方法,可以對(duì)其進(jìn)行擴(kuò)展,使其能檢測(cè)多字詞端點(diǎn)。仿真程序見附錄。 在仿真過程中,用tic和toc指令對(duì)傳統(tǒng)DTW算法和改進(jìn)DTW算法的仿真時(shí)間進(jìn)行記錄,如表5至表6所示。在完全相同的條件下,對(duì)角線上是正確匹配模板的對(duì)應(yīng)分?jǐn)?shù),可見對(duì)角線上的數(shù)值都應(yīng)是所在行中最小的,從表1至表4中可以看出,對(duì)角線上的數(shù)值確實(shí)是所在行中的最小值,由此驗(yàn)證了算法的正確性。表1和表3分別是實(shí)驗(yàn)一和實(shí)驗(yàn)二采用傳統(tǒng)DTW算法計(jì)算得到的測(cè)試語(yǔ)音與參考模板之間的失真測(cè)度,表2和表4分別是實(shí)驗(yàn)一和實(shí)驗(yàn)二采用改進(jìn)DTW算法計(jì)算得到的測(cè)試語(yǔ)音與參考模板之間的失真測(cè)度。每個(gè)錄音兩遍并保存,一個(gè)做參考模板,一個(gè)做測(cè)試模板。實(shí)驗(yàn)二是對(duì)單個(gè)數(shù)字 1 ~ 6 的識(shí)別。圖15 24維特征參數(shù)部分值 DTW算法仿真第二章講述的算法改進(jìn)均可通過實(shí)驗(yàn)進(jìn)行證明,本文主要就整體路徑約束的DTW算法的和傳統(tǒng)的DTW算法進(jìn)行實(shí)驗(yàn),并比較其性能優(yōu)劣。 特征參數(shù)提取子程序及仿真參數(shù)的提取在語(yǔ)音識(shí)別中是很重要的一部分,一個(gè)好的語(yǔ)音特征參數(shù)可以表示語(yǔ)音信號(hào)的全部特征,這就可以提高語(yǔ)音識(shí)別的識(shí)別率。從圖上可以看出,在語(yǔ)音前端位置有明顯的噪聲,用基于動(dòng)態(tài)噪聲的四狀態(tài)端點(diǎn)檢測(cè)方法,仍然可以比較精確地檢測(cè)到各個(gè)孤立字的起始端點(diǎn)和結(jié)束端點(diǎn)。圖14為有噪聲環(huán)境下的端點(diǎn)檢測(cè)。 端點(diǎn)檢測(cè)仿真圖13 無(wú)噪聲環(huán)境下的端點(diǎn)檢測(cè)圖14 有噪聲環(huán)境下的端點(diǎn)檢測(cè)圖13為無(wú)噪聲環(huán)境下用四狀態(tài)檢測(cè)方法對(duì)采樣到的男聲命令詞“?!钡亩它c(diǎn)檢測(cè)結(jié)果。過零率和短時(shí)能量分別按照第二章的方法計(jì)算。流程圖中的四個(gè)狀態(tài)0,1,2,3分別對(duì)應(yīng)靜音狀態(tài)、起始過渡狀態(tài)、語(yǔ)音狀態(tài)和結(jié)束狀態(tài)。門窗的開關(guān)等引起的突發(fā)性噪聲也可以引起短時(shí)能量或過零率的數(shù)值很高,但是往往不能維持足夠長(zhǎng)的時(shí)間,通過最短語(yǔ)音時(shí)間門限值來(lái)判斷。在過渡狀態(tài)中,由于參數(shù)的數(shù)值比較小,不能確定是否處于真正的有效語(yǔ)音狀態(tài),因此只要兩個(gè)參數(shù)的數(shù)值都回落低門限下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。先根據(jù)前面的介紹設(shè)定六個(gè)門限值,然后對(duì)程序進(jìn)行初始化,設(shè)定初始狀態(tài)status=0,count=0,silence=0。Zn = — Σ |sgn [Xn(m)T]sgn[Xn(m1)T]|N 1m=012 (33) 下圖為命令詞“停止”的短時(shí)能量和過零率仿真圖,其中過零率是按上式進(jìn)行計(jì)算的。為此,修正短時(shí)過零率參數(shù),定義為一幀語(yǔ)音波形穿越某個(gè)非零電平T的次數(shù),即下式。amp_aver = — Σ amp(i)10i=1110 (32)上式中的amp( i )為第i幀輸入信號(hào)的短時(shí)能量。根據(jù)實(shí)際環(huán)境來(lái)設(shè)定具體門限值,語(yǔ)音序列的前10幀一般都為噪聲,所以這里高低能量門限以語(yǔ)音前10幀的平均能量值作為參考依據(jù),這樣我們的算法就是基于動(dòng)態(tài)背景噪聲的。 采用多門限判定。各狀態(tài)之間的轉(zhuǎn)換關(guān)系如圖所示。由于本文采用的都是一個(gè)字的孤立詞,因此采用基于動(dòng)態(tài)噪聲的四狀態(tài)轉(zhuǎn)移端點(diǎn)檢測(cè)來(lái)消除這些影響。因此,沒有足夠準(zhǔn)確的語(yǔ)音起止點(diǎn)檢測(cè),將會(huì)降低語(yǔ)音識(shí)別的識(shí)別率,特別是起點(diǎn)的檢測(cè)。從圖中可以看出預(yù)加重對(duì)信號(hào)處理的重要性,高頻部分的信號(hào)能量得到了加強(qiáng)。圖10為男生命令詞“停止”經(jīng)過預(yù)加重濾波后的仿真結(jié)果。本文中取μ= 。 語(yǔ)音預(yù)處理預(yù)加重一般是語(yǔ)音信號(hào)數(shù)字化以后,在參數(shù)分析之前在計(jì)算機(jī)里用具有6dB/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器來(lái)實(shí)現(xiàn),它一般是一階的高通數(shù)字濾波器。軟件設(shè)計(jì)主要是包括語(yǔ)音預(yù)處理子程序、端點(diǎn)檢測(cè)子程序以及語(yǔ)音識(shí)別子程序。放寬端點(diǎn)限制的DTW算法對(duì)于普通DTW對(duì)端點(diǎn)檢測(cè)比較敏感,端點(diǎn)信息是作為一組獨(dú)立的參數(shù)提供給識(shí)別算法,它要求兩個(gè)比較模式起點(diǎn)對(duì)起點(diǎn),終點(diǎn)對(duì)終點(diǎn),對(duì)端點(diǎn)檢測(cè)的精度要求比較高,當(dāng)環(huán)境噪聲比較大或語(yǔ)音由摩擦音構(gòu)成時(shí),端點(diǎn)檢測(cè)不易進(jìn)行,放松端點(diǎn)限制方法不嚴(yán)格要求端點(diǎn)對(duì)齊,克服了由于端點(diǎn)算法不精確造成的測(cè)試模式和參考模式起點(diǎn)終點(diǎn)不能對(duì)齊的問題,一般情況下,起點(diǎn)和終點(diǎn)在縱橫兩個(gè)方向只要放寬 2 3 幀就可以,也就是起點(diǎn)可以在(1,1)、(1,2)、(1,3)、(2,1)、(3,1),終點(diǎn)也可類似放松,放寬端點(diǎn)后的區(qū)域限制圖8在放松端點(diǎn)限制的動(dòng)態(tài)時(shí)間規(guī)整算法中,累積距離矩陣中的元素(1,1)、(1,2)、(1,3)、(2,1)、(3,1),不是根據(jù)局部判決函數(shù)計(jì)算得到的,而是直接將幀匹配距離矩陣的元素填入,自動(dòng)從其中選擇最小的一個(gè)作為起點(diǎn),對(duì)于終點(diǎn)也是從松弛終點(diǎn)的允許范圍內(nèi)選擇一個(gè)最小值作為參考模式和未知模式的匹配距離。 搜索寬度受限的DTW算法 在實(shí)際應(yīng)用中DTW算法加入了一些搜索限制條件, 實(shí)際的搜索范圍是在一定的寬度之內(nèi), 如圖7 所示的對(duì)角線附近的帶狀區(qū)域[9]。通過不斷更新數(shù)據(jù)來(lái)實(shí)現(xiàn),一直進(jìn)行到待測(cè)模板的最后一幀,矢量D 的最后一個(gè)元素即為兩個(gè)模板經(jīng)過動(dòng)態(tài)規(guī)劃后的匹配距離,這樣可大大減小存儲(chǔ)空間,減小計(jì)算量,從而提高識(shí)別速度。 在X軸上的每一幀不再需要與Y軸上的每一幀進(jìn)行比較,而只是與Y軸上[ymin,ymax]間的幀進(jìn)行比較。 充分利用這兩個(gè)特點(diǎn)可以減少計(jì)算量和存儲(chǔ)空間的需求,形成一種高效的DTW 算法。由于在模板匹配過程中限定了彎折的斜率,因此平行四邊形之外的格點(diǎn)對(duì)應(yīng)的幀匹配距離是不需要計(jì)算的。如圖6 所示。 由于DTW不斷地計(jì)算測(cè)試矢量與模板矢量的距離以尋找最優(yōu)的匹配路徑,所以得到的兩矢量匹配是累計(jì)距離最小的路徑函數(shù),這保證了它們之間存在最大的聲學(xué)相似特性。D[(ni,mi)] = d [T(ni),R(mi)] + D[(ni1,mi1)] (22)其中的D[(n i1,m i1)]由下式?jīng)Q定D[(ni1,mi1)]=min{ D[(ni1,mi)],D[(ni1,mi1)],D[(ni1,mi2)]} (23) 從 (ni,mi) =(1,1) 開始往下搜索 (n2,m2),再搜索 (n3,m3) ……,對(duì)每一個(gè) (ni,mi) 都存儲(chǔ)相應(yīng)的前一格點(diǎn) (ni1,mi1) 及相應(yīng)的幀匹配距離d[ni,mi]。如果路徑已通過了格點(diǎn)(ni1,mi1),那么下一個(gè)通不定期的格點(diǎn)(ni,mi)只可能是(ni1+1,mi1+2)、(ni1+1,mi1+1)和(ni1,mi1),用γ表示這種約束條件。路徑可以用函數(shù)mi =Φ(ni)來(lái)描述,其中ni = i ,i = 1,2,…,N,Φ(1)=1,Φ(N)=M。路徑不是隨意選擇的,首先任何一種語(yǔ)音的發(fā)音快慢都有可能變化,但是其各部分的先后次序不可能改變,因此所選的路徑必定是從左下角出發(fā),在右上角結(jié)束。如上圖所示。設(shè)n和m分別是T 和R 中任意一幀,d [T(n),R(m)]表示這兩幀特征矢量之間的距離,在DTW中通常采用歐式距離。2(1,1)NMmnTR2(N,M)D[T(n),R(m)]R(m)T(n)(n,m) 圖4 動(dòng)態(tài)時(shí)間彎曲(DTW)算法求最小失真假設(shè)參考模板和測(cè)試模板分別用R和T表示,它們之間的相似度用它們之間的距離D[T,R]來(lái)度量,距離越小相似度越高。語(yǔ)音識(shí)別就是要將測(cè)試語(yǔ)音的這個(gè)特征向量同模板庫(kù)中已存在的語(yǔ)音特征向量進(jìn)行模式匹配,尋找距離最短的模式作為識(shí)別結(jié)果。DTW解決了發(fā)音長(zhǎng)短不一的模板匹配問題,是語(yǔ)音識(shí)別中出現(xiàn)較早,較為經(jīng)典的一種算法[10]。DTW是采用一種最優(yōu)化的算法——?jiǎng)討B(tài)規(guī)整法,通過將待識(shí)別語(yǔ)音信號(hào)的時(shí)間軸進(jìn)行不均勻地扭曲和彎曲,使其特征與模板特征對(duì)齊,并在兩者之間不斷的進(jìn)行兩個(gè)矢量距離最小的匹配路徑計(jì)算,從而獲得兩個(gè)矢量匹配時(shí)累積距離最小的規(guī)整函數(shù)。因此在進(jìn)行模板匹配時(shí),把識(shí)別信號(hào)伸長(zhǎng)或縮短至參考模板的長(zhǎng)度是必不可少的,但研究表明,簡(jiǎn)單的線性拉伸或壓縮并不能有效的提高識(shí)別率。在訓(xùn)練階段,用戶將詞匯表中的每個(gè)詞依次說(shuō)一遍,作為模板存入模板庫(kù);在識(shí)別階段,將輸入語(yǔ)音的特征矢量時(shí)間序列依次與模板庫(kù)中的每個(gè)模板進(jìn)行相似度比較,將相似度最高的作為識(shí)別結(jié)果輸出。2 Dynamic Time Warping算法假定一個(gè)孤立詞語(yǔ)音識(shí)別系統(tǒng),利用模板匹配法進(jìn)行識(shí)別。由上式計(jì)算得到的差分參數(shù)為一階 MFCC 差分參數(shù),用同樣的公式對(duì)一階差公參數(shù)進(jìn)行計(jì)算,可以得到二階差 MFCC。為每幀數(shù)據(jù)計(jì)算出 L 階 MFCC 參數(shù)后,一般還要為這 L 個(gè)系數(shù)分別乘以不同的權(quán)系數(shù),實(shí)際上是一個(gè)短窗口:Cm = Wm Cm^L2Wm = 1 + — sin ( — ), 1≤m≤LπLm (16) 差分倒譜參數(shù)標(biāo)準(zhǔn)的 MFCC 參數(shù)反映了語(yǔ)音參數(shù)的靜音特特性,而人耳對(duì)語(yǔ)音的動(dòng)態(tài)特征更為敏感,所以通常是用差分倒譜參數(shù)來(lái)描述語(yǔ)音特征的動(dòng)態(tài)特性。( 2 ) 把功率譜通過帶通濾波器,然后再取自然對(duì)數(shù)。 求MFCC參數(shù)的過程為:( 1 ) 對(duì)輸入語(yǔ)音幀作快速傅利葉變換FFT,將時(shí)域信號(hào)轉(zhuǎn)化為頻域信號(hào)。另外在頻率較低的區(qū)域,fm 和 f 之間有一段是線性的。每個(gè)濾波器具有三角形特性,其中心頻率為fm,它們?cè)?Mel 頻率軸上是均勻分布的。因此。由于充分模擬了人的聽覺特性,而且沒有任何前提假設(shè),因此MFCC參數(shù)具有很好的識(shí)別性能和抗噪能力。因此,LPCC系數(shù)也是基于合成的參數(shù),沒有充分利用人耳的聽覺特性,對(duì)輔音的描述能力較差,抗噪聲性能較差。 常用的參數(shù)有線性預(yù)測(cè)的倒譜系數(shù)(LPCC)和Mel頻率的倒譜系數(shù)(MFCC)。 特征參數(shù)的提取特征參數(shù)提取的目的是抽取語(yǔ)音特征,以使在語(yǔ)音識(shí)別時(shí)類內(nèi)距離盡量小,類間距離盡量大。 考慮到開始以后總會(huì)出現(xiàn)能量較大的濁音,設(shè)一個(gè)較高的門限amp1用以確定語(yǔ)音已開始,再取一比amp1稍低的門限amp2,用以確定語(yǔ)音的起始點(diǎn)N1,和結(jié)束點(diǎn)N2,由于語(yǔ)音起始段往往存在著能量很弱的清輔音(如[s]、[f]等),只用能量去判斷,很難把它們和無(wú)聲區(qū)分開,但發(fā)現(xiàn)它們的過零率明顯高于無(wú)聲段,因此可以用過零率來(lái)精確起點(diǎn)。 一幀信號(hào)中波形穿越零電平的次數(shù),稱為過零率。②區(qū)分聲母與韻母的邊界,無(wú)聲和有聲的分界,連字的分界等。幅值amp2amp10N0N1N2n過零率ZCR00N0N1N2n圖2 用能量和過零率進(jìn)行
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1