freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

特定人孤立詞語(yǔ)音識(shí)別的研究畢業(yè)論文(文件)

 

【正文】 徑可以用函數(shù)mi =Φ(ni)來(lái)描述,其中ni = i ,i = 1,2,…,N,Φ(1)=1,Φ(N)=M。D[(ni,mi)] = d [T(ni),R(mi)] + D[(ni1,mi1)] (22)其中的D[(n i1,m i1)]由下式?jīng)Q定D[(ni1,mi1)]=min{ D[(ni1,mi)],D[(ni1,mi1)],D[(ni1,mi2)]} (23) 從 (ni,mi) =(1,1) 開(kāi)始往下搜索 (n2,m2),再搜索 (n3,m3) ……,對(duì)每一個(gè) (ni,mi) 都存儲(chǔ)相應(yīng)的前一格點(diǎn) (ni1,mi1) 及相應(yīng)的幀匹配距離d[ni,mi]。如圖6 所示。 充分利用這兩個(gè)特點(diǎn)可以減少計(jì)算量和存儲(chǔ)空間的需求,形成一種高效的DTW 算法。通過(guò)不斷更新數(shù)據(jù)來(lái)實(shí)現(xiàn),一直進(jìn)行到待測(cè)模板的最后一幀,矢量D 的最后一個(gè)元素即為兩個(gè)模板經(jīng)過(guò)動(dòng)態(tài)規(guī)劃后的匹配距離,這樣可大大減小存儲(chǔ)空間,減小計(jì)算量,從而提高識(shí)別速度。放寬端點(diǎn)限制的DTW算法對(duì)于普通DTW對(duì)端點(diǎn)檢測(cè)比較敏感,端點(diǎn)信息是作為一組獨(dú)立的參數(shù)提供給識(shí)別算法,它要求兩個(gè)比較模式起點(diǎn)對(duì)起點(diǎn),終點(diǎn)對(duì)終點(diǎn),對(duì)端點(diǎn)檢測(cè)的精度要求比較高,當(dāng)環(huán)境噪聲比較大或語(yǔ)音由摩擦音構(gòu)成時(shí),端點(diǎn)檢測(cè)不易進(jìn)行,放松端點(diǎn)限制方法不嚴(yán)格要求端點(diǎn)對(duì)齊,克服了由于端點(diǎn)算法不精確造成的測(cè)試模式和參考模式起點(diǎn)終點(diǎn)不能對(duì)齊的問(wèn)題,一般情況下,起點(diǎn)和終點(diǎn)在縱橫兩個(gè)方向只要放寬 2 3 幀就可以,也就是起點(diǎn)可以在(1,1)、(1,2)、(1,3)、(2,1)、(3,1),終點(diǎn)也可類似放松,放寬端點(diǎn)后的區(qū)域限制圖8在放松端點(diǎn)限制的動(dòng)態(tài)時(shí)間規(guī)整算法中,累積距離矩陣中的元素(1,1)、(1,2)、(1,3)、(2,1)、(3,1),不是根據(jù)局部判決函數(shù)計(jì)算得到的,而是直接將幀匹配距離矩陣的元素填入,自動(dòng)從其中選擇最小的一個(gè)作為起點(diǎn),對(duì)于終點(diǎn)也是從松弛終點(diǎn)的允許范圍內(nèi)選擇一個(gè)最小值作為參考模式和未知模式的匹配距離。 語(yǔ)音預(yù)處理預(yù)加重一般是語(yǔ)音信號(hào)數(shù)字化以后,在參數(shù)分析之前在計(jì)算機(jī)里用具有6dB/倍頻程的提升高頻特性的預(yù)加重?cái)?shù)字濾波器來(lái)實(shí)現(xiàn),它一般是一階的高通數(shù)字濾波器。圖10為男生命令詞“停止”經(jīng)過(guò)預(yù)加重濾波后的仿真結(jié)果。因此,沒(méi)有足夠準(zhǔn)確的語(yǔ)音起止點(diǎn)檢測(cè),將會(huì)降低語(yǔ)音識(shí)別的識(shí)別率,特別是起點(diǎn)的檢測(cè)。各狀態(tài)之間的轉(zhuǎn)換關(guān)系如圖所示。根據(jù)實(shí)際環(huán)境來(lái)設(shè)定具體門限值,語(yǔ)音序列的前10幀一般都為噪聲,所以這里高低能量門限以語(yǔ)音前10幀的平均能量值作為參考依據(jù),這樣我們的算法就是基于動(dòng)態(tài)背景噪聲的。為此,修正短時(shí)過(guò)零率參數(shù),定義為一幀語(yǔ)音波形穿越某個(gè)非零電平T的次數(shù),即下式。先根據(jù)前面的介紹設(shè)定六個(gè)門限值,然后對(duì)程序進(jìn)行初始化,設(shè)定初始狀態(tài)status=0,count=0,silence=0。門窗的開(kāi)關(guān)等引起的突發(fā)性噪聲也可以引起短時(shí)能量或過(guò)零率的數(shù)值很高,但是往往不能維持足夠長(zhǎng)的時(shí)間,通過(guò)最短語(yǔ)音時(shí)間門限值來(lái)判斷。過(guò)零率和短時(shí)能量分別按照第二章的方法計(jì)算。圖14為有噪聲環(huán)境下的端點(diǎn)檢測(cè)。 特征參數(shù)提取子程序及仿真參數(shù)的提取在語(yǔ)音識(shí)別中是很重要的一部分,一個(gè)好的語(yǔ)音特征參數(shù)可以表示語(yǔ)音信號(hào)的全部特征,這就可以提高語(yǔ)音識(shí)別的識(shí)別率。實(shí)驗(yàn)二是對(duì)單個(gè)數(shù)字 1 ~ 6 的識(shí)別。表1和表3分別是實(shí)驗(yàn)一和實(shí)驗(yàn)二采用傳統(tǒng)DTW算法計(jì)算得到的測(cè)試語(yǔ)音與參考模板之間的失真測(cè)度,表2和表4分別是實(shí)驗(yàn)一和實(shí)驗(yàn)二采用改進(jìn)DTW算法計(jì)算得到的測(cè)試語(yǔ)音與參考模板之間的失真測(cè)度。 在仿真過(guò)程中,用tic和toc指令對(duì)傳統(tǒng)DTW算法和改進(jìn)DTW算法的仿真時(shí)間進(jìn)行記錄,如表5至表6所示。 四狀態(tài)端點(diǎn)檢測(cè)法是針對(duì)單字詞的端點(diǎn)檢測(cè),按照本文中講述的方法,可以對(duì)其進(jìn)行擴(kuò)展,使其能檢測(cè)多字詞端點(diǎn)。x = x / max(abs(x))。amp2 = 2。 % 6*10ms = 30msminlen = 15。%計(jì)算過(guò)零率tmp1 = enframe(x(1:end1), FrameLen, FrameInc)。zcr = sum(signs.*diffs, 2)。 t=amp(i)。amp1 = 3*temp。for n=1:length(zcr) goto = 0。 count = count + 1。 count = 0。 elsei。 else % 語(yǔ)音將結(jié)束 silence = silence+1。 count = count + 1。 status = 2。%開(kāi)始端點(diǎn)檢測(cè)x1 = 0。end。%調(diào)整能量門限t=0。signs = (tmp1.*tmp2)0。count = 0。zcr2 = 5。FrameInc = 80。參 考 文 獻(xiàn)[1] 鐘林,劉加,劉潤(rùn)生.多層前向感知機(jī)漢語(yǔ)孤立數(shù)碼語(yǔ)音識(shí)別[J].電路與系統(tǒng)學(xué)報(bào),第5 卷第2 期,10070249(2000)02008205.[2] Oppenbeim AV,Schafer RW.Digital signal Processing[M].Prentice Hall,Inc,1975.[3] 王倩,吳國(guó)平,陳琳.特定人語(yǔ)音識(shí)別算法——DRW算法[J].中國(guó)地質(zhì)大學(xué)(武漢)通信工程學(xué)院,湖北 武漢 430074.[4] 徐文盛,戴蓓倩,方紹武,陸偉.特定人漢語(yǔ)數(shù)碼語(yǔ)音抗噪識(shí)別方法[J].電路與系統(tǒng)學(xué)報(bào),第5 卷第2 期,10070249(2000)02005804.[5] 陳立萬(wàn).基于語(yǔ)音識(shí)別系統(tǒng)中DTW 算法改進(jìn)技術(shù)研究[J].中文核心期刊《微計(jì)算機(jī)信息》(嵌入式與SOC)2006 年第22 卷第22 期.[6] 李瀟,王大堃.基于MATLAB 的孤立字語(yǔ)音識(shí)別試驗(yàn)平臺(tái)[J].四川理工學(xué)院學(xué)報(bào)(自然科學(xué)版),第19 卷 第3 期,16731549(2006)03009704.[7] 黃文梅,楊勇,熊桂林,成曉明.系統(tǒng)仿真分析與設(shè)計(jì)——Matlab語(yǔ)音工程應(yīng)用[M].國(guó)防科技大學(xué)出版社.[8] 林波, 呂明.基于DTW改進(jìn)算法的孤立詞識(shí)別系統(tǒng)的仿真與分析[J].信息技術(shù),2006年第4期.[9] Tretter TJ.Inrtoduction to Discreted Time Signal Processing[M].John Wileyamp。仿真程序見(jiàn)附錄。在完全相同的條件下,對(duì)角線上是正確匹配模板的對(duì)應(yīng)分?jǐn)?shù),可見(jiàn)對(duì)角線上的數(shù)值都應(yīng)是所在行中最小的,從表1至表4中可以看出,對(duì)角線上的數(shù)值確實(shí)是所在行中的最小值,由此驗(yàn)證了算法的正確性。每個(gè)錄音兩遍并保存,一個(gè)做參考模板,一個(gè)做測(cè)試模板。圖15 24維特征參數(shù)部分值 DTW算法仿真第二章講述的算法改進(jìn)均可通過(guò)實(shí)驗(yàn)進(jìn)行證明,本文主要就整體路徑約束的DTW算法的和傳統(tǒng)的DTW算法進(jìn)行實(shí)驗(yàn),并比較其性能優(yōu)劣。從圖上可以看出,在語(yǔ)音前端位置有明顯的噪聲,用基于動(dòng)態(tài)噪聲的四狀態(tài)端點(diǎn)檢測(cè)方法,仍然可以比較精確地檢測(cè)到各個(gè)孤立字的起始端點(diǎn)和結(jié)束端點(diǎn)。 端點(diǎn)檢測(cè)仿真圖13 無(wú)噪聲環(huán)境下的端點(diǎn)檢測(cè)圖14 有噪聲環(huán)境下的端點(diǎn)檢測(cè)圖13為無(wú)噪聲環(huán)境下用四狀態(tài)檢測(cè)方法對(duì)采樣到的男聲命令詞“停”的端點(diǎn)檢測(cè)結(jié)果。流程圖中的四個(gè)狀態(tài)0,1,2,3分別對(duì)應(yīng)靜音狀態(tài)、起始過(guò)渡狀態(tài)、語(yǔ)音狀態(tài)和結(jié)束狀態(tài)。在過(guò)渡狀態(tài)中,由于參數(shù)的數(shù)值比較小,不能確定是否處于真正的有效語(yǔ)音狀態(tài),因此只要兩個(gè)參數(shù)的數(shù)值都回落低門限下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。Zn = — Σ |sgn [Xn(m)T]sgn[Xn(m1)T]|N 1m=012 (33) 下圖為命令詞“停止”的短時(shí)能量和過(guò)零率仿真圖,其中過(guò)零率是按上式進(jìn)行計(jì)算的。amp_aver = — Σ amp(i)10i=1110 (32)上式中的amp( i )為第i幀輸入信號(hào)的短時(shí)能量。 采用多門限判定。由于本文采用的都是一個(gè)字的孤立詞,因此采用基于動(dòng)態(tài)噪聲的四狀態(tài)轉(zhuǎn)移端點(diǎn)檢測(cè)來(lái)消除這些影響。從圖中可以看出預(yù)加重對(duì)信號(hào)處理的重要性,高頻部分的信號(hào)能量得到了加強(qiáng)。本文中取μ= 。軟件設(shè)計(jì)主要是包括語(yǔ)音預(yù)處理子程序、端點(diǎn)檢測(cè)子程序以及語(yǔ)音識(shí)別子程序。 搜索寬度受限的DTW算法 在實(shí)際應(yīng)用中DTW算法加入了一些搜索限制條件, 實(shí)際的搜索范圍是在一定的寬度之內(nèi), 如圖7 所示的對(duì)角線附近的帶狀區(qū)域[9]。 在X軸上的每一幀不再需要與Y軸上的每一幀進(jìn)行比較,而只是與Y軸上[ymin,ymax]間的幀進(jìn)行比較。由于在模板匹配過(guò)程中限定了彎折的斜率,因此平行四邊形之外的格點(diǎn)對(duì)應(yīng)的幀匹配距離是不需要計(jì)算的。 由于DTW不斷地計(jì)算測(cè)試矢量與模板矢量的距離以尋找最優(yōu)的匹配路徑,所以得到的兩矢量匹配是累計(jì)距離最小的路徑函數(shù),這保證了它們之間存在最大的聲學(xué)相似特性。如果路徑已通過(guò)了格點(diǎn)(ni1,mi1),那么下一個(gè)通不定期的格點(diǎn)(ni,mi)只可能是(ni1+1,mi1+2)、(ni1+1,mi1+1)和(ni1,mi1),用γ表示這種約束條件。路徑不是隨意選擇的,首先任何一種語(yǔ)音的發(fā)音快慢都有可能變化,但是其各部分的先后次序不可能改變,因此所選的路徑必定是從左下角出發(fā),在右上角結(jié)束。設(shè)n和m分別是T 和R 中任意一幀,d [T(n),R(m)]表示這兩幀特征矢量之間的距離,在DTW中通常采用歐式距離。語(yǔ)音識(shí)別就是要將測(cè)試語(yǔ)音的這個(gè)特征向量同模板庫(kù)中已存在的語(yǔ)音特征向量進(jìn)行模式匹配,尋找距離最短的模式作為識(shí)別結(jié)果。DTW是采用一種最優(yōu)化的算法——?jiǎng)討B(tài)規(guī)整法,通過(guò)將待識(shí)別語(yǔ)音信號(hào)的時(shí)間軸進(jìn)行不均勻地扭曲和彎曲,使其特征與模板特征對(duì)齊,并在兩者之間不斷的進(jìn)行兩個(gè)矢量距離最小的匹配路徑計(jì)算,從而獲得兩個(gè)矢量匹配時(shí)累積距離最小的規(guī)整函數(shù)。在訓(xùn)練階段,用戶將詞匯表中的每個(gè)詞依次說(shuō)一遍,作為模板存入模板庫(kù);在識(shí)別階段,將輸入語(yǔ)音的特征矢量時(shí)間序列依次與模板庫(kù)中的每個(gè)模板進(jìn)行相似度比較,將相似度最高的作為識(shí)別結(jié)果輸出。由上式計(jì)算得到的差分參數(shù)為一階 MFCC 差分參數(shù),用同樣的公式對(duì)一階差公參數(shù)進(jìn)行計(jì)算,可以得到二階差 MFCC。( 2 ) 把功率譜通過(guò)帶通濾波器,然后再取自然對(duì)數(shù)。另外在頻率較低的區(qū)域,fm 和 f 之間有一段是線性的。因此。因此,LPCC系數(shù)也是基于合成的參數(shù),沒(méi)有充分利用人耳的聽(tīng)覺(jué)特性,對(duì)輔音的描述能力較差,抗噪聲性能較差。 特征參數(shù)的提取特征參數(shù)提取的目的是抽取語(yǔ)音特征,以使在語(yǔ)音識(shí)別時(shí)類內(nèi)距離盡量小,類間距離盡量大。 一幀信號(hào)中波形穿越零電平的次數(shù),稱為過(guò)零率。幅值amp2amp10N0N1N2n過(guò)零率ZCR00N0N1N2n圖2 用能量和過(guò)零率進(jìn)行端點(diǎn)檢測(cè)輸入的語(yǔ)音信號(hào)X(l),加窗分幀處理后得到的第n幀的語(yǔ)音信號(hào)為Xn(m),則:Xn(m)= ω(m)X(n+m) m=0 ~ (N1) (12)其中,n=0,1T,2T,…,并且N為幀長(zhǎng),T為幀移。 端點(diǎn)檢測(cè)的目的是從包含語(yǔ)音的一般信號(hào)中確定出語(yǔ)音的起點(diǎn)以及終點(diǎn), 有效的端點(diǎn)檢測(cè)不僅能使處理時(shí)間最小, 而且能排除無(wú)聲段的噪聲干擾, 從而使識(shí)別系統(tǒng)具有良好的識(shí)別性能, 端點(diǎn)檢測(cè)的成功與否甚至在某種程度上直接決定了整個(gè)語(yǔ)音識(shí)別系統(tǒng)的成敗。通常用一階FIR數(shù)字濾波器來(lái)實(shí)現(xiàn),系統(tǒng)函數(shù)為:H(z)= 1 – a z –1 (a 接近于1) (11)進(jìn)行預(yù)加重?cái)?shù)字濾波處理后,接下來(lái)就要進(jìn)行加窗分幀處理。 在識(shí)別階段,語(yǔ)音信號(hào)經(jīng)過(guò)相同的通道得到語(yǔ)音特征參數(shù),生成測(cè)試模板并與參考模板進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模板作為識(shí)別結(jié)果。預(yù)處理特征提取輸入語(yǔ)音測(cè)度估計(jì)識(shí)別判決參考模板識(shí)別結(jié)果模板庫(kù)識(shí)別訓(xùn)練圖1 一般語(yǔ)音識(shí)別系統(tǒng)框圖一個(gè)完整特定人孤立詞語(yǔ)音識(shí)別系統(tǒng)通常包括語(yǔ)音的輸入、語(yǔ)音的預(yù)處理(預(yù)加重、加窗分幀、端點(diǎn)檢測(cè)等)、特征提取、訓(xùn)練與識(shí)別等幾個(gè)環(huán)節(jié),基本構(gòu)成如圖1所示。最后給出了兩者的對(duì)比仿真。近年來(lái),消費(fèi)類電子產(chǎn)品對(duì)低成本、高穩(wěn)健性的語(yǔ)音識(shí)別片上系統(tǒng)的需要快速增加,語(yǔ)音識(shí)別系統(tǒng)大量地從實(shí)驗(yàn)室的PC平臺(tái)轉(zhuǎn)移到嵌入式設(shè)備中。在這樣的水平基礎(chǔ)上,語(yǔ)音識(shí)別技術(shù)開(kāi)始嘗試從實(shí)驗(yàn)室演示系統(tǒng)走向?qū)嵱没唐贰?000年以來(lái),人機(jī)語(yǔ)音交互成為研究的焦點(diǎn)。70年代,在模式識(shí)別思想、動(dòng)態(tài)規(guī)劃方法、線性預(yù)測(cè)思想等基礎(chǔ)研究的成功應(yīng)用的支撐下,孤立詞發(fā)音和孤立語(yǔ)句發(fā)音的識(shí)別成為了可行的有用技術(shù)。這里僅僅按照一些重要方法的出現(xiàn)和發(fā)展為線索進(jìn)行簡(jiǎn)要回顧。非特定人則可用于不同的用戶,這種識(shí)別系統(tǒng)的通用性好,應(yīng)用面廣,但難度也較大,不容易得到高的識(shí)別率,它的實(shí)用化將會(huì)有很高的經(jīng)濟(jì)價(jià)值和深遠(yuǎn)的社會(huì)意義。因此,可以用來(lái)實(shí)現(xiàn)簡(jiǎn)單的家用電器控制。其主要應(yīng)用在語(yǔ)音命令、應(yīng)用于電信增值業(yè)務(wù)、數(shù)據(jù)庫(kù)檢索等方面。語(yǔ)音識(shí)別經(jīng)過(guò)四十多年的發(fā)展,已經(jīng)顯示出巨大的應(yīng)用前景[1]。提出了基于動(dòng)態(tài)噪聲的四狀態(tài)端點(diǎn)檢測(cè)算法,給出了詳細(xì)的算法流程圖
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1