freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于基音周期模型的語音識別_畢業(yè)設(shè)計論文(編輯修改稿)

2024-08-14 15:09 本頁面
 

【文章內(nèi)容簡介】 考慮的問題是窗的問題,使用一個窗函數(shù),令窗不動,而語音信號移動,這就是經(jīng)典的短時自相關(guān)函數(shù)法。一般認(rèn)為窗長至少應(yīng)大于兩個基音周期。窗長應(yīng)該選的更長一些,避免第一最大峰值點與基音周期不一致,窗長長了就可以更清楚的了解自相關(guān)函數(shù)的波形,更有利于檢測。計算起來不 方便,近年來高速數(shù)字信號處理器 (DSP)的使用,使讓這一算法簡單有效。 N 越小,誤差越大,好處是運算時較簡便。所以要選擇適當(dāng)?shù)?N 值。 用短時平均能量進(jìn)行清 /濁音的判斷 在基音檢測的同時,應(yīng)進(jìn)行清 /濁音判斷,因為可將濁音 /清音特征看作與周期 /非周期相同的特征,所以可以簡化問題,濁 /清音往往按自相關(guān)函數(shù)和預(yù)測誤差的自相關(guān)函數(shù)的峰值來決定。但是在無周期性的有聲區(qū)內(nèi),這種方法不能起作用,所以就經(jīng)常采用其他的參數(shù)來提高精確度。輔助參數(shù)主要有 :語音信號能量;過零數(shù);自 相關(guān)函數(shù);線性預(yù)測系數(shù)。下面采用語音信號能量法: 語音信號 { x ( n) } 的某幀信號的短時平均能量 En 的定義為 : 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文) 2 基音檢測常用的算法 7 ???? ??nNnm mnwmxEn 12)]()([ () 式中 ,w ( n) 為窗函數(shù) 。 N 為窗長。令 h( n) = w2 ( n) ,則有 ? ? )(*)()( 212 nhnxmnhmxE Nnmn ??? ? ??? ) 窗口加權(quán)短時平均能量 En, 沖激相應(yīng) h(n)的選取 直接影響著短時能量的計算。 通常 N的選擇與語音的基音周期相關(guān)聯(lián)系,一般要求窗長為幾個基音周期的數(shù)量級。由于語音基音頻率范圍為 50Hz到 500Hz,因此折中選擇幀長為 10到 20ms。通過En的高低來判定濁音向清音的轉(zhuǎn)化。語音信號的分幀是采用可移動的有限長度的窗口進(jìn)行加權(quán)來實現(xiàn)。選擇的原則是:使得短時能量既能及時跟蹤語音能量的緩變規(guī)律,同時又對語音振幅一個基音周期內(nèi)的瞬時變化有顯著平滑的作用。本算法中窗口選擇矩形窗: 1, 0?n?N1 W(n)= ( ) 0, 其他 圖 (a)原信號 (b)自相關(guān)函數(shù)攀枝花學(xué)院本科畢業(yè)設(shè)計(論文) 2 基音檢測常用的算法 8 圖 (a)原信號 (b)自相關(guān)函數(shù) 短時自相關(guān)函數(shù)的算法是基音周期估計常用的方法,特別適用于噪聲環(huán)境下的基音提取。語音的濁音信號具有準(zhǔn)周期性,所以在自相關(guān)函數(shù)基音周期的整數(shù)倍的地方取最大值,計算相鄰兩個最大峰值之間的距離,就可以估計出基音周期。觀察濁音信號的自相關(guān)函數(shù)圖,實際上,真正反映基音周期的只是少數(shù)幾個峰,其它的多數(shù)峰都是由于聲道的共振特性引起的。由于豐富的諧波成分使得語音信號波形變得復(fù)雜。常常會出現(xiàn)檢測的結(jié)果是實際結(jié)果的 2 倍或者 1/2,就使得基音檢測相當(dāng)困難。 如圖 (a)是一幀的原始語音信號, (b)是經(jīng)過自相關(guān)函數(shù)的語音信號,可以看出峰值是自相關(guān)函數(shù)在基音周期處,峰值點之間的間隔的平均值就是基音周期,如圖 (b)所示可以看出自相關(guān)函數(shù)檢測出的基音周期是原始信號基音周期的一半,因為諧波峰值點 (箭頭所示 )的影響,就會出現(xiàn)上述缺點中所說的倍頻現(xiàn)象。 平均幅度差函數(shù)法 短時平均幅度差函數(shù)的介紹,如果信號 x(n)是標(biāo)準(zhǔn)的周期信號,則相距為周期的整數(shù)倍的樣點上的幅度值是相等的,二者差值為零。對于濁音信號,在周期整數(shù)倍上,這個差值不為零,但也小,就 可以采用計算短時平均幅度差函數(shù)中兩相鄰谷值間的距離進(jìn)行基音周期估值。這里使用修正的短時平均幅度差函數(shù)加矩形窗,定義為: ,1,0,)()()( 10 ???? ??? ??? Nn nxnxFn ..., N1 ( ) 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文) 2 基音檢測常用的算法 9 如果 x(n)具有周期 ? =? P,? 2P, ...時, Fn(? )具有最小值。 因 為 ()nF?只需加、減法和取絕對值等的計算,比較簡單。很容易在硬件上實現(xiàn),所以使得短時平均幅度差函數(shù)法在基音檢測中使用得相對比較普遍。實驗證明:靜音環(huán)境環(huán)境下或是噪聲較小時, AMDF 法的檢測結(jié)果比較好;語音環(huán)境惡劣或信噪比較低情況下,檢測的效果就比較差,準(zhǔn)確度不高。 如圖 (a)是一幀原始語音信號, (b)是這幀語音信號 的 AMDF 函數(shù),從圖中能看出 AMDF 法在基音周期處表現(xiàn)為谷低,通過計算這些谷低之間的間隔的平均值就可以得到基音周期。如圖 (a)是在這幀語音信號中加入信噪比是 2dB 噪聲后所得到的波形,由圖 (b)看出來了它的平均幅度差函數(shù)中有很多諧波分量,基音峰值點受到這些諧波分量的很大影響,在基音周期的判斷時就有出入。 圖 ( a)原信號 (b)平均幅度差函數(shù) 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文) 2 基音檢測常用的算法 10 圖 (a)加噪信號 (b) 平均幅度差函數(shù) 本章小結(jié) 對于語音信號在檢測之前先進(jìn)行預(yù)處理即利用中心削波處理,然后詳細(xì)講解了 ACF,AMDF 的基音檢測算法。自相關(guān)函數(shù)先進(jìn)行基音周期估計時先分清濁音和清音,再去尋找的是最大峰值點的位置,而 AMDF 尋找的是它的最小谷值點的位置;自相關(guān)函數(shù)法具有很好的抗噪性,但易受半頻、倍頻錯誤影響,而平均幅度差函數(shù)法只需加法、減法和取絕對值等計算,算法簡單,運算量相比自相關(guān)函數(shù)法大為減少,易于硬件實現(xiàn)。 兩種算法對純凈的語音 信號都能取得較好的檢測精度但是由于語音信號的復(fù)雜多變,以及噪聲等因素的影響,這些方法都有一定的局限性。基于語音信號短時平穩(wěn)性,它們的優(yōu)點 是比較簡單,主要應(yīng)用于只需要平均基音周期作為參數(shù)的語音識別。 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文 ) 3 基于 Matlab 基音周期的檢測 11 3 基于 Matlab 基音周期的檢測 語音文件的錄制與讀入 1. 利用 windows 附件中的錄音機功能錄制 23 秒的 .wav 語音文件,并以 a 為文件名保存到 Matlab/work 的文件夾中。 : 開始 /程序 /附件 /娛樂 /錄音機 。 “我 到北京去” 錄音(按 鍵),然后到 23 秒時停止(按鍵); C:/Matlab/work 中,文件名為 , ,采樣頻率選 11KHz, 16 位,單聲道; 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文 ) 3 基于 Matlab 基音周期的檢測 12 2. 打開 Matlab 并新建一 .m文件; .m文件中用 y=wavread(‘’)命令讀入語音文件。 語音信號的采樣和分幀 語音在 Matlab上的實現(xiàn):以 ,在 Matlab上進(jìn)行語音的采樣與分幀。 打開 Matlab并新建一 .m文件,運行: x=wavread(39。39。)。%讀取聲音文件 figure(1)。 stem(x,39。.39。)。 %顯示聲音信號的波形 得到的波形如下: “采樣”是指從語音信號中選取一段樣本,一般取樣點數(shù)為幀長的整數(shù)倍。短時分析是將語音信號分為一段一段的來處理,每一段就稱為一“幀”。分幀時需要對語音信號進(jìn)行加窗操作,窗口長度的選擇非常重要,窗口長度過短 會使得分析窗內(nèi)沒有包含足夠的數(shù)據(jù)點來進(jìn)行周期判斷,且短時能量變化劇烈;窗口長度過長,短時能量是一段長時間的平均,不但不能反映出語音信號基頻的細(xì)節(jié)變化部分,而且使得計算量增大。窗口長度至少要大于基音周期的兩倍。一般窗長選為 120240點,分幀模塊主要完成將取樣模塊中獲得的語音樣值點分為若干個語音幀。 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文 ) 3 基于 Matlab 基音周期的檢測 13 圖 a1原始語音波形 對語音信號采樣,通過 matlab對語音文件“ ”計算得知其語音長度為,若采樣頻率為 11KHz,共計 27500個采樣點。采樣模塊從采樣頻率為 11KHz的語音信號中截取 1秒到 2秒這一時間段, 取了 11000個樣點進(jìn)行分析,取幀長為20ms,即每幀為 220個樣點值,共分為 50幀。 打開 Matlab,運行: x=wavread(39。39。)。%讀取聲音文件 x=x(11001:220xx)。 figure(1)。 stem(x,39。.39。)。 %顯示聲音信號的波形 得到波形如下: 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文 ) 3 基于 Matlab 基音周期的檢測 14 圖 a1采樣信號波形 中心削波法的程序及其波形圖: a=wavread(39。39。); L=length(x)。 m=max(a)。 for i=1:L a(i)=a(i)/m。 end m=max(a)。 n=min(a)。 ht=(m+n)/2。 for i=1:L。 a(i)=a(i)ht。 end figure(1)。 subplot(2,1,1)。 plot(a,39。k39。)。 axis([0,1711,1,1])。 title(39。中心削波前語音波形 39。)。 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文 ) 3 基于 Matlab 基音周期的檢測 15 xlabel(39。樣點數(shù) 39。)。 ylabel(39。幅度 39。)。 coeff=。 th0=max(a)*coeff。 for k=1:L。 if a(k)=th0 a(k)=a(k)th0。 elseif a(k)=(th0)。 a(k)=a(k)+th0。 else a(k)=0。 end end m=max(a)。 for i=1:L。 a(i)=a(i)/m。 end subplot(2,1,2)。 plot(a,39。k39。)。 axis([0,1711,1,1])。 title(39。中心削波后語音波形’); xlabel(39。樣點數(shù) 39。)。 ylabel(39。幅度 39。)。 得到的結(jié)果如下: 攀枝花學(xué)院本科畢業(yè)設(shè)計(論文 ) 3 基于 Matlab 基音周期的檢測 16 圖 中心削波前和中心削波后的波形 語音信號基音周期的檢測 短時自相關(guān)函數(shù)法檢測基音周期 對每一幀信號進(jìn)行自相關(guān)運算程序如下: x=wavread(39。39。)。 n=220。 %取 20ms的聲音片段,即 220個樣點 for m=1:length(x)/n。 %對每一幀求短時自相關(guān)函數(shù) for k=1:n。 Rm(k)=0。 for i=(k+1):n。 Rm(k)=Rm(k)+x(i+(m1)*n)
點擊復(fù)制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1