freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于倒譜的語音特性提取算法設計及其實現(xiàn)(編輯修改稿)

2025-07-16 12:45 本頁面
 

【文章內(nèi)容簡介】 取基音周期,比如倒譜法。雖然倒譜分析算法比較復雜,但基音估計效果較好【4】。 對語音信號利用倒譜解卷原理,可以得出激勵序列的倒譜,它具有與基音周期相同的周期,因此可以容易且精確地求出基音周期。在發(fā)濁音時,聲門激勵是以基因周期為周期的沖激序列:式中,M是正整數(shù);r是正整數(shù),且0≤r≤M。是幅度因子;是基音周期(用樣點數(shù)表示的)。根據(jù)復倒譜的定義,可以得到x(n)的復倒譜為:其中,=ln從上式得出的結論為:一個周期沖激的有限長度序列,其復倒譜也是一個周期沖激序列,而且長度不變,只是序列變?yōu)闊o限長度序列【5】。同時其幅度隨著k值的增大而衰減,衰減速度比原序列要快。倒譜是復倒譜的偶對稱分量,它同樣具有與基音周期相同的周期,因而能容易且精確地求出基音周期。當語音采樣率=10kHz時,倒譜的第一個峰值點即等于基音周期值,其變化范圍在之間,因而應在此范圍內(nèi)搜索峰值點。為了實現(xiàn)此搜索,語音幀數(shù)至少應該等于200點(即等于20ms)。 由rceps函數(shù)得到的倒譜圖 Cepstrum Figure from Rceps Function圖()為MATLAB中,運用rceps函數(shù)繪制的倒譜圖。利用以下程序段可精確求取基因頻率:[Cmax Cloc]=max(abs(z(25:200)))。T0=(Cloc+40)*dt。F0=1/T0。fprintf(39。Fundamental Frequency F0= %\n39。,F0)。所得結果為: 第五章 倒譜法提取共振峰共振峰是反映聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來源,而且人在語音感知中利用了共振峰信息。所以共振峰是語音信號處理中非常重要的特征參數(shù),已經(jīng)廣泛地用作語音識別的主要特征和語音編碼傳輸?shù)幕拘畔ⅰ9舱穹逍畔陬l率包絡之中,因此共振峰參數(shù)提取的關鍵是估計自然語音頻譜包絡,一般認為譜包絡中的最大值就是共振峰【7】。與基因檢測類似,共振峰估計也是表面上看起來很容易,而實際上又受很多問題困擾。這些問題包括:1)虛假峰值。在正常情況下,頻譜包絡中的極大值完全是又共振峰引起的。但在線性預測分析方法出現(xiàn)之前的頻譜包絡估計器中,出現(xiàn)虛假峰值是相當普遍的現(xiàn)象。甚至在采用線性預測方法時,也并非沒有虛假峰值。為了增加靈活性會給預測器增加個額外的極點,有時可利用這些極點代表虛假峰值。2)共振峰合并。相鄰共振峰的頻率可能會靠的太近而難以分辨。這時會產(chǎn)生共振峰合并現(xiàn)象,而探討一種理想的能對共振峰合并進行識別的共振峰提取算法存在很多實際困難。3)高音調(diào)語音。傳統(tǒng)的頻譜包絡估計方法是利用由諧波峰值提供的樣點。高音調(diào)語音(如女聲和童生)的諧波間隔比較寬,因而為頻譜包絡估值所提供的樣點比較少,所以譜包絡的估計就不夠精確。即使采用線性預測進行頻譜包絡估計也會出現(xiàn)這個問題。在這樣的語音中,線性預測包絡峰值趨向于離開真實位置,而朝著最接近的諧波峰位移動【7】。提取共振峰的幾種常用方法包括:1)基于線性預測的共振峰求取方法。一種有效的頻譜包絡估計方法是從線性預測分析角度推導出聲道濾波器,根據(jù)這個聲道濾波器找出共振峰。雖然線性預測法也有一定的缺點,例如其頻率靈敏度與人耳不相匹配,但對于許多應用來說,它仍然是一種行之有效的方法。線性預測共振峰通常有兩種途徑可供選擇:一種途徑是利用一種標準的尋找復根的程序計算預測誤差濾波器的根,稱為求根法;另一種途徑是找出由預測器導出的頻譜包絡中的局部極大值,稱為選峰法。2)倒譜法。聲道響應的倒譜衰減很快,在[25,25]之外的值相當小,因此可以構造一個相應的倒譜濾波器,將聲道的倒譜分離,對分離出來的倒譜做相應的反變換,就可以得到聲道函數(shù)的對數(shù)譜,對此做進一步處理即可求得所需的各個共振峰【8】。選擇最普遍的極零模式來描述聲道相應x(n),其z變換的形式為: (51)經(jīng)過傅立葉變換,取對數(shù)和逆傅立葉變換后可以得到其復倒譜: (52)對于倒譜可以只考慮它的幅度特性,可以看出,它是一個衰減序列,且衰減的速度比1/|n|快。因而它比原信號x(n)更集中于原點附近,或者說它更具有短時性。倒譜算法運用對數(shù)運算和二次變換將基音諧波和聲道的頻譜包絡分離開來。根據(jù)其特點利用短時窗可以從語音信號倒譜c(n)中截取出h(n)。由h(n)經(jīng)DFT得到的H(K)就是聲道的離散譜曲線,由于它去除了激勵引起的諧波動,因此能更精確地得到共振峰參數(shù)。 信號的對數(shù)頻譜圖 The Log Spectrum Figure of Signal 倒譜圖 Cepstrum Figure 加窗截取部分倒譜圖 Cepstrum Figure after Window Interception 頻譜包絡圖 Envelope SpectrumFigure 將對數(shù)頻譜圖和包絡圖繪制在同一個圖上 Drawing The Log Spectrum and Envelope in The Same FigureMATLAB中對信號做fft變換,繪制對數(shù)頻譜圖(),運用MATLAB提供的倒譜函數(shù)rceps計算倒譜并繪制。對倒譜加窗后做fft變換,即得到頻譜包絡和共振峰信息。 第六章 結束語本論文介紹了倒譜以及常用的語音特性參數(shù)MFCC,基音頻率和共振峰的相關知識和原理,并設計了基于倒譜的算法,在MATLAB中編程實現(xiàn)了以上參數(shù)的提取。由于作者對相關知識了解有限以及經(jīng)驗的不足,本文中處理的語音信號均采用簡單的短時信號。各個程序雖然在MATLAB中得到了較好的效果,但在實際應用中,會面臨很多具體的問題。需要考慮環(huán)境,說話人,應用要求等因素,去除各種影響才能取得好的分析結果。倒譜法根據(jù)對數(shù)功率譜的逆傅立葉變換,能夠分離頻譜包絡和細微結構,很精確地得到基音頻率和共振峰信息,但它的運算量比較大。當采用無噪語音時,用倒譜進行基音提取的效果是很理想的。然而當存在加性噪聲時,在對數(shù)功率譜的低電平部分會被噪聲填滿,從而掩蓋了基音諧波的周期性。這意味著倒譜的輸入不再是純凈的周期性成分,而倒譜中的基音峰值將會展寬,并受到噪聲的污染從而使倒譜檢測方法的靈敏度也隨之下降。在基音估計中還可以使用經(jīng)過中心削波或三電平削波后的自相關方法,這種方法在信噪比低的情況下可以獲得良好的性能。與基因檢測類似,共振峰估計也是表面上看起來很容易,而實際上又受很多問題困擾。隨著語言處理技術的發(fā)展,越來越多的語音特征提取方法被提出和完善,相信將克服各種困難,為人們的生活提供更多便利。參考文獻:[1] :哈爾濱工業(yè)大學出版社,2000[2] :上海交通大學出版社,1991[3] Methods of Pitch ,1968。16(1):262266[4] , for Automatic Formant Analysis of Voiced .,1997。47(2)。634648[5] (341)[6] 楊行峻 ,:電子工業(yè)出版社 ,1995[7] RabinerL ,JuangB H. Fundamental of Speech York:Prentice Hall ,1993[8] Furui Independent Isolated Word Recognition Using Dynamic Feature of Speech Spectrum. IEEE Trans on Acoustics,Speech,Signal Processing,1986,34 (1):52~59 附錄1 提取MFCC參數(shù)的相關程序 27 close allclearclc[x fs]=wavread(39。39。)。bank=mel(24,256,fs,0,39。m39。)。%Mel濾波器的階數(shù)為24,fft變換的長度為256,采樣頻率為8000Hz% 歸一化mel濾波器組系數(shù)bank=full(bank)。bank=bank/max(bank(:))。% DCT系數(shù),12*24for k=1:12 n=0:23。 dctcoef(k,:)=cos((2*n+1)*k*pi/(2*24))。end% 歸一化倒譜提升窗口w = 1 + 6 * sin(pi * [1:12] ./ 12)。w = w/max(w)。% 預加重濾波器xx=dou
點擊復制文檔內(nèi)容
試題試卷相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1