freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于倒譜的語音特性提取算法設(shè)計(jì)及其實(shí)現(xiàn)-文庫吧資料

2025-06-25 12:45本頁面
  

【正文】 海交通大學(xué)出版社,1991[3] Methods of Pitch ,1968。與基因檢測類似,共振峰估計(jì)也是表面上看起來很容易,而實(shí)際上又受很多問題困擾。這意味著倒譜的輸入不再是純凈的周期性成分,而倒譜中的基音峰值將會(huì)展寬,并受到噪聲的污染從而使倒譜檢測方法的靈敏度也隨之下降。當(dāng)采用無噪語音時(shí),用倒譜進(jìn)行基音提取的效果是很理想的。需要考慮環(huán)境,說話人,應(yīng)用要求等因素,去除各種影響才能取得好的分析結(jié)果。由于作者對相關(guān)知識(shí)了解有限以及經(jīng)驗(yàn)的不足,本文中處理的語音信號(hào)均采用簡單的短時(shí)信號(hào)。對倒譜加窗后做fft變換,即得到頻譜包絡(luò)和共振峰信息。 信號(hào)的對數(shù)頻譜圖 The Log Spectrum Figure of Signal 倒譜圖 Cepstrum Figure 加窗截取部分倒譜圖 Cepstrum Figure after Window Interception 頻譜包絡(luò)圖 Envelope Spectrum根據(jù)其特點(diǎn)利用短時(shí)窗可以從語音信號(hào)倒譜c(n)中截取出h(n)。因而它比原信號(hào)x(n)更集中于原點(diǎn)附近,或者說它更具有短時(shí)性。聲道響應(yīng)的倒譜衰減很快,在[25,25]之外的值相當(dāng)小,因此可以構(gòu)造一個(gè)相應(yīng)的倒譜濾波器,將聲道的倒譜分離,對分離出來的倒譜做相應(yīng)的反變換,就可以得到聲道函數(shù)的對數(shù)譜,對此做進(jìn)一步處理即可求得所需的各個(gè)共振峰【8】。線性預(yù)測共振峰通常有兩種途徑可供選擇:一種途徑是利用一種標(biāo)準(zhǔn)的尋找復(fù)根的程序計(jì)算預(yù)測誤差濾波器的根,稱為求根法;另一種途徑是找出由預(yù)測器導(dǎo)出的頻譜包絡(luò)中的局部極大值,稱為選峰法。一種有效的頻譜包絡(luò)估計(jì)方法是從線性預(yù)測分析角度推導(dǎo)出聲道濾波器,根據(jù)這個(gè)聲道濾波器找出共振峰。在這樣的語音中,線性預(yù)測包絡(luò)峰值趨向于離開真實(shí)位置,而朝著最接近的諧波峰位移動(dòng)【7】。高音調(diào)語音(如女聲和童生)的諧波間隔比較寬,因而為頻譜包絡(luò)估值所提供的樣點(diǎn)比較少,所以譜包絡(luò)的估計(jì)就不夠精確。3)高音調(diào)語音。相鄰共振峰的頻率可能會(huì)靠的太近而難以分辨。為了增加靈活性會(huì)給預(yù)測器增加個(gè)額外的極點(diǎn),有時(shí)可利用這些極點(diǎn)代表虛假峰值。但在線性預(yù)測分析方法出現(xiàn)之前的頻譜包絡(luò)估計(jì)器中,出現(xiàn)虛假峰值是相當(dāng)普遍的現(xiàn)象。這些問題包括:1)虛假峰值。共振峰信息包含在頻率包絡(luò)之中,因此共振峰參數(shù)提取的關(guān)鍵是估計(jì)自然語音頻譜包絡(luò),一般認(rèn)為譜包絡(luò)中的最大值就是共振峰【7】。所得結(jié)果為: 第五章 倒譜法提取共振峰共振峰是反映聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來源,而且人在語音感知中利用了共振峰信息。Fundamental Frequency F0= %\n39。F0=1/T0。利用以下程序段可精確求取基因頻率:[Cmax Cloc]=max(abs(z(25:200)))。為了實(shí)現(xiàn)此搜索,語音幀數(shù)至少應(yīng)該等于200點(diǎn)(即等于20ms)。倒譜是復(fù)倒譜的偶對稱分量,它同樣具有與基音周期相同的周期,因而能容易且精確地求出基音周期。根據(jù)復(fù)倒譜的定義,可以得到x(n)的復(fù)倒譜為:其中,=ln從上式得出的結(jié)論為:一個(gè)周期沖激的有限長度序列,其復(fù)倒譜也是一個(gè)周期沖激序列,而且長度不變,只是序列變?yōu)闊o限長度序列【5】。在發(fā)濁音時(shí),聲門激勵(lì)是以基因周期為周期的沖激序列:式中,M是正整數(shù);r是正整數(shù),且0≤r≤M。雖然倒譜分析算法比較復(fù)雜,但基音估計(jì)效果較好【4】。3)變換法。這種方法在語音信號(hào)處理中廣泛使用,這是因?yàn)橄嚓P(guān)處理法抗波形的相位失真能力強(qiáng),另外它在硬件處理上結(jié)構(gòu)簡單。包括并行處理法,數(shù)據(jù)減少法等。目前基音的提取方法大致可以分為三類:1)波形估計(jì)法。因?yàn)檎Z音的第一共振峰通常在Hz范圍內(nèi),這就是說,次諧波成分往往比基波分量還強(qiáng)。4)基音周期變化范圍較大,從低音男聲的80Hz直到女孩的500Hz,這也給基音周期的檢測帶來了一定的困難。而聲道共振峰有時(shí)會(huì)嚴(yán)重影響激勵(lì)信號(hào)的諧波結(jié)構(gòu)。在語言的頭,尾部并不具有聲帶振動(dòng)那樣的周期性,對有些清濁音的過渡幀很難判定它應(yīng)屬于周期性或非周期性,從而就無法估計(jì)出基因周期。迄今為止,尚未找到一個(gè)完善的可以適用于不同的說話人,不同的要求和環(huán)境的基音檢測方法。根據(jù)加窗的短時(shí)語音幀來估計(jì)基音周期,在語音編解碼器,語音識(shí)別,說話人確認(rèn)和辨認(rèn),對生理缺陷人的輔助系統(tǒng)等許多領(lǐng)域都是重要的一環(huán)。基音周期是語音信號(hào)最重要的參數(shù)之一,提取該參數(shù)是語音信號(hào)處理中一個(gè)十分重要的問題。由上圖則可全面的了解MFCC的靜態(tài)及動(dòng)態(tài)特性。合并MFCC參數(shù)和一階差分MFCC參數(shù),可得到如下結(jié)果。 (37)式中表示第t個(gè)一階差分倒譜系數(shù),T是為倒譜系數(shù)的維數(shù),表示一階導(dǎo)數(shù)的時(shí)間差,其值取1或2,1,表示第t個(gè)倒譜系數(shù)【5】。6) 按式 (36)求得 MFCC系數(shù)。每個(gè)濾波器組的輸出的對數(shù)能量為 (35)經(jīng)余弦變換得到MFCC系數(shù) (36)設(shè)某語音信號(hào)為x(n) ,則算法處理流程為1)預(yù)加重,其中k為預(yù)加重系數(shù),;2)加窗(hamming窗),幀長為N;3)DFT變換;4)設(shè)計(jì)一個(gè)具有 M個(gè)帶通濾波器的濾波器組,采用三角濾波器,中心頻率從0~F/2間按Mel頻率分布。Mel濾波器的中心頻率定義為: (34)其中和分別為濾波器組的最高頻率和最低頻率, Fs為采樣頻率,單位為Hz 。我們定義一個(gè)M個(gè)濾波器組,采用的濾波為三角濾波器,中心頻率為f(m),m=1,2, ...M,則三角濾波器的頻率響應(yīng)按式(32)定義,頻率響應(yīng)波形如圖()所示。將頻率變換到Mel域后,Mel帶通濾波器組的中心頻率是按照Mel頻率刻度均勻排列的【4】。根據(jù)這一原則,研究者根據(jù)心理學(xué)實(shí)驗(yàn)得到了類似于耳蝸?zhàn)饔玫囊唤M濾波器組,就是Mel頻率濾波器組。由此可用帶通濾波器組來模仿人耳聽覺,從而減少噪聲對語音的影響。人的耳朵具有一些特殊的功能,這些功能使得人耳能夠從嘈雜的背景噪聲中,以及各種變異情況下聽到語音信號(hào),這是因?yàn)槿说膬?nèi)耳基礎(chǔ)膜對外來信號(hào)會(huì)產(chǎn)生調(diào)節(jié)作用。編程時(shí)可直接運(yùn)用。而N值一般選為256,512或1024,這時(shí)既有足夠高的分辨率和避免混疊的能力又具有相應(yīng)的高效FFT算法可資利用。表示取,中的最大值。用DFT和IDFT實(shí)現(xiàn)的同態(tài)處理特征系統(tǒng)如下所列。N選的大一些可以達(dá)到兩個(gè)目的,第一是防止求出的c(n)中有混疊存在,第二是使它所代表的離散時(shí)域頻譜有更佳的分辨率。假設(shè)被處理的序列x(n)所占的間隔是[0,N1]。如果為了方便,永遠(yuǎn)選=0,那么當(dāng)x(n)為非最小相位時(shí),就需要采取措施將其消除,如果這個(gè)第二項(xiàng)已被消除,便對式(25)右側(cè)第三,四兩項(xiàng)和式中的每個(gè)對數(shù)在單位圓(|Z|=1)上用臺(tái)勞級(jí)數(shù)展開,就可以得到下列表達(dá)式: (213) (214)這樣式(25)可表達(dá)為下列形式(右側(cè)第二項(xiàng)已去除): (215)對照立即可以得到: (216)由式(29)可以看到,x(n)隨著|n|的增大而呈減小趨勢,當(dāng)各||,||越接近于零,其衰減速度越快【3】。 (212)此式右側(cè)第二項(xiàng)是一個(gè)表示延遲量大小的項(xiàng),它不包含有關(guān)序列x(n)特征的任何有用信息,相反,可以證明,它的存在會(huì)對有用信息造成干擾。A是一個(gè)實(shí)數(shù),它可以根據(jù)下列公式計(jì)算: (211) 如果x(n)是最小相位序列,那么=0,=N1,且x(0)=A.借助與式(23)可以求得該序列的復(fù)倒譜。Z=1/,j=,是X(Z)在單位圓外的零點(diǎn)。此時(shí)x(n)的Z變換X(Z)可以表示為如下形式: (210)其中||1,||1。這樣,只要x(n)是因果最小相位序列或反因果最大相位序列,便可以由c(n)算出。只有當(dāng)x(n)是一個(gè)反因果最大相位序列時(shí),才是一個(gè)反因果穩(wěn)定序列。第二,X(Z)=Z[x(n)]的零極點(diǎn)皆成為的極點(diǎn)。x(n)應(yīng)滿足兩個(gè)條件。如果設(shè) (28)那么可以同理導(dǎo)出: (29)稱為“相位倒譜”,不難看出,c(n)表現(xiàn)的是x(n)的DTFT 的模函數(shù)的
點(diǎn)擊復(fù)制文檔內(nèi)容
試題試卷相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1