freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于聲紋的說話人特征識(shí)別畢業(yè)論文-資料下載頁

2025-06-27 20:15本頁面
  

【正文】 (36) (37)實(shí)際上,有另一種同態(tài)處理方法,將式(36)、(37)改寫為: (38)上式表明:c(n)是序列x(n)對(duì)數(shù)幅度譜的傅立葉逆變換。c(n)稱為“倒譜”。 (LPCC)的提取在語音識(shí)別系統(tǒng)中,很少直接使用線性預(yù)測(cè)系數(shù)LPC,而是有LPC系數(shù)推導(dǎo)出另一種參數(shù):線性預(yù)測(cè)倒譜系數(shù)LPCC。LPCC系數(shù)是LPC系數(shù)在倒譜域中的表示,該特征是基于語音信號(hào)是自回歸信號(hào)的假設(shè),利用線性預(yù)測(cè)分析獲得倒譜系數(shù)。LPCC的優(yōu)點(diǎn)是計(jì)算量小,易于實(shí)現(xiàn),對(duì)元音有較好的描述能力,其缺點(diǎn)是對(duì)輔音描述能力差。 LPCC的介紹線性預(yù)測(cè)倒譜系數(shù)是一種比較重要的特征參數(shù),它能夠比較徹底的去除語音產(chǎn)生過程這中的激勵(lì)信號(hào),能較好的描述語音信號(hào)的共振峰特性。LPCC由于利用了線性預(yù)測(cè)中聲道系統(tǒng)函數(shù)的最小相位特性,避免了復(fù)雜的相位卷積和復(fù)對(duì)數(shù)計(jì)算。在實(shí)際計(jì)算中,LPCC不是由信號(hào)直接得到的而是由線性預(yù)測(cè)參數(shù)LPC求得。在線性預(yù)測(cè)分析中,聲道模型是式(39)表示的全極點(diǎn)模型。 (39)式中p是LPC分析的階數(shù),ai (i=1,2,,p)是線性預(yù)測(cè)系數(shù)。對(duì)式(39)兩邊取對(duì)數(shù),然后再對(duì)式z1做傅立葉級(jí)數(shù)展開,得 (310)其clp稱為語音信號(hào)的LPC倒譜系數(shù)。把式(39)代人(310)得 (311)對(duì)式(311)兩邊對(duì)z1求導(dǎo),再簡(jiǎn)化得 (312)式(312)可以寫成如下形式: (313)在式(313)中,令方程兩邊z1各次冪的系數(shù)相等,則可以得到LPC倒譜系數(shù)clp(n)與線性預(yù)測(cè)系數(shù)ai(i=1,2,,p)的關(guān)系: (314)這里c0實(shí)際上是直流分量,反映頻譜的能量,其值的大小不影響譜型,在識(shí)別中通常是不用的也不去計(jì)算。當(dāng)LPCC的階數(shù)不超過LPC階數(shù)p的時(shí)候,用第二、三式進(jìn)行計(jì)算;如果LPCC階數(shù)大于p,則用第四式計(jì)算,此時(shí)時(shí)間上是一種外推。這種LPCC分析的重要性在于,它提供了一組簡(jiǎn)捷的語音信號(hào)模型參數(shù),這組參數(shù)較精確的表征了語音信號(hào)的頻譜幅度,而且分析他們所需要的運(yùn)算量相對(duì)來說并不大,將它作為模板存儲(chǔ),可以提高識(shí)別率并減少時(shí)間。但是,LPCC倒譜系數(shù)也有它的缺點(diǎn),因?yàn)樗谌珮O點(diǎn)模型的假設(shè),因此對(duì)于清音和鼻音來說并不確切,而聲道響應(yīng)都含有零點(diǎn)的影響,因此,從理論上講,應(yīng)該采用極點(diǎn)模型。 LPCC的提取過程 LPC系數(shù)轉(zhuǎn)換自相關(guān)分析LPC 分析 預(yù)處理 語音信號(hào) LPCC系數(shù)圖32 LPCC系數(shù)提取過程 Matlab中實(shí)現(xiàn)LPCC的提取MATLAB語音處理工具箱提供了計(jì)算復(fù)倒譜系數(shù)的函數(shù)cceps,如果不考慮計(jì)算量,可以用下面函數(shù)計(jì)算一幀語音信號(hào)x的LPCC系數(shù):a=lpc(x)。c=cceps(a,16)。c=c(2:13)。程序中首先計(jì)算x的LPC系數(shù),由于函數(shù)cceps不是基于遞推公式的,因此要保留所有階的LPC系數(shù),即a的長(zhǎng)度與序列x的長(zhǎng)度相同。當(dāng)然,這種方法在一個(gè)實(shí)際的語音系統(tǒng)中是不能采納的,因?yàn)橛?jì)算量太大。因此,采用迭代算法計(jì)算LPCC參數(shù)的程序如下: Function lpcc=lpc2lpcc(lpc) n_lpc=10。 n_lpcc=16。 lpcc=zeros(n_lpcc,1)。 lpcc(1) =lpc(1)。 for n=2:n_lpc lpcc(n)=lpcc(n)。for m=1:n1 lpcc(n)=lpcc(n)+ lpc(m)*lpcc(nm)*(nm)/n。end end for n=n_lpc+1:n_lpcc lpcc(n)=0。 for m=1:n_lpc lpcc(n)=lpcc(n)+ lpc(m)*lpcc(nm)*(nm)/n。 end endlpcc=lpcc。這段代碼中,假設(shè)LPC系數(shù)的階數(shù)為10,LPCC系數(shù)的階數(shù)為16,前10階LPCC系數(shù)通過10階LPC迭代計(jì)算,后6階LPCC則是通過外推得到的。 Mel頻率倒譜(MFCC)的提取 Mel頻率介紹 人的耳朵能夠從嘈雜的背景噪聲中聽到語音信號(hào),這是因?yàn)槿说膬?nèi)耳基礎(chǔ)膜對(duì)外來的信號(hào)會(huì)產(chǎn)生調(diào)節(jié)作用。對(duì)不同頻率,在相應(yīng)的臨界帶寬內(nèi)的信號(hào)會(huì)引起基礎(chǔ)膜上不同位置的振動(dòng)。由此可用帶通濾波器組來模仿人耳聽覺,從而減少噪聲對(duì)聲音的影響。 通過對(duì)人的聽覺系統(tǒng)的生理研究表明,人們發(fā)現(xiàn)人耳對(duì)不同頻率的語音具有不同的感知能力,這個(gè)感知能力并不是隨著頻率的增加而線性增加。這就導(dǎo)致人們?nèi)ザx新的頻率單位,新的頻率單位的劃分應(yīng)該考慮到人耳聽覺系統(tǒng)的非線性特性,而不同于物理學(xué)對(duì)頻率的描述。通過大量的實(shí)驗(yàn),人們根據(jù)人耳在不同頻率下的音調(diào)感知能力,提出了Mel頻率的概念以符合人聽覺特性的頻率,這里的Mel就是人耳所感知到音調(diào)的度量單位,區(qū)別于物理上的頻率位Hz。由于漢語是有調(diào)語言,Mel頻率正是對(duì)人耳所聽到的漢語語音的度量。這個(gè)參數(shù)可以很好的描述人耳對(duì)漢語語音音調(diào)的感知情況。很多研究也證明,由于Mel頻率特性反映了人耳的聽覺特性,因而在用于代替人耳來分析語音時(shí),其性能和魯棒性都是最符合實(shí)際聽音效果的。MFCC參數(shù)與基于線性預(yù)測(cè)的倒譜分析相比,突出的優(yōu)點(diǎn)是不依賴全極點(diǎn)語音產(chǎn)生模型的假定,在與文本無關(guān)的說話人識(shí)別系統(tǒng)中,MFCC參數(shù)能夠比LPCC參數(shù)更好地提高系統(tǒng)的識(shí)別性能。 MFCC提取過程人的聽覺系統(tǒng)是一個(gè)特殊的非線性系統(tǒng),它響應(yīng)不同頻率信號(hào)的靈敏度是不同的,而新的符合人耳的聽覺特性的Mel頻率是按臨界頻率分布的,臨界帶寬是劃分Mel頻率刻度的重要依據(jù)。通過實(shí)驗(yàn),人們知道:當(dāng)中心頻率頻率在1KHz以下時(shí),臨界帶寬大致呈線性分布,約為100Hz;當(dāng)中心頻率超過1KHz時(shí),隨著中心頻率的增長(zhǎng),臨界頻帶呈對(duì)數(shù)增長(zhǎng)。所以符合人的聽覺系統(tǒng)的頻率刻度劃分應(yīng)該在低頻上有較高的分辨率,在高頻上具有較低的分辨率。 MFCC是一種能夠比較充分利用人耳感知特性的參數(shù)。MFCC和線性頻率的轉(zhuǎn)換關(guān)系如下: (315)雖然以Mel為單位的頻率刻度劃分與臨界帶寬的劃分在細(xì)節(jié)上并不精確相等,但是差別是很小的。MFCC參數(shù)是按幀計(jì)算的,其提取過程可以用框圖表示(見圖33)。因?yàn)椴煌恼f話人聲道具有區(qū)別于他人的特異特征,所以在實(shí)際信號(hào)分析中常采用預(yù)加重技術(shù),即在對(duì)信號(hào)采樣之后,插入一個(gè)一階高通濾波器,這樣就加強(qiáng)了聲道部分的特征,便于對(duì)聲道參數(shù)進(jìn)行分析。在求取MFCC的過程中,根據(jù)Mel頻率和Hz的對(duì)應(yīng)關(guān)系,類似臨界頻帶的劃分,可以將語音頻率劃分成一系列三角濾波器序列,即Mel頻率濾波器組,每個(gè)濾波器在以Mel為單位的頻率軸上是不等間距的,而是符合臨界帶寬的分布特性如圖34所示,三角濾波器的頻率響應(yīng)如式(316)定義,Mel濾波的作用是利用同人耳聽覺特性相似的三角濾波器組對(duì)語音信號(hào)的幅度平方譜進(jìn)行平滑。對(duì)數(shù)操作(lg)的用途至少有兩點(diǎn):其一是壓縮語音譜的動(dòng)態(tài)范圍,其二是將頻域中的乘性成分變成對(duì)數(shù)譜域中的加性成分,以便濾除乘性噪聲;離散余弦變換(DCT)主要用來對(duì)不同頻段的頻譜成分進(jìn)行解相關(guān)處理,使得各向量之間相互獨(dú)立。Mel頻率濾波器組 預(yù)加重、分幀、加窗DFT/FF DCT求倒譜Log對(duì)數(shù)能量 圖33 MFCC參數(shù)提取過程 圖 34 Mel標(biāo)度三角濾波器組 (316)其中。Mel濾波器的中心頻率定義為: (317)其中fH和fl分別為濾波器組的最高頻率和最低頻率,F(xiàn)S采樣頻率,單位為Hz。M是濾波器組的數(shù)目,N為FFT變換的點(diǎn)數(shù),式中。 MFCC參數(shù)的計(jì)算通常采用以下流程:(1) 首先確定每一幀語音采樣序列的點(diǎn)數(shù),本系統(tǒng)取N=256點(diǎn)。對(duì)每幀序列s(n)進(jìn)行預(yù)加重、分幀、加窗等處理后,得到每個(gè)語音幀的時(shí)域信號(hào)x(n)。再經(jīng)過離散FFT變換,取模的平方得到離散功率譜s(n)。 (2)將得到的x(n)經(jīng)過離散傅立葉變換后得到離散頻譜X(k),這里設(shè)語音信號(hào)的DFT為: , (318)其中x(n)為輸入的語音信號(hào),N表示傅里葉變換的點(diǎn)數(shù)。 (3)把上步變換得到的離散頻譜X(k)取平方,得到能量譜。 (4)將上述離散能量譜通過一組Mel尺度的濾波器組。采用的濾波器為三角濾波器,中心頻率為f(m),m=1,2,M,取M=24.(5)對(duì)每個(gè)濾波器組輸出的值進(jìn)行取對(duì)數(shù)計(jì)算,得到其對(duì)數(shù)能量: 0≤m≤M (319)其中Hm(k)為三角濾波器的頻率響應(yīng)。(6)最后對(duì)F(m)經(jīng)過離散余弦變換(DCT)得到MFCC系數(shù): 0≤n≤M (320) 通常情況下,用12~16個(gè)MFCC系數(shù)就可以很好地表示一個(gè)說話人的語音信息,所以MFCC參數(shù)的個(gè)數(shù)K通常取最低的12~16。在譜失真測(cè)度定義中通常不用0階倒譜系數(shù),因?yàn)樗欠从愁l譜能量的。上文所說的在頻域進(jìn)行帶通濾波是對(duì)能量譜進(jìn)行濾波,而不是對(duì)幅度譜進(jìn)行濾波。 Matlab中實(shí)現(xiàn)MFCC的提取本文采用了漢明窗函數(shù)來對(duì)語音分幀,每幀的長(zhǎng)度為256,步長(zhǎng)為128,即每相鄰兩幀之間有半幀是重疊的。計(jì)算中利用了Matlab中漢明窗函數(shù)(hamming)。采用Matlab的語音分析工具箱VoiceBox,可以很容易地對(duì)語音進(jìn)行分幀處理。其分幀函數(shù)調(diào)用為: (321),用來計(jì)算M個(gè)濾波器的系數(shù)。:; (322)其中m為濾波器的個(gè)數(shù),n為語音幀長(zhǎng)度,fs 為采樣頻率。例如,設(shè)計(jì)一個(gè)濾波器組,包含24個(gè)濾波器,語音信號(hào)的幀長(zhǎng)度為256,信號(hào)采樣頻率為8KHz,所用命令為:; (323) 在語音參數(shù)計(jì)算之前,一般要將其通過一個(gè)預(yù)加重濾波器,即: ; (324)然后在計(jì)算MFCC參數(shù),如:; (325)這一命令默認(rèn)地以256點(diǎn)為幀長(zhǎng)計(jì)算12階MFCC參數(shù)。如果s比較長(zhǎng),將會(huì)按照128點(diǎn)的間隔將s分為若干幀,再分別計(jì)算。,將自動(dòng)把一幀數(shù)據(jù)(256點(diǎn))乘以hamming窗,以克服Gibbs現(xiàn)象。 本文應(yīng)用了24個(gè)三角形濾波器序列,構(gòu)成了Mel頻率濾波器組。除了提取MFCC參數(shù)外,為了描述語音幀之間的相關(guān)性,在計(jì)算中引入了一階差分MFCC的特征參數(shù),并且與MFCC參數(shù)一起構(gòu)成語音的特征參數(shù)。下面是語音信號(hào)MFCC參數(shù)提取的具體實(shí)現(xiàn):設(shè)定mel濾波器系數(shù); 設(shè)定DCT系數(shù); 設(shè)置歸一化的倒譜提升窗口; 設(shè)置預(yù)加重濾波器; 對(duì)語音信號(hào)進(jìn)行分幀; 計(jì)算每幀的mfcc參數(shù); 對(duì)信號(hào)s進(jìn)行fft計(jì)算; 對(duì)fft參數(shù)進(jìn)行mel濾波取對(duì)數(shù)再計(jì)算倒譜; 給定mfcc參數(shù); 計(jì)算mfcc參數(shù)的一階差分; 合并mfcc參數(shù)和一階差分參數(shù); 去除首尾兩幀,因?yàn)檫@兩幀一階差分參數(shù)為0。根據(jù)編寫的計(jì)算Mel倒譜差分的程序,我們可以調(diào)用已經(jīng)錄制的wave語音文件,用命令s=readwav(a)讀取語音文件,得到一維離散的時(shí)域數(shù)字信號(hào),其中a為語音文件名。根據(jù)獲得的離散時(shí)域數(shù)字信號(hào),在調(diào)用編寫的計(jì)算MFCC的函數(shù),便可獲得某語音文件的MFCC參數(shù)。通過計(jì)算MFCC參數(shù),獲得了聲紋識(shí)別的特征參數(shù)。由于MFCC參數(shù)是對(duì)人耳聽覺特征的描述,因此,可以認(rèn)為不同聲紋的MFCC參數(shù)距離,能夠代表人耳對(duì)兩個(gè)語音聽覺上的差異,可以為聲紋的識(shí)別提供可靠的依據(jù)。 基音周期的提取基音是指發(fā)濁音時(shí)聲帶振動(dòng)所引起的周期性頻率?;糁芷谑锹晭д駝?dòng)頻率的倒數(shù),它是隨著時(shí)間和發(fā)音高低而不斷變化的。由于語音信號(hào)是非平穩(wěn)的時(shí)變信號(hào),只有其中的濁音部分能夠看作是準(zhǔn)周期的,所以我們稱濁音的周期為基音周期?;糁芷谑钦Z音的一個(gè)非常重要的特征參數(shù),它反映了語音激勵(lì)源的一個(gè)重要特征,在語音編碼、語音合成、說話人識(shí)別和語音識(shí)別等方面有著廣泛的應(yīng)用,是語音研究的一個(gè)重要階段。它的檢測(cè)和估計(jì)是語音信號(hào)處理的一個(gè)非常重要的問題,與許多語音信號(hào)處理技術(shù)相關(guān),它的提取對(duì)語音的識(shí)別和特征的提取等有很大關(guān)系。語音信號(hào)的基音周期提取問題實(shí)質(zhì)上也就是準(zhǔn)周期信號(hào)的周期估計(jì)問題。目前,基音提取的方法有很多:平均幅度差函數(shù)(AMDF)法;自相關(guān)函數(shù)(ACF)法;倒譜(CEP)法;數(shù)據(jù)壓縮法;性預(yù)測(cè)法;并行處理法;簡(jiǎn)化逆濾波器跟蹤法等。上述各種方法分屬于時(shí)域法、變換域法和混合法。其中變換域法涉及傅立葉變換或LPC運(yùn)算,
點(diǎn)擊復(fù)制文檔內(nèi)容
畢業(yè)設(shè)計(jì)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1