freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于倒譜的大學(xué)生語(yǔ)音識(shí)別算法研究畢業(yè)論文-資料下載頁(yè)

2025-06-30 23:34本頁(yè)面

【導(dǎo)讀】人和機(jī)器之間最好的通信方式是語(yǔ)言通信,而語(yǔ)音是語(yǔ)言的聲學(xué)表現(xiàn)形式。隨著信息技術(shù)的不斷發(fā)展,尤其是網(wǎng)絡(luò)技術(shù)的日益普及和。為了尋找良好性能的特征、提取重要。參數(shù)以提高識(shí)別系統(tǒng)性能,各種科學(xué)的算法應(yīng)運(yùn)而生。語(yǔ)音識(shí)別的關(guān)鍵技術(shù)是提取出語(yǔ)音特征,語(yǔ)音特征有很多,倒譜分析就是其中之一。譜法作為信號(hào)處理的重要的方法,能夠得到比較好的識(shí)別性能。本文主要介紹了語(yǔ)音識(shí)別技?;緦?shí)現(xiàn)思想是將輸入的隨機(jī)語(yǔ)音信號(hào)通過(guò)線性變換系統(tǒng)處理為加性信號(hào),用基于Mel. 頻率的倒譜系數(shù)以及一些語(yǔ)音信號(hào)的固有特征進(jìn)行倒譜分析。

  

【正文】 了能夠提取出這些參數(shù),就要借助一些工具,本節(jié)通過(guò) MATLAB 完成倒譜在語(yǔ)音處理的各方面應(yīng)用。 倒譜的 MATLAB實(shí)現(xiàn) 本實(shí)驗(yàn)所用的語(yǔ)音樣本是 Cooledit 在普通室內(nèi)環(huán)境下錄制的一段語(yǔ)音,采樣頻率為8kHz,單聲道。 MATLAB 仿真結(jié) 果如下:(程序見(jiàn)附錄 A) 0 50 100 150 200 250 300 350 4001 0 . 500 . 51截取的語(yǔ)音段樣點(diǎn)數(shù)幅度 2 0 0 1 5 0 1 0 0 5 0 0 50 100 150 200 0 . 2 0 . 100 . 10 . 2截取語(yǔ)音的倒譜樣點(diǎn)數(shù)幅度 圖 倒譜程序仿真結(jié)果 圖 ,第一幅是這段語(yǔ)音的時(shí)域波形圖,共取 400點(diǎn)語(yǔ)音,在倒譜圖上會(huì)看到許多峰值,這些峰值都與基音周期有關(guān),分 別是一次諧振,二次諧振 ?? 倒譜在同態(tài)信號(hào)處理系統(tǒng)的應(yīng)用 同態(tài)信號(hào)處理也稱為同態(tài)濾波,實(shí)現(xiàn)將卷積關(guān)系和乘積關(guān)系變換為求和關(guān)系的分離處理,將非線性信號(hào)處理變?yōu)榫€性信號(hào)處理的過(guò)程。 蘭州理工大學(xué)畢業(yè)論文 20 圖 按照被處理的信號(hào)來(lái)分類,大體上可以分為乘積同態(tài)信號(hào)處理和卷積同態(tài)信號(hào)處理。由于語(yǔ)音信號(hào)可以視為聲門激勵(lì)信號(hào)和聲道響應(yīng)信號(hào)的卷積結(jié)果。我們僅討論卷積同態(tài)信號(hào)處理系統(tǒng)的問(wèn)題。 ( 1)特征系統(tǒng) D*[] 完成將卷積信號(hào)轉(zhuǎn)化為加性信號(hào)的運(yùn)算。 )()()( 21 nxnxnx ?? (41) )()()()]([ 21 zXzXzXnxZ ??? (42) )(?)(?)(?)(ln)(ln)(ln 2121 zXzXzXzXzXzX ????? (43) )(?)(?)(?)](?)(?[)](?[ 212111 nxnxnxzXzXZzXZ ????? ?? (44) ( 2)第二個(gè)子系統(tǒng)對(duì)加性信號(hào)進(jìn)行所需要的線性處理(滿足線性疊加原理等) )](?)(?[)](?[)(? 21 nxnxLTInxLTIny ??? (45) ( 3)第三個(gè)子系統(tǒng)是逆特征系統(tǒng) D*1[],使其恢復(fù)為卷積性信號(hào)。由于對(duì)其進(jìn)行如下處理: )(?)(?)(?)](?[ 21 zYzYzYnyZ ??? (46) )()()())(?e x p ( 21 zYzYzYzY ??? (47) )()()]()([)( 21211 nynyzYzYZny ???? ? (48) ( 4)特征系統(tǒng) D*[]和逆特征系統(tǒng) D*1[]的區(qū)別 。 ,前者是對(duì)數(shù)運(yùn)算,后者是指數(shù)運(yùn)算。(運(yùn)算方式如圖 ) 線性系統(tǒng) 特征系統(tǒng) D*[] 逆特征系統(tǒng) D*1[] y(n) * + + x(n) * 蘭州理工大學(xué)畢業(yè)論文 21 圖 特征系統(tǒng)與逆特征系統(tǒng)的框圖表示 倒譜在基音檢測(cè)方面的應(yīng)用 基音是語(yǔ)音信號(hào)的一個(gè)重要參數(shù),在語(yǔ)音產(chǎn)生的數(shù)字模型中也是激勵(lì)源的一個(gè)重要參數(shù),準(zhǔn)確地檢測(cè)語(yǔ)音信號(hào)的基音周期對(duì)于高質(zhì)量的語(yǔ)音分析 與合成、語(yǔ)音壓縮編碼、語(yǔ)音識(shí)別和說(shuō)話人確認(rèn)等具有重要的意義。 1 基音檢測(cè)的概念 基音是指發(fā)濁音時(shí)聲帶振動(dòng)所引起的周期性 ,而聲帶振動(dòng)頻率的倒數(shù)就是基音周期?;糁芷诰哂袝r(shí)變性和準(zhǔn)周期性,它的大小與個(gè)人聲帶的長(zhǎng)短、厚薄、韌性和發(fā)音習(xí)慣有關(guān),還與發(fā)音者的性別、年齡、發(fā)音時(shí)的力度及情感有關(guān),是語(yǔ)音信號(hào)處理中的重要參數(shù)之一,它描述了語(yǔ)音激勵(lì)源的一個(gè)重要特征?;糁芷诘墓烙?jì)稱為基音檢測(cè) (Pitch Detection),基音檢測(cè)的最終目標(biāo)是找出和聲帶振動(dòng)頻率完全一致的基音周期變化軌跡曲線,如不可能則找出盡量相吻合的軌跡曲線。然而由于人的聲道的易變性及其聲道特征的因人而異,而基音周期的范圍又很寬,且同一個(gè)人在不同情態(tài)下發(fā)音的基音周期也不同,加之基音周期還受到單詞發(fā)音音調(diào)的影響,故實(shí)際中的基音周期的精確檢測(cè)是一件比較困難的事情。然而,盡管語(yǔ)音信號(hào)的基音檢測(cè)有許多困難但由于它在語(yǔ)音信號(hào)處理中的重要作用,促使廣大學(xué)者爭(zhēng)相涉足。 2 基音的周期 基音是指發(fā)濁音時(shí)聲帶振動(dòng)所引起的周期性,而基音周期是指聲帶振動(dòng)頻率的倒數(shù)?;糁芷谑?語(yǔ)音信號(hào)最重要的參數(shù)之一,提取該參數(shù)是語(yǔ)音信號(hào)處理中一個(gè)十分重要的問(wèn)題。對(duì)于漢語(yǔ)這種有調(diào)語(yǔ)音,基音的變化模式稱為聲調(diào),它攜帶著非常重要的具有辨意作用的信息,有區(qū)別意義的功能。根據(jù)加窗的短時(shí)語(yǔ)音幀來(lái)估計(jì)基音周期,在語(yǔ)音編解碼器,語(yǔ)音識(shí)別,說(shuō)話人確認(rèn)和辨認(rèn),對(duì)生理缺陷人的輔助系統(tǒng)等許多領(lǐng)域都是重要的一環(huán)。 3 基音檢測(cè)的難點(diǎn) 自進(jìn)行語(yǔ)音信號(hào)分析研究以來(lái),基音檢測(cè)一直是一個(gè)重點(diǎn)研究的課題,很多方法已被提出,然而這些方法都有它們的局限性。迄今為止,尚未找到一個(gè)完善的可以適用于不同的說(shuō)話人,不同的要求和環(huán)境的基音檢 測(cè)方法。 Z exp Z1 Z ln Z1 )(nx)(nx)(?nx)(?nx蘭州理工大學(xué)畢業(yè)論文 22 基音檢測(cè)的主要難點(diǎn)表現(xiàn)在: 1)語(yǔ)音信號(hào)變化十分復(fù)雜,聲門激勵(lì)的波形并不是一個(gè)完全的周期序列。在語(yǔ)言的頭,尾部并不具有聲帶振動(dòng)那樣的周期性,對(duì)有些清濁音的過(guò)渡幀很難判定它應(yīng)屬于周期性或非周期性,從而就無(wú)法估計(jì)出基音周期。 2)要從語(yǔ)音信號(hào)中去除聲道的影響,直接取出僅與聲帶振動(dòng)有關(guān)的聲源信息并非易事。而聲道共振峰有時(shí)會(huì)嚴(yán)重影響激勵(lì)信號(hào)的諧波結(jié)構(gòu)。 3)在濁音段很難精確地確定每個(gè)基音周期的開(kāi)始和結(jié)束位置,這不僅因?yàn)檎Z(yǔ)音信號(hào)本身是準(zhǔn)周期的,也是因?yàn)椴ㄐ蔚姆迨芄舱穹褰Y(jié)構(gòu),噪聲等影響較大。 4)基音周期變化 范圍較大,從低音男聲的 80Hz 直到女孩的 500Hz,這也給基音周期的檢測(cè)帶來(lái)了一定的困難。另外,濁音信號(hào)可能包含有三四十次諧波分量,而基波分量往往不是最強(qiáng)的分量。因?yàn)檎Z(yǔ)音的第一共振峰通常在 3001000Hz 范圍內(nèi),這就是說(shuō), 28次諧波成分往往比基波分量還強(qiáng)。豐富的諧波成分使語(yǔ)音信號(hào)的波形變的很復(fù)雜,給基音檢測(cè)帶來(lái)困難,經(jīng)常發(fā)生基頻估計(jì)結(jié)果為實(shí)際基音頻率的二三次倍頻或二次分頻的情況 [14]。 4 倒譜法求基音周期 語(yǔ)音的倒譜是將語(yǔ)音的短時(shí)譜取對(duì)數(shù)后再進(jìn)行 IDFT 得到的,所以語(yǔ)音信號(hào)的周期性激勵(lì)反映在倒譜上 式是同樣周期的沖激。借此,可從倒譜波形中估計(jì)出基音周期。一般把倒譜波形中第二個(gè)激勵(lì),認(rèn)為是對(duì)應(yīng)激勵(lì)源的基頻。下面給出一種倒譜法求基音周期的框圖及流程圖。先計(jì)算倒譜,然后在預(yù)期的基音周期附近尋找峰值。如果倒譜的峰值超出了預(yù)先規(guī)定的門限,則輸入語(yǔ)音段定為濁音,而峰的位置就是基音周期的良好估計(jì)。如果沒(méi)有超出門限的峰值,則輸入語(yǔ)音段定為清音。如果計(jì)算的是一個(gè)時(shí)變的倒譜,則可估計(jì)出激勵(lì)源模型及基音周期隨時(shí)間的變化。一般每隔 10~20ms 計(jì)算一次倒譜,這是因?yàn)樵谝话阏Z(yǔ)音中激勵(lì)參數(shù)是緩慢變化的。 基音檢測(cè)的實(shí)現(xiàn)框圖和流程 圖如圖 和 所示。 DFT S(k) ln|S(k)| IDFT 峰 值 檢 測(cè) 基 音檢 測(cè) w(n) s(n) 圖 倒譜法求基音周期的實(shí)現(xiàn)框圖 Y Y 蘭州理工大學(xué)畢業(yè)論文 23 圖 基音檢測(cè)的流程圖 倒譜在共振峰檢測(cè)方面的應(yīng)用 語(yǔ)音信號(hào)處理中,共振峰頻率是一個(gè)特別重要的參數(shù)。它是表征發(fā)音時(shí)聲道特性的關(guān)鍵參數(shù),也是區(qū)別不同韻母的重要依據(jù)。尋求一種實(shí)時(shí)實(shí)現(xiàn)共振峰頻率檢測(cè)的算法,在語(yǔ)音合成、語(yǔ)音識(shí)別、說(shuō)話人識(shí)別等領(lǐng)域中有重要的應(yīng)用價(jià)值。共振峰信息包括在語(yǔ)音頻譜包絡(luò)中。因此,共振峰頻率檢測(cè)的關(guān)鍵在于估計(jì)自然語(yǔ)音頻譜包絡(luò),并認(rèn)為譜 包絡(luò)最大值對(duì)應(yīng)的頻率就是共振峰頻率,最大值就是共振峰。所以共振峰已經(jīng)廣泛地用作語(yǔ)音識(shí)別的主要特征和語(yǔ)讀入語(yǔ)音數(shù)據(jù) 到文件尾嗎? 結(jié)束 對(duì)該幀數(shù)據(jù)加窗 計(jì)算基音周期 pitch 基音周期 pitch=0 找出該搜索范圍內(nèi)倒譜的最大值 max 設(shè)置門限為 求該幀數(shù)據(jù)的倒譜 設(shè)置基音搜索范圍 取出一幀語(yǔ)音數(shù)據(jù) max? Y N N Y 蘭州理工大學(xué)畢業(yè)論文 24 音編碼傳輸?shù)幕拘畔?。如果直接在語(yǔ)音頻譜提取共振峰頻率,誤差會(huì)很大。倒譜分析技術(shù)可以較好地分離出語(yǔ)音信號(hào)頻譜包絡(luò)結(jié)構(gòu)。 共振峰的概念 共振峰是反映聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來(lái)源,而且人在語(yǔ)音感知中利用了共振峰信息。所以共振峰是語(yǔ)音信號(hào)處理中非常重要的特征參數(shù),已經(jīng)廣泛地用作語(yǔ)音識(shí)別的主要特征和語(yǔ)音編碼傳輸?shù)幕拘畔?。共振峰信息包含在頻率包絡(luò)中,因此共振峰參數(shù)提取的關(guān)鍵是估計(jì) 自然語(yǔ)音頻譜包絡(luò),一般認(rèn)為譜包絡(luò)中的最大值就是共振峰 [13]。與基音檢測(cè)類似,共振峰估計(jì)也是表面上看起來(lái)很容易,而實(shí)際上又受很多問(wèn)題困擾。這些問(wèn)題包括: 1)虛假峰值。在正常情況下,頻譜包絡(luò)中的極大值完全是又共振峰引起的。但在線性預(yù)測(cè)分析方法出現(xiàn)之前的頻譜包絡(luò)估計(jì)器中,出現(xiàn)虛假峰值是相當(dāng)普遍的現(xiàn)象。甚至在采用線性預(yù)測(cè)方法時(shí),也并非沒(méi)有虛假峰值。為了增加靈活性會(huì)給預(yù)測(cè)器增加 2~3 個(gè)額外的極點(diǎn),有時(shí)可利用這些極點(diǎn)代表虛假峰值。 2)共振 峰合并。相鄰共振峰的頻率可能會(huì)靠的太近而難以分辨。這時(shí)會(huì)產(chǎn)生共振峰合并現(xiàn)象,而探討一種理想的能對(duì)共振峰合并進(jìn)行識(shí)別的共振峰提取算法存在很多實(shí)際困難。 3)高音調(diào)語(yǔ)音。傳統(tǒng)的頻譜包絡(luò)估計(jì)方法是利用由諧波峰值提供的樣點(diǎn)。高音調(diào)語(yǔ)音(如女聲和童生)的諧波間隔比較寬,因而為頻譜包絡(luò)估值所提供的樣點(diǎn)比較少,所以譜包絡(luò)的估計(jì)就不夠精確。即使采用線性預(yù)測(cè)進(jìn)行頻譜包絡(luò)估計(jì)也會(huì)出現(xiàn)這個(gè)問(wèn)題。在這樣的語(yǔ)音中,線性預(yù)測(cè)包絡(luò)峰值趨向于離開(kāi)真實(shí)位置,而朝著最接近的諧波峰位移動(dòng) [15]。 基于倒譜的共振峰的算法 倒譜將基音 諧波和聲道的頻譜包絡(luò)分離開(kāi)來(lái)。倒譜的低時(shí)部分可以分析聲道、聲門和輻射信息,而高頻部分可用來(lái)分析激勵(lì)源信息。對(duì)倒譜進(jìn)行低時(shí)窗選,通過(guò)語(yǔ)音倒譜分析系統(tǒng)的最后一級(jí),進(jìn) 行 DFT 后的輸出即為平滑后的對(duì)數(shù)模函數(shù),這個(gè)平滑的對(duì)數(shù)譜顯示了特定輸入語(yǔ)音段的諧振結(jié)構(gòu),即譜的峰值基本上對(duì)應(yīng)于共振峰頻率,對(duì)平滑過(guò)的對(duì)數(shù)譜中的峰值進(jìn)行定位,即可估計(jì)共振峰。 (原理框圖如圖 所示 ) 分幀加窗 |FFT| log IFFT 加窗 平滑處理 |FFT| log 共振峰 圖 共振峰檢測(cè)框圖 蘭州理工大學(xué)畢業(yè)論文 25 第 5 章 倒譜法提取基音頻率和共振峰 倒譜法提取基音頻率 提取基音的方法 目前 基音的提取方法大致可以分為三類: 1)波形估計(jì)法:直接由語(yǔ)音波形來(lái)估計(jì)基音周期,分析出波形上的周期峰值。包括并行處理法,數(shù)據(jù)減少法等。 2)相關(guān)處理法:這種方法在語(yǔ)音信號(hào)處理中廣泛使用,這是因?yàn)橄嚓P(guān)處理法抗波形的相位失真能力強(qiáng),另外它在硬件處理上結(jié)構(gòu)簡(jiǎn)單。包括波形自相關(guān)法,平均振幅差分函數(shù)法( AMDF),簡(jiǎn)化逆濾波法( SIFT)等。 3)變換法:將語(yǔ)音信號(hào)變換到頻域或倒譜域來(lái)估計(jì)基音周期,利用同態(tài)分析方法將聲道的影響消除,得到屬于激勵(lì)部分的信息,進(jìn)一步求取基音周期,比如倒譜法。雖然倒譜分析算法比較復(fù)雜,但基 音估計(jì)效果較好 [14]。 倒譜分析算法的原理 對(duì)語(yǔ)音信號(hào)利用倒譜解卷原理,可以得出激勵(lì)序列的倒譜,它具有與基音周期相同的周期,因此可以容易且精確地求出基音周期。 在發(fā)濁音時(shí),聲門激勵(lì)是以基音周期為周期的沖激序列: 0( ) ( )MrPrx n n r N?????? (51) 式中, M 是正整數(shù); r 是正整數(shù),且 0≤ r≤ M。αr 是幅度因子; Np 是基音周期(用樣點(diǎn)數(shù)表示的)。根據(jù)復(fù)倒譜的定義,可以得到 x(n)的復(fù)倒譜為: 0( ) ( )kPkx n n k N???????? (52) 其中, 0? =ln 0? 11 011 ()MMkk rkrrrkk??? ???? ? ? ??? (53) MATLAB 中的設(shè)計(jì)與實(shí) 現(xiàn) 當(dāng)語(yǔ)音采樣率 sf =8kHz 時(shí),倒譜的第一個(gè)峰值點(diǎn)即等于基音周期值 Np,其變化范圍在蘭州理工大學(xué)畢業(yè)論文 26 25200 之間,因而應(yīng)在此范圍內(nèi)搜索峰值點(diǎn)。為了實(shí)現(xiàn)此搜索,語(yǔ)音幀數(shù)至少應(yīng)該等于 200點(diǎn)(即等于 20ms) 。 (程序見(jiàn)附錄 ) 0 0 . 0 0 5 0 . 0 1 0 . 0 1 5 0 . 0 2 0 . 0 2 5 0 . 0 3 0 . 0 3 500 . 10 . 20 . 30 . 40 . 50 . 60 . 7z = r c e p s ( y )振幅倒頻譜 圖 由 rceps 函數(shù)得到的倒譜圖 圖( )為運(yùn)用 rceps 函數(shù)繪制的倒譜圖,在圖中可以清楚的發(fā)現(xiàn) 附近的峰值點(diǎn)即為所求
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1