正文內(nèi)容

情感語音信號中共振峰參數(shù)的提取方法畢業(yè)論文-wenkub.com

2025-08-13 12:48 本頁面

　　

【正文】其次我要感謝在論文研究期間一起討論，互相學(xué)習(xí)的同組同學(xué)，是他們讓我看到了自己的不足，也讓我在討論中得到了進(jìn)步。在我有問題向她請教時，無論問題大小，她都耐心的給我講解。所以需要對情感語音共振峰提取方法做出進(jìn)一步改進(jìn)，使提取效果更佳完善。同時提高情感語音表達(dá)的自然度，擴(kuò)大情感語料的涉及范圍，并且盡可能的使語音庫涵蓋多個語種。（ 3）重點介紹倒譜法以及倒譜法提取語音信號中共振峰的原理與具體過程，并實現(xiàn)運用倒譜法實現(xiàn)共振峰的提取。所以說，可以用共振峰作為區(qū)分不同情感語音的手段。對倒譜進(jìn)行低時選窗，通過語音倒譜分析系統(tǒng)的最后一級，進(jìn)行 DFT 后的輸出即為平滑后的對數(shù)模函數(shù)，這個平滑的對數(shù)譜顯示了特定輸入語音段的諧振結(jié)構(gòu)，即譜的峰值基本上對應(yīng)于共振峰頻率，對平滑過的對數(shù)譜中的峰值進(jìn)行定位，即可提取共振峰。由 h(n)經(jīng) DFT 得到的 H(K)就是聲道的離散譜曲線，由于它去除了激勵引起的諧波動，因此能更精確地得到共振峰參數(shù)。選擇最普遍的極零模型來描述聲道響應(yīng) x(n)，其 z 變換的形式為： ? ? ? ?? ? ? ?? ?? ?? ??? ???????iipkpkkkmkmkkkzdzczbzaAzX1 111 11001111)( () 經(jīng)過傅立葉變換、取對數(shù)和逆傅立葉變換后可以得到其復(fù)倒譜： ???????????????? ?? ?? ???? ?0 01 11 1)0()0()0(ln)(?mkpknknkpkmknknknndnbnnancnAnxi i () 對于倒譜可以只考慮它的幅度特性，可以看出，它是一個衰減序列，且衰減的速度n1快。它們都將卷積運算，變?yōu)閭螘r域中的加法運算，使得信號可以運用滿足疊加性的線性系統(tǒng)進(jìn)行處理。 16 第 5章倒譜法提取共振峰的實現(xiàn) 倒譜的定義設(shè)信號 )(nx 的 z 變換為 )]([)( nxzzX ? ，其對數(shù)為 ) ] ]([ln [)(ln)(? nxzzXzX ?? () 那么 )(?zX 的逆 z 變換可寫成 )]]([[ ln)]([ ln)](?[)(? 111 nxzzzXzzXznx ??? ??? () 取 ?jez? ，式（）可寫為 )](a r g [)(ln)](l n [)(? ???? jjjj eXjeXeXeX ??? () 式（）可寫為 ??? ?? ?? ?? deeXnx njj )(?21)(? () 則式（）即為信號 )(nx 的復(fù)倒譜 )(?nx 的定義。因為倒譜運用對數(shù)運算和二次變換將基音諧波和聲道的頻譜包絡(luò)分離開來。采用了優(yōu)化動態(tài)搜索的算法，提高了運算速度。耳語音不同于正常語音的特性，使得準(zhǔn)確提取其共振峰存在更大的困難。研究討論了數(shù)字濾波器 H(z)在 z平面上的幅頻、相頻特性，分析比較了對數(shù)幅頻特性的二次導(dǎo)數(shù)、相頻特性的一次導(dǎo)數(shù)和三次導(dǎo)數(shù)的頻率分辨率。同類文章提取方法比較基于提取語音信號中的共振峰有多種方法，有很多采取其他共振峰提取方法的同類論文。求根法求取共振峰的優(yōu)點在于通過對預(yù)測多項式系數(shù)的分解可以精確地確定共振峰的中心頻率和帶寬。 LPC 法的缺點是用一個全極點模型逼近語音譜，對于含有零點的某些音來說 A(z)的根反映了極零點的復(fù)合效應(yīng)，無法區(qū)分這些根是相對于零點還是極點，或完全與聲道的諧振極點有關(guān)。下面求 h(n)的倒譜 )(nh? ，首先根據(jù)同態(tài)分析方法，有 )(log)(? zHzH ? 因為)(zH 是最小相位的，即在單位圓內(nèi)是解析的，所以 )(?zH 一定可以展開成級數(shù)形式，即???? ?? 1 )(?)(? n nznhzH 就是說 )(?zH 的逆變換 )(?nh 是存在的。而且，不屬于共振峰的額外極點容易排除掉，因為其帶寬比共振峰帶寬要大得多。具體過程是：設(shè)：ijii erz ??為第一個根，則其共軛值 ijii erz ???也是一個根。當(dāng)前后兩個猜測值之差小于某門限時結(jié)束猜測過程。為了提高 DFT 的頻率分辨率，可以采用補 0 的辦法增加序列的時間長度，即用（ 1， a1， a2，?， ap， 0,0，?， 0）進(jìn)行 DFT，為了能利用 FFT，長度一般取為 64 點、 128 點、 256 點、 512 點等。盡管其精度由于存在一定的逼近誤差而有所降低，但去除了激勵分量的影響。這樣，由 h(n)經(jīng) DFT 得到的 H(k)，就是聲道的離散譜曲線，用 H(k)代替直接 DFT 的頻譜，因為去除了激勵引起的諧波波動，所以可以更精確地得到共振峰參數(shù)。（ 1）原始語音幀信號（ 2）線性預(yù)測信號（ 3）預(yù)測誤差（ 4）預(yù)測信號功率譜（ 5）預(yù)測信號幅頻響應(yīng) （ 6）聲道倒譜（ 7） LPC 倒譜（ 8） LPC 倒譜包絡(luò) 圖 41 信號線性預(yù)測譜包絡(luò)提取分析圖 10 倒譜法提取共振峰雖然可以直接對語音信號求離散傅里葉變換（ DFT），然后用 DFT 譜來提取語音信號的共振峰參數(shù)，但是，直接 DFT 的譜要受基頻諧波的影響，最大值只能出現(xiàn)在諧波頻率上，因而共振峰測定誤差較大。即使采用線性預(yù)測進(jìn)行頻譜包絡(luò)估計也會出現(xiàn)這個問題。這時會產(chǎn)生共振峰合并現(xiàn)象，而探討一種理想的能對共振峰合并進(jìn)行識別的共振峰提取算法存在很多實際困難。甚至在采用線性預(yù)測方法時，也并非沒有虛假峰值。提取共振峰參數(shù)所遇到的問題與基音檢測類似，共振峰估計也是表面上看起來很容易，而實際上又受很多問題困擾。我們之所以能夠區(qū)分不同的人聲、元音，主要也是依靠它們的共振峰分布的位置。由于一件樂器的結(jié)構(gòu)是穩(wěn)定的，因此在一件樂器發(fā)出的所有音調(diào) 中，不論基頻如何，都會表現(xiàn)出相同的共振峰值，只不過其顯著性有強(qiáng)有弱罷了。共振峰信息包含在頻率包絡(luò)之中，因此共振峰參數(shù)提取的關(guān)鍵是估計自然語音頻譜包絡(luò)，一般認(rèn)為譜包絡(luò)中的最大值就是共振峰 [1]。最后將不同情感的特征參數(shù)進(jìn)行訓(xùn)練形成不同的模板庫，并將待識別情感的特征參數(shù)與模板庫進(jìn)行模式匹配，從而將情感識別結(jié)果輸出。本文應(yīng)用的是由高興、生氣、中立三種情感語音組成的情感語音數(shù)據(jù)庫，每種情感語音分別有中英文兩種語言，所用情感語句的中文文本為“我到北京去”英文文本為“ Good morning”以 wav 格式存儲，持續(xù)時間五秒以內(nèi)，經(jīng)過反復(fù)的主觀聽覺實驗，認(rèn)為該情感語音數(shù)據(jù)庫的語料情感辨識度較高，自然度也比較理想，可以滿足本文的研究需求。引導(dǎo)型情感語音通常通過文字對說話者進(jìn)行引導(dǎo)， 6 即通過說話人朗讀帶有一定感情色彩的文本，獲得所需要的情感語句。表演型情感語音是指情感表現(xiàn)力較強(qiáng)的演員模仿不同情感朗誦指定語句獲得的情感語料。按照表達(dá)的情感自然度可以將情感語音數(shù)據(jù)分為 3 個類別：自然型情感語音、表演型情感語音和引導(dǎo)型情感語音 [19]。盡管心理學(xué)、認(rèn)知學(xué)等領(lǐng)域的研究人員對于情感種類的定義五花八門，但在目前絕大多數(shù)的語音情感識別系統(tǒng)中，使用的情感類別是 MPEG4 國際標(biāo)準(zhǔn)定義的五種情感狀態(tài)，即 “憤怒 (Anger)”、“ 恐懼 (Fear)”、“ 高興 (Happiness)”、“ 悲傷 (Sadness)” 和 “ 驚訝 (Surprise)” ，外加 “中立 (Neutral)” 來表征語音不具有情感含義。例如，將語音僅分為 “ 無情感含義 ”與 “ 帶情感含義 ” 兩大類；或是分為 “ 情感強(qiáng)烈 ” 與 “ 情感不強(qiáng)烈 ” 兩大類；部分研究只關(guān)注于用戶的情感狀態(tài)是 “ 正常 ” 還是 “ 不正常 ”；還有的研究只注重用戶的某些負(fù)面情感，如 “ 挫敗 ” 、 “ 厭煩 ” 、 “ 僧惡 ” 等等。美國心理學(xué)家 Eckman 提出了六種基本情緒 [16]：憤怒、恐懼、悲傷、驚訝、高興和厭惡。第六章是對本文主要工作和研究成果的總結(jié)，并對下一步語音情感識別中共振峰提取的研究工作做出展望。包括譜包絡(luò)提取法、倒譜法提取共振峰、 LPC 法提取共振峰、求根法提取共振峰和 LPC 倒譜法提取共振峰，并簡單分析了這幾種提取共振峰方法的優(yōu)缺點。首先簡單地介紹通過離散形式和情感維度空間兩種方法概述了情感的分類，然 4 后介紹了情感語音數(shù)據(jù)分為 3 個類別以及本文所用的情感語音數(shù)據(jù)庫。，并利用這種方法提取情感語音中的共振峰。去除了激勵引起的諧波波動，所以可以更精確地得到共振峰參數(shù)。。中國電子科技研究院的付麗琴等人以 HMM 作為語音情感分類器模型，對不同情感狀態(tài)選擇不同的特征向量進(jìn)行識別。將韻律特征分解為純語音的特征和純情感的特征，并將后者運用于語音情感識別，用多層感知器對六種情感進(jìn)行識別，得到平均 %的識別率 [12]。東南大學(xué)無線電工程系趙力教授的實驗小組在國內(nèi)率先開展了普通話語音情感識別的研究。在語音情感識別方面，他們以客服系統(tǒng)的呼叫中心為應(yīng)用背景，研究識別正面情感和負(fù)面情感。英國貝爾法斯特女王大學(xué)的 RoddyCowie 和 EllenDouglasCowie 教授領(lǐng)導(dǎo)的情感語音小組研究的重點在于心理學(xué)和語音分析。國際情感語音識別發(fā)展現(xiàn)狀目前，關(guān)于情感的研究正處在不斷的深入之中，語音的情感識別因為涉及到不同語種之間的差異，發(fā)展也不盡相同。他們從生理、心理學(xué)角度的情感建模到語音情感的聲學(xué)關(guān)聯(lián)特征，以及各種針對語音情感識別和合成的算法、理論展開了深入的研究，還從工程學(xué)的角度將情感作為信息信號工學(xué)的研究對象。如果講話者的發(fā)音中包含喜、怒、哀、樂等情感信息，那么講話者的聲道形狀就會發(fā)生不同的變化。共振峰頻率簡稱共振峰，它與聲道的形狀和大小有關(guān)，一種形狀對應(yīng)著一套共振峰。語音情感識別是語音識別的一個重要的分支，而語音識別則是數(shù)字信號處理技術(shù)與語音學(xué)的交叉學(xué)科，它和心理學(xué)、計算機(jī)科學(xué)、認(rèn)知科學(xué)、語言學(xué)、人工智能和模式識別等學(xué)科緊密聯(lián)系。語音作為一種自然有效的人機(jī)交互方式，成為當(dāng)前的研究熱點。關(guān)鍵詞：語音情感識別；共振峰參數(shù)；共振峰提取方法；倒譜法 II Extraction method of emotional speech signal of the formant parameters Abstract Speech emotion recognition is one of the hot research of new humanputer interaction technology, which has a wide application prospect in artificial intelligence. Formant frequency is an important characteristic of reflecting the resonant characteristics of channel, it represents the pronunciation of the most direct source of information. So the research of emotional speech signal of the formant parameters is of great significance. Based on the importance of formant parameter in the emotional speech signals, this paper mainly studied the extraction method of emotional speech signal of the formant parameters. Several main methods of extraction of formant are: spectral envelope extraction, cepstrum method and LPC method. Since cepstrum based on the number of inverse Fourier transform power spectrum, it can separate spectral envelope and the fine structure and get very precise information on the formant, so this paper focuses on research

點擊復(fù)制文檔內(nèi)容

公司管理相關(guān)推薦

語音信號端點檢測算法的研究畢業(yè)論文-資料下載頁

【總結(jié)】語音信號端點檢測算法的研究畢業(yè)論文目錄摘要 IAbstract II第1章緒論 1 1 2 4 5第2章語音信號處理基礎(chǔ) 7語音信號的數(shù)學(xué)模型 7 8 8 8 8 9 10 10 10 11 11 11 13 13 13 14 16第3章語音端點檢測的相關(guān)算法 17

2025-06-24 18:14

語音信號基音周期檢測的軟件設(shè)計畢業(yè)論文-資料下載頁

【總結(jié)】黑龍江工程學(xué)院本科生畢業(yè)設(shè)計語音信號基音周期檢測的軟件設(shè)計畢業(yè)論文目錄摘要 IAbstract II第1章引言 1課題研究目的及意義 1基音周期檢測的國內(nèi)外研究現(xiàn)狀 1課題所作主要工作 5各章節(jié)內(nèi)容安排 5第2章總體方案設(shè)計 6語音信號基音周期檢測軟件設(shè)計的思路 6語音信號基音周期檢測軟件設(shè)計的功能分析 6軟件設(shè)計

2025-06-19 13:41

基于matlab的語音信號處理與仿真設(shè)計畢業(yè)論文-資料下載頁

【總結(jié)】蘭州商學(xué)院本科生畢業(yè)論文（設(shè)計）論文（設(shè)計）題目：基于Matlab的語音信號處理與仿真學(xué)院、系：信息工程學(xué)院計

2025-08-17 15:21

基于波原子變換的語音信號去噪畢業(yè)論文-資料下載頁

【總結(jié)】iContents1.INTRODUCTION..................................................................................................i2.WAVEATOMTRANSFORM...........................

2025-08-19 17:33

畢業(yè)論文：基于dsp的語音信號編碼器終稿-資料下載頁

【總結(jié)】摘要近年來，隨著多媒體信息技術(shù)和網(wǎng)絡(luò)技術(shù)的高速發(fā)展，數(shù)字語音壓縮技術(shù)的應(yīng)用領(lǐng)域越來越廣泛，尤其在可視電話、PI網(wǎng)絡(luò)電話、數(shù)字蜂窩移動通信、綜合業(yè)務(wù)數(shù)字網(wǎng)、公共交換電話網(wǎng)和話音存儲轉(zhuǎn)發(fā)系統(tǒng)等領(lǐng)域中，目的是在保證語音一定質(zhì)量的前提下盡可能降低其編碼比特率，便于在有限的傳輸帶寬內(nèi)讓出更多的信道來傳送圖像、文檔、計算機(jī)文件和其他數(shù)據(jù)流。為此，國際電信聯(lián)盟(ITU)

2025-10-31 15:01

基于matlab的語音信號fir數(shù)字濾波處理畢業(yè)論文-資料下載頁

【總結(jié)】目錄1緒論 22課程設(shè)計的具體實現(xiàn) 3語音信號的錄制 3FIR濾波器的設(shè)計方法 33語音信號的時頻分析 4 4 5 6窗函數(shù)hamming設(shè)計帶通濾波器 7窗函數(shù)hanning設(shè)計帶通濾波器 8窗函數(shù)Blackman設(shè)計帶通濾波器 9窗函數(shù)Boxcar設(shè)計帶通濾波器 10 11窗函數(shù)hamming設(shè)計帶通濾波器濾波 11

2025-06-18 16:00

語音識別的特征參數(shù)的提取與研究的畢業(yè)論文-資料下載頁

【總結(jié)】桂林航天工業(yè)學(xué)院畢業(yè)設(shè)計（論文）語音識別的特征參數(shù)的提取與研究的畢業(yè)論文目錄評語　　　　　　　　　　　　　　　　　　　　　　　　　　　?、翊疝q記錄　　　　　　　　　　　　　　　　　　　　　　　　　　　?、虍厴I(yè)設(shè)計任務(wù)書Ⅲ畢業(yè)設(shè)計開題報告

2025-06-19 13:41

畢業(yè)論文-基于matlab的有噪聲語音信號處理說明書-資料下載頁

【總結(jié)】-課題名稱：基于MATLAB的有噪聲語音信號處理系、部：電氣與信息工程學(xué)院學(xué)生姓名：陳榮靈指導(dǎo)教師：陳堅專業(yè)：電子信息工程班級：電子0901班完成時間：2020年10月21日基于MATLAB的有噪聲語音信號處理-

2025-10-29 23:16

畢業(yè)論文-基于matlab的語音信號的基音周期檢測說明書-資料下載頁

【總結(jié)】基于MATLAB的語音信號的基音周期檢測摘要：MATLAB是一種科學(xué)計算軟件，專門以矩陣的形式處理數(shù)據(jù)。MATLAB將要性能的數(shù)值計算和可視化集成在一起，并提供了大量的內(nèi)置函數(shù)，從而被廣泛的應(yīng)用于科學(xué)計算、控制系統(tǒng)和信息處理等領(lǐng)域的分析、仿真和設(shè)計工作。MATLAB在信號與系統(tǒng)中的應(yīng)用主要包括符號運算和數(shù)值計算仿真分析。由于信號與系統(tǒng)課程的許多

2025-11-07 18:46

基于matlab的語音信號的特技處-時延和混響畢業(yè)論文-資料下載頁

【總結(jié)】基于MATLAB的語音信號的特技處理——時延和混響設(shè)計任務(wù)書課題名稱基于MATLAB的語音信號的特技處理——時延和混響設(shè)計目的綜合運用數(shù)字信號處理的理論知識進(jìn)行頻譜分析和濾波器設(shè)計，通過理論推導(dǎo)得出相應(yīng)結(jié)論，再利用MATLAB作為編程工具進(jìn)行計算機(jī)實現(xiàn)，從而加深對所學(xué)知識的理解，建立概念。設(shè)計要求1.熟悉離散信號和系統(tǒng)的時域特性。2.熟悉語音信

2025-06-18 16:47

語音信號時域分析畢業(yè)設(shè)計論文-資料下載頁

【總結(jié)】西安工程大學(xué)畢業(yè)設(shè)計（論文）I摘要語音信號是一種非平穩(wěn)的時變信號，它攜帶著各種信息。在語音編碼、語音識別和語音增強(qiáng)等語音處理中都需要提取語音信號中包含的各種信息。一般而言，語音信號處理的目的有兩種：一種是對語音信號進(jìn)行分析，提取特征參數(shù)，用于后續(xù)處理。另一種是加工

2025-07-05 17:41

通信工程專業(yè)語音信號增強(qiáng)技術(shù)的研究與仿真畢業(yè)論文-資料下載頁

【總結(jié)】第I頁語音信號增強(qiáng)技術(shù)的研究與仿真實現(xiàn)摘要語音信號處理是研究用數(shù)字信號處理技術(shù)對語音信號進(jìn)行處理的一門新興學(xué)科。語音信號處理的應(yīng)用極為廣泛，其中的主要技術(shù)包括語音編碼、語音合成、語音識別和語音增強(qiáng)等，實際中，語音常常受到環(huán)境噪聲的干擾而使

2025-06-22 17:57

基于matlab的語音信號濾波處理畢業(yè)設(shè)計論文-資料下載頁

【總結(jié)】學(xué)號14112220266畢業(yè)設(shè)計(論文)題目:基于MATLAB的語音信號濾波處理作者

2025-06-18 16:08

基于dsp5416的語音信號采集與保密傳輸?shù)膶崿F(xiàn)畢業(yè)論文-資料下載頁

【總結(jié)】基于DSP5416的語音信號采集與保密傳輸?shù)膶崿F(xiàn)解放軍信息工程大學(xué)畢業(yè)設(shè)計（論文）課題名稱基于DSP5416的語音信號采集與保密傳輸?shù)膶崿F(xiàn)基于DSP5416的語音信號采集與保密傳輸?shù)膶崿F(xiàn)摘要現(xiàn)代信息社會中保密通信在保護(hù)信息不受竊取方面起到了重要的作用。采用數(shù)據(jù)加密技術(shù)是實現(xiàn)保密通信的重要手段，而DSP（數(shù)字信號處理器）又是

2025-06-25 02:14

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片