freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

情感語音信號中共振峰參數(shù)的提取方法畢業(yè)論文-wenkub.com

2025-08-13 12:48 本頁面
   

【正文】 其次我要感謝在論文研究期間一起討論,互相學(xué)習(xí)的同組同學(xué),是他們讓我看到了自己的不足,也讓我在討論中得到了進(jìn)步。在我有問題向她請教時,無論問題大小,她都耐心的給我講解。所以需要對情感語音共振峰提取方法做出進(jìn)一步改進(jìn),使提取效果更佳完善。同時提高情感語音表達(dá)的自然度,擴(kuò)大情感語料的涉及范圍,并且盡可能的使語音庫涵蓋多個語種。 ( 3) 重點介紹倒譜法以及倒譜法提取語音信號中共振峰的原理與具體過程,并實現(xiàn)運用倒譜法實現(xiàn)共振峰的提取。所以說,可以用共振峰作為區(qū)分不同情感語音的手段。對倒譜進(jìn)行低時選窗,通過語音倒譜分析系統(tǒng)的最后一級,進(jìn)行 DFT 后的輸出即為平滑后的對數(shù)模函數(shù),這個平滑的對數(shù)譜顯示了特定輸入語音段的諧振結(jié)構(gòu),即譜的 峰值基本上對應(yīng)于共振峰頻率,對平滑過的對數(shù)譜中的峰值進(jìn)行定位,即可提取共振峰。由 h(n)經(jīng) DFT 得到的 H(K)就是聲道的離散譜 曲線,由于它去除了激勵引起的諧波動,因此能更精確地得到共振峰參數(shù)。選擇最普遍的極零模型來描述聲道響應(yīng) x(n),其 z 變換的形式為: ? ? ? ?? ? ? ?? ?? ?? ??? ???????iipkpkkkmkmkkkzdzczbzaAzX1 111 11001111)( () 經(jīng)過傅立葉變換、取對數(shù)和逆傅立葉變換后可以得到其復(fù)倒譜: ???????????????? ?? ?? ???? ?0 01 11 1)0()0()0(ln)(?mkpknknkpkmknknknndnbnnancnAnxi i () 對于倒譜可以只考慮它的幅度特性,可以看出,它是一個衰減序列,且衰減的速度n1快。它們都將卷積運算,變?yōu)閭螘r域中的加法運算,使得信號可以運用滿足疊加性的線性系統(tǒng)進(jìn)行處理。 16 第 5章 倒譜法提取共振峰的實現(xiàn) 倒譜的定義 設(shè)信號 )(nx 的 z 變換為 )]([)( nxzzX ? ,其對數(shù)為 ) ] ]([ln [)(ln)(? nxzzXzX ?? () 那么 )(?zX 的逆 z 變換可寫成 )]]([[ ln)]([ ln)](?[)(? 111 nxzzzXzzXznx ??? ??? () 取 ?jez? ,式( )可寫為 )](a r g [)(ln)](l n [)(? ???? jjjj eXjeXeXeX ??? () 式( )可寫為 ??? ?? ?? ?? deeXnx njj )(?21)(? () 則式( )即為信號 )(nx 的復(fù)倒譜 )(?nx 的定義。因為倒譜運用對數(shù)運算和二次變換將基音諧波和聲道的頻譜包絡(luò)分離開來。采用了優(yōu)化動態(tài)搜索的算法,提高了運算速度。耳語音不同于正常語音的特性,使得準(zhǔn)確提取其共振峰存在更大的困難。研究討論了數(shù)字濾波器 H(z)在 z平面上的幅 頻、相 頻特性,分析比較了對數(shù)幅 頻特性的二次導(dǎo)數(shù)、相 頻特性的一次導(dǎo)數(shù)和三次導(dǎo)數(shù)的頻率分辨率。 同類文章提取方法比較 基于提取語音信號中的共振峰有多種方法,有很多采取其他共振峰提取方法的同類論文。 求根法求取共振峰的優(yōu)點在于通過對預(yù)測多項式系數(shù)的分解可以精確地確定共振峰的中心頻率和帶寬。 LPC 法的 缺點是用一個全極點模型逼近語音譜,對于含有零點的某些音來說 A(z)的根反映了極零點的復(fù)合效應(yīng),無法區(qū)分這些根是相對于零點還是極點,或完全與聲道的諧振極點有關(guān)。下面求 h(n)的倒譜 )(nh? ,首先根據(jù)同態(tài)分析方法,有 )(log)(? zHzH ? 因為)(zH 是最小相位的,即在單位圓內(nèi)是解析的,所以 )(?zH 一定可以展開成級數(shù)形式,即???? ?? 1 )(?)(? n nznhzH 就是說 )(?zH 的逆變換 )(?nh 是存在的。而且,不屬于共振峰的額外極點容易排除掉,因為其帶寬比共振峰帶寬要大得多。 具體過程是:設(shè):ijii erz ??為第一個根,則其共軛值 ijii erz ???也是一個根。當(dāng)前后兩個猜測值之差小于某門限時結(jié)束猜測過程。為了 提高 DFT 的頻率分辨率,可以采用補 0 的辦法增加序列的時間長度,即用( 1, a1, a2,?, ap, 0,0,?, 0)進(jìn)行 DFT,為了能利用 FFT,長度一般取為 64 點、 128 點、 256 點、 512 點等。盡管其精度由于存在一 定的逼近誤差而有所降低,但去除了激勵分量的影響。這樣,由 h(n)經(jīng) DFT 得到的 H(k),就是聲道的離散譜曲線,用 H(k)代替直接 DFT 的頻譜,因為去除了激勵引起的 諧波波動,所以可以更精確地得到共振峰參數(shù)。 ( 1) 原始語音幀信號 ( 2)線性預(yù)測 信號 ( 3)預(yù)測誤差 ( 4)預(yù)測信號功率譜 ( 5)預(yù)測信號幅頻響應(yīng) ( 6)聲道倒譜 ( 7) LPC 倒譜 ( 8) LPC 倒譜包絡(luò) 圖 41 信號線性預(yù)測譜包絡(luò)提取分析圖 10 倒譜法提取共振峰 雖然可以直接對語音信號求離散傅里葉變換( DFT),然后用 DFT 譜來提取語音信號的共振峰參數(shù),但是,直接 DFT 的譜要受基頻諧波的影響,最 大值只能出現(xiàn)在諧波頻率上,因而共振峰測定誤差較大。即使采用線性預(yù)測進(jìn)行頻譜包絡(luò)估計也會出現(xiàn)這個問題。這時會產(chǎn)生共振峰合并現(xiàn)象,而探討一種理想的能對共振峰合并進(jìn)行識別的共振峰提取算法存在很多實際困難。甚至在采用線性預(yù)測方法時,也并非沒有虛假峰值。 提取共振峰參數(shù)所遇到的問題 與 基音 檢測類似,共振峰估計也是表面上看起來很容易,而實際上又受很多問題困擾。我們之所以能夠區(qū)分不同的人聲、元音,主要也是依靠它們的共振峰分布的位置。由于一件樂器的結(jié)構(gòu)是穩(wěn)定的,因此在一件樂器發(fā)出的所有 音調(diào) 中,不論 基頻 如何,都會表現(xiàn)出相同的共振峰值,只不過其顯著性有強(qiáng)有弱罷了。共振峰信息包含在頻率包絡(luò)之中,因此共振峰參數(shù)提取的關(guān)鍵是估計自然語音頻譜包絡(luò),一般認(rèn)為譜包絡(luò)中的最大值就是共振峰 [1]。最后將不同情感的特征參數(shù)進(jìn)行訓(xùn)練形成不同的模板庫,并將待識別情感的特征參數(shù)與模板庫進(jìn)行模式匹配,從而將情感識別結(jié)果輸出。本文應(yīng)用的是由高興、生氣、中立三種情感語音組成的情感語音數(shù)據(jù)庫,每種情感語音分別有中英文兩種語言,所用情感語句的中文文本為“我到北京去”英文文本為“ Good morning”以 wav 格式存儲,持續(xù)時間五秒以內(nèi),經(jīng)過反復(fù)的主觀聽覺實驗,認(rèn)為該情感語音數(shù)據(jù)庫的語料情感辨識度較高,自然度也比較理想,可以滿足本文的研究需求。引導(dǎo)型情感語音通常通過文字對說話者進(jìn)行引導(dǎo), 6 即通過說話人朗讀帶有一定感情色彩的文本,獲得所需要的情感語句。 表演型情感語音是指情感表現(xiàn)力較強(qiáng)的演員模仿不同情感朗誦指定語句獲得的情感語料。按照表達(dá)的情感自然度可以將情感語音數(shù)據(jù)分為 3 個類別:自然型情感語音、表演型情 感語音和引導(dǎo)型情感語音 [19]。 盡管心理學(xué)、認(rèn)知學(xué)等領(lǐng)域的研究人員對于情感種類的定義五花八門,但在目前絕大多數(shù)的語音情感識別系統(tǒng)中 ,使用的情感類別是 MPEG4 國際標(biāo)準(zhǔn)定義的五種情感狀態(tài),即 “憤 怒 (Anger)”、“ 恐懼 (Fear)”、“ 高興 (Happiness)”、“ 悲傷 (Sadness)” 和 “ 驚訝 (Surprise)” ,外加 “中立 (Neutral)” 來表征語音不具有情感含義。 例如,將語音僅分為 “ 無情感含義 ”與 “ 帶情感含義 ” 兩大類 ; 或是分為 “ 情感強(qiáng)烈 ” 與 “ 情感不強(qiáng)烈 ” 兩大類 ; 部分研究只關(guān)注于用戶的情感狀態(tài)是 “ 正常 ” 還是 “ 不正常 ”; 還有的研究只注重用戶的某些負(fù)面情感,如 “ 挫敗 ” 、 “ 厭煩 ” 、 “ 僧惡 ” 等等 。 美國心理學(xué)家 Eckman 提出了六種基本情緒 [16]: 憤怒、恐懼、悲傷、驚訝、高興和厭惡。 第六章是對本文主要工作和研究成果的總結(jié),并對下一 步語音情感識別中共振峰提取的研究工作做出展望。包括譜包絡(luò)提取法、倒譜法提取共振峰、 LPC 法提取共振峰、求根法提取共振峰和 LPC 倒譜法提取共振峰,并簡單分析了這幾種提取共振峰方法的優(yōu)缺點。首先簡單地介紹通過離散形式和情感維度空間兩種方法概述了情感的分類,然 4 后介紹了情感語音數(shù)據(jù)分為 3 個類別以及本文所用的情感語音數(shù)據(jù)庫。 ,并利用這種方法提取情感 語音中的共振峰。去除了激勵引起的諧波波動,所以可以更精確地得到共振峰參數(shù)。 。 中國電子科技研究院的付麗琴等人以 HMM 作為語音情感分類器模型,對不同情感狀態(tài)選擇不同的特征向量進(jìn)行識別。將韻律特征分解為純語音的特征和純情感的特征,并將后者運用于語音情感識別,用多層 感知器對六種情感進(jìn)行識別,得到平均 %的識別率 [12]。 東南大學(xué)無線電工程系趙力教授的實驗小組在國內(nèi)率先開展了普通話語 音情感識別的研究。在語音情感識別方面,他們以客服系統(tǒng)的呼叫中心為應(yīng)用背景,研究識別正面情感和負(fù)面情感。 英國貝爾法斯特女王大學(xué)的 RoddyCowie 和 EllenDouglasCowie 教授領(lǐng)導(dǎo)的情感語音小組研究的重點在于心理學(xué)和語音分析。 國際情感語音識別發(fā)展現(xiàn)狀 目前,關(guān)于情感的研究正處在不斷的深入之中,語音的情感識別因為涉及到不同語種之間的差異,發(fā)展也不盡相同。他們從生理、心理學(xué)角度的情感建模到語音情感的聲學(xué)關(guān)聯(lián)特征,以及各種針對語音情感識別和合成的算法、理論展開了深入的研究,還從工程學(xué)的角度將情感作為信息信號工學(xué)的研究對象。如果講話者的發(fā)音中包含喜、怒、哀、樂等情感信息,那么講話者的聲道形狀就會發(fā)生不同的變化。共振峰頻率簡稱共振峰,它與聲道的形狀和大小有關(guān),一種形狀對應(yīng)著一套共振峰。語音情感識別是語音識別的一個重要的分支,而語音識別則是數(shù)字信號處理技術(shù)與語音學(xué)的交叉學(xué)科,它和心理學(xué)、計算機(jī)科學(xué)、認(rèn)知科學(xué)、 語言學(xué)、人工智能和模式識別等學(xué)科緊密聯(lián)系。語音作為一種自然有效的人機(jī)交互方式,成為當(dāng)前的研究熱點。 關(guān)鍵詞 : 語音情感識別;共振峰參數(shù);共振峰提取方法;倒譜法 II Extraction method of emotional speech signal of the formant parameters Abstract Speech emotion recognition is one of the hot research of new humanputer interaction technology, which has a wide application prospect in artificial intelligence. Formant frequency is an important characteristic of reflecting the resonant characteristics of channel, it represents the pronunciation of the most direct source of information. So the research of emotional speech signal of the formant parameters is of great significance. Based on the importance of formant parameter in the emotional speech signals, this paper mainly studied the extraction method of emotional speech signal of the formant parameters. Several main methods of extraction of formant are: spectral envelope extraction, cepstrum method and LPC method. Since cepstrum based on the number of inverse Fourier transform power spectrum, it can separate spectral envelope and the fine structure and get very precise information on the formant, so this paper focuses on research
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1