freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

情感語音信號中共振峰參數(shù)的提取方法畢業(yè)論文-wenkub

2022-09-07 12:48:34 本頁面
 

【正文】 cepstrum formant extraction. This paper use MATLAB software cepstrum emotional state to achieve happy, angry and neutral three formant parameter extraction. Analysis to extract a result, I get some of the following conclusions: Relative to the neutral pronunciation, the happy and angry the first formant frequency is relatively increased. Pronunciation features from the human point of view, people are happy and angry expression, mouth to pronounce than when Zhang was more calm, so there will be such an oute. So, you can use the formant speech as a means to distinguish between different emotions. Key Words: Speech Emotion Recognition。由于倒譜法根據(jù)對數(shù)功率譜的逆傅立葉變換,能夠分離頻譜包絡(luò)和細(xì)微結(jié)構(gòu),很精確地得到共振峰信息,所以本文重點研究倒譜法提取共振峰。共振峰頻率是反映聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來源。 。 ( 3) LPC法提取共振峰:從線性預(yù)測導(dǎo)出的聲道濾波器是頻譜包絡(luò)估計器的最新形式, 線 性預(yù)測提供了一個優(yōu)良的聲道模型 (條件是語音不含噪聲) 。共振峰作為情感特征信息的非韻律特征參數(shù),我們研究提取它的方法對包含在語音信號中的情感信息分析和處理時及其有意義的 。人在語音感知中也利用了共振峰信息。語音情感信息處理技術(shù)的研究對于提高計算機(jī)的智能化具 有重要的現(xiàn)實意義。 4:寫一篇論文并給出共振峰提取結(jié)果。太原理工大學(xué) 畢業(yè)設(shè)計(論文)任務(wù) 書 畢業(yè)設(shè)計(論文)題目: 情感語音信號中共振峰參數(shù)的提取方法 畢業(yè)設(shè)計(論文)要求及原始數(shù)據(jù)(資料): 要求: 1:大量查閱關(guān)于共振峰提取技術(shù)的資料(通過 Inter 或圖書館)。 原始數(shù)據(jù): 1:共振峰研究意義 隨著多模態(tài)人機(jī)交互技術(shù)的發(fā)展,新型人機(jī)交互模式的應(yīng)用前景更加廣闊。 語音情感信息處理技術(shù)作為一個重要的研究領(lǐng)域已經(jīng)有很長時間的研究歷史了,然 而在傳統(tǒng)語音信號處理中往往忽略了在語音信號中的情感因素。所以共 振峰已經(jīng)廣泛地用作語音識別的主要特征和語音編碼的基本信息。 2:共振峰的幾種提取方法 ( 1)譜包絡(luò)提取法:共振峰信息包含在語音頻譜包絡(luò)中, 因此共振峰參數(shù)提取的關(guān)鍵是 估計自然語音頻譜包絡(luò), 并認(rèn)為譜包絡(luò)中的最大值就是共振峰。 ( 4)求根法提取共振峰:找出多項式復(fù)根 的過程通常采用牛頓 — 拉夫遜 ( NewtonRaphson) 算法。 ( 1)虛假峰值 ( 2)共振峰合并 ( 3)高音調(diào)語音 ,對多種共振峰提取方法進(jìn)行比較和分析。所以研究情感語音信號中共振峰參數(shù)是有很大意義的。 本文通過 MATLAB 軟件利用倒譜法實現(xiàn)了 對高興、生氣、中立三種情感狀態(tài)的共振峰參數(shù)的提取。 Formant parameters。語音信號不僅包含語音信息,還包含著說話人的情感信息。近年來,人們研究發(fā)現(xiàn)情感所引起的語音信號變化對語音識別、語音合成、說話人確認(rèn)等方面有較大影響,所以語音情感處理的研究逐步提高了人們的重視。共振峰是反映聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來源,而且人在語音感知中 利用了共振峰信息。共振峰作為情感特征信息的非韻律特征參數(shù),我們研究提取它的方法對包含在語音信號中的情感信息分析和處理是極其有意義的 [1][2]。 但是,目前不論從國外還是國內(nèi)來看,情感信息處理的研究,還是處在一個低級水平,存在一些需要進(jìn)一步深入研究的課題。 2 美國 MIT 媒體實驗室 Rosalind Wpicard 教授領(lǐng)導(dǎo)的情感研究組織首次嘗試了用基頻、時長、音質(zhì)和清晰度等聲學(xué)參數(shù)的變化來合成情感語音。他們收集并創(chuàng)建了第一個大規(guī)模的高自然度聲音的情感數(shù)據(jù)庫,同時還開發(fā)了一個 FEELTRACE 工具用來記錄人類從語音中感知到的情感信息 [6]。首次將語音的聲學(xué)信息、詞匯和語義信息結(jié)合,并將模糊推論系統(tǒng)用于識別系統(tǒng),初步試驗結(jié)果表明,結(jié)合這三種信息進(jìn)行語音信號的情感識別要比單純使用聲學(xué)信息識別率平均提 高了%[9]。他們分析了不同情感的語音在時間構(gòu)造,能量構(gòu)造,基音構(gòu)造,共振峰構(gòu)造等方面的差別,以情感語音和自然語音特征向量的差值作為情感識別特征,用主成分分析法識別高興、驚奇、憤怒、悲傷四類情感,在較小的實驗數(shù)據(jù)集中能達(dá)到約 80%的識別率 [11]。 臺灣大同大學(xué)資訊工程學(xué)系的包蒼龍教授領(lǐng)導(dǎo)的數(shù)據(jù)通訊與信號處理實驗室也較早地致力于普通話語音情感識別的研究。系統(tǒng)分兩個階段完成 :首先基于漏識率和誤識率最小的決策原則,采用優(yōu)先選擇 (PFS)算法分別為每種情感狀態(tài)選擇最優(yōu)的特征向量,然后用這些特征向量分別建立對應(yīng)情感狀態(tài)的 HMM 模型。 ( 1)虛假峰值 ( 2)共振峰合并 ( 3)高音調(diào)語音 。 ( 3) LPC 法提取共振峰 從線性預(yù)測導(dǎo)出的聲道濾波器是頻譜包絡(luò)估計器的最新形式,線性預(yù)測提供了一個優(yōu)良的聲道模型(條件是語音不含噪聲)。 ,并得出結(jié)論。最后介紹了語音情感識別系統(tǒng)。 第五章重點介紹了倒譜法提取共振峰的過程。 5 第 2章 情感的分類與語音情感識別 情感的分類 情感類型的合理界定是對語句進(jìn)行情感標(biāo)注的基礎(chǔ)。而 Plutchik 提出過八種基本情緒 [17]悲痛、恐懼 、驚奇、接受、狂喜、狂怒、警惕、憎恨 。 除了以標(biāo)簽法將情感分成離散的類別之外, 一些研究者嘗試在連續(xù)的空間中描述情感,也稱作維度輪 [19]。 情感語音數(shù)據(jù)庫 要對語音進(jìn)行情感識別,情感語音數(shù)據(jù)庫的建立是基礎(chǔ)。 自然型情感語音是在說話人不知情的情況下獲取的完全放松狀態(tài)下的情感語音。相對于自然型情感語音,表演型情感語音較容易獲取,可控制性較強(qiáng),可以根據(jù)需要錄制任意說話內(nèi)容的情感語句。引導(dǎo)型情感語音是自然型和表演型情感語音錄制方法的一種折中,定制性比較強(qiáng)且語料的獲取相對方便,適合基于不同文本的語音情感方面的研究。 語音情感識別系統(tǒng) 預(yù) 處 理 特 征 提 取情 感 語 音 輸 入模 式 匹 配模 板 庫參 考 模 式識 別 結(jié) 果 輸 出 圖 21 典型語音情感識別系統(tǒng)的框圖 語音情感識別系統(tǒng)與語音識別系統(tǒng)類似,分為 語音情感語句預(yù)處理、特征參數(shù)提取和模式匹配三個部分。典型的語音情感識別系統(tǒng)如圖 21 所示。 共振峰的分布位置是建立在 聲音 產(chǎn)生媒介的共鳴物理結(jié)構(gòu)基礎(chǔ)上的( Resonant Physical Structure)。這就可以幫助我們解釋為什么在很多的樂器中,同一樂器所發(fā)出的不同 音調(diào) 具有相同的 音質(zhì) 。 共振峰參數(shù)的研究意義 漢語普通話發(fā)音中情感特征信息的特征參數(shù)主要包括發(fā)音持續(xù)時間、振幅能量、 基音 頻率和共振峰頻率等。這些問題包括: ( 1)虛假峰值。為了增加靈活性會給預(yù)測器增加 2~3 個額外的極點,有時可利用這些極點代表虛假峰值。 8 ( 3)高音調(diào)語音。在這樣的語音中,線性預(yù)測包絡(luò)峰值趨向于離開真實位置,而朝著最接近的諧波峰位移動。為了消除基頻諧波的影響,可以采用同態(tài)解卷技術(shù),經(jīng)過同態(tài)濾波后得到平滑的譜,這樣簡單地檢測峰值就可以直接提取共振峰參數(shù),因而這種方法更為有效和精確。 圖 42 倒譜法求取的共振峰參數(shù)圖 LPC 法提取共振峰 從線性預(yù)測導(dǎo)出的聲道濾波器是頻譜包絡(luò)估計器的最新形式,線性預(yù)測提供了一個優(yōu)良的聲道模型(條件是語音不含噪聲)。此時求出聲道響應(yīng)分量的譜峰,就可以求出共振峰,這里有兩種途徑:一是用標(biāo)準(zhǔn)的求取復(fù)根的方法計算全級模型分母多項式A(z)的根,稱為求根法;一是用運算量較少的 DFT 法,求 A(z)的離散頻率響應(yīng) A(k)的谷點來得到共振峰的位置。另外也可以采用拋物線內(nèi)插技術(shù),解決頻率分辨率較低的情況下的共振峰頻率值的求取。由上述過程可知,重復(fù)運算找出復(fù)根的計算量相當(dāng)可觀。設(shè)與i 對應(yīng)的共振峰頻率為 Fi, 3dB 帶寬為 Bi,則它們存在下面的關(guān)系: iiTF ?? ?2 () iTB re i ?? ? () 所以: TF ii ??2? () TrB ii ?ln?? () 式中, T 是采樣周期。 LPC 倒譜法提取共振峰 語音信號的倒譜可以通過對信號做傅里葉變換,取模的對數(shù), 再 求反傅里葉變換得到。設(shè) 0)0(? ?h ,將兩邊同時對 z1求導(dǎo),得 ??????????? ??????????????????1111 )(11lo gnnipiiznhzzaz () 13 得到 ???????????????? piiipiiinnzaziaznhn111111)( () 有 ? ? ??? ??? ????? ???? ? ????????? ? 1 11 111 n iin npi ii ziaznhnza () 令式左右兩邊 z 的各次冪前系數(shù)分別相等得到: ?????????????????????????piiniinpninhaninhpninhanianhah1111)(?)1()(?1)(?)1()(?)1(? () 按照上式可直接從預(yù)測系數(shù) {ai}求得倒譜 )(?nh 。聲道的系統(tǒng)函數(shù)可以由一組 LPC 預(yù)測系數(shù)唯一確定 , 因此通過分析能估計出聲道調(diào)制的效果 , 即獲得共振峰參數(shù)。 LPC 倒譜由于利用線性預(yù)測中聲道系統(tǒng)函數(shù) H(z)的最小相位特性,因此避免了一般同態(tài)處理中對復(fù)對數(shù)的麻煩。 杭州電子工業(yè)學(xué)院郁伯康,郁梅在 LPC 方法提取語音信號共振峰的分析中說明線性預(yù)測編碼 (LPC)是進(jìn)行語音信號分析、語音信號編碼最有效的技術(shù)之一。并結(jié)合理論分析和實驗結(jié)果表明,采用相 頻特性與對數(shù)幅 頻特性同樣能夠提取語音信號共振峰。文中分析了共振峰提取中存在的極點交叉問題,通過對極點排序,提出基于極點交叉的 LPC 改進(jìn)算法,從而有效解決這兩個問題,并在實驗結(jié)果中證明了此算法能夠根據(jù)實際要求準(zhǔn)確提取耳語音的前三個或前四個共振峰 [25]。把共振峰作為特征參數(shù)用于一個小詞匯量的漢語語音識別系統(tǒng)中,識別正確率達(dá)到了 98%[26]。因此用低時窗 ()ln從語音信號倒譜 c(n)中所截取出來得 h(n),能更精確地反映聲道響應(yīng)。在英語中,倒譜 Cepstrum是將譜 Spectrum中前四個字母倒置后得到的,因為 )(? ?jeX 一般為復(fù)數(shù),故稱 )(?nx 為復(fù)倒譜。復(fù)倒譜涉及復(fù)對數(shù)運算,而 倒譜只進(jìn)行實數(shù)的對數(shù)運算,較復(fù)倒譜的運算量大大減少。因而它比原信號 x(n)更集中于原點附近,或者說它更具有短時性。但是使用倒譜法估計共振峰頻率中要注意,并不是所有的譜峰都是共振峰,而且當(dāng)兩個共振峰很靠近時,會發(fā)生譜重疊,很難計算共振峰的帶寬。圖 51 為共振峰提取框圖,圖 52為共振峰提取流程圖 [23]。 23 第 6章 總結(jié)與展望 全文總結(jié) 語音情感識別是新型人機(jī)交互技術(shù)的研究熱點之一,國內(nèi)外關(guān)于語音情感識別的研究還處于探索嘗試階段,對于語音情感特征參數(shù)的提取方法還有待進(jìn)一步地深入研究。 ( 4) 根據(jù)本文共振峰提取結(jié)果進(jìn)行分析,得出高興、生氣和中立三種情感語音的共振峰分析結(jié)論。并同時提取多種情感種類的語音信號共振峰,并分析提取結(jié)果。 24 參考文獻(xiàn) [1] 胡航 . 語音信號處理 [M]. 哈爾濱 : 哈爾濱工業(yè)大學(xué)出版社 , 2020: 113116. [2] 張剛 , 張雪英 , 馬建芬 . 語
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1