freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

情感語音信號中共振峰參數(shù)的提取方法畢業(yè)論文(存儲版)

2025-10-07 12:48上一頁面

下一頁面
  

【正文】 譜運(yùn)用對數(shù)運(yùn)算和二次 變換將基音諧波和聲道的頻譜包絡(luò)分離開來。 第二章主要介紹了情感分類的基礎(chǔ)理論和情感語音數(shù)據(jù)庫,最后介紹了語音情感識別系統(tǒng)。并對共振峰提取結(jié)果進(jìn)行分析與總結(jié)。 另外,關(guān)于語音情感的研究還可以更為簡單化,部分研究對情感的分類更側(cè)重于系統(tǒng)的實(shí)用性 。因?yàn)檎Z音的質(zhì)量將直接影響整個語音情感識別系統(tǒng)的性能。 引導(dǎo)型情感語音是指通過一定 的外界環(huán)境和手段,引導(dǎo)說話人的情緒進(jìn)入某種特定的狀態(tài),從而錄制情感語音的方法。其次是對情感語句提取特征參數(shù),如 MFCCI、LPCC、 LPMCC 和 ZCPA 等頻譜特征參數(shù) 。樂器不同的共鳴系統(tǒng)使其在一定頻域中的分音的 振幅 得以突出,這樣,這些區(qū)域就產(chǎn)生了這個樂器所特有的共振峰值,這些共振峰值同共鳴體的大小、形狀的材料密切相關(guān)。共振峰參數(shù)已經(jīng)廣泛地用作語音識別的主要特征和語音編碼傳輸?shù)幕拘畔?,共振峰軌跡包含了說話人的個性特征,對說話人識別有著重要意義,同時也是語言學(xué)家研究人類發(fā)音技能的有效工具 [21]。相鄰共振峰的頻率可能會靠的太近而難以分辨。下圖 41 是對 21 幀信號的線性預(yù)測譜包絡(luò)提取分析 [22]。 用線性預(yù)測可對語音信號進(jìn)行解卷:即把激勵分量歸入預(yù)測殘差中,得到聲道響應(yīng)的全級模型 H(z)的分量,從而得到這個分量的 ia 參數(shù)。其方法是一開始先猜測一個根值并就此猜測值計算多項(xiàng)式及其導(dǎo)數(shù)的值,然后利用結(jié) 果再找出一個改進(jìn)的猜測值。因而判斷某一 12 個極點(diǎn)屬于哪一個共振峰的問題就不太復(fù)雜。 幾種提取方法分析比較 以上實(shí)驗(yàn)表明,倒譜法因?yàn)槠漕l譜曲線的波動比較小,所以估計共振峰參數(shù)的效果是較好的,但其運(yùn)算量太大。 本文重點(diǎn)研究 倒譜法提取共振峰,倒譜法根據(jù)對數(shù)功率譜的逆傅立葉變換,能夠分離頻譜包絡(luò)和細(xì)微結(jié)構(gòu),很精確地得到共振峰信息。 劉建新,曹榮,趙鶴鳴在西華大學(xué)學(xué)報中發(fā)表的一種 LPC 改進(jìn)算法在提取耳語音共振峰中的應(yīng)用論文中說明了傳統(tǒng)線性預(yù)測編碼 (LPC)算法在提取語音共振峰時存在虛假峰和合并峰的問題。所以本文采用倒譜法提取情感語音中的共振峰。 倒譜和復(fù)倒譜的主要區(qū)別是對序列對數(shù)幅度譜的傅立葉逆變換,它是復(fù)倒譜中的偶對稱分量。根據(jù)其特點(diǎn)利用短時窗可以從語音信號倒譜 c(n)中截取出 h(n)。 運(yùn)用本文所介紹的算法,對高興、生氣、中立三種情感語音信息進(jìn)行共振峰提取,得到的結(jié)果如圖 5 57 和 58 所示,從圖中可以看出,相對于中立發(fā)音而言,高興和生氣的第一共振峰頻率相對升高,從人的發(fā)音特點(diǎn)來看,人們在表達(dá)高興和生氣時,嘴比平靜發(fā)音時張得更大,因此會出現(xiàn)這樣的結(jié)果。由于本實(shí)驗(yàn)中采用的語音庫僅僅包含高興、生氣和中立三種情感,語音庫的情感種類太少,這與實(shí)際中人類豐富的情感是不符的,可以再將其它情感補(bǔ)充進(jìn)來 。她推薦我查看大量書籍和資料,使我在寫論文之初就打下了扎實(shí)的理論基礎(chǔ)。還要感謝我的舍友吳秀娟同學(xué),是她在我在我論文遇到困難的時候,幫我分析原因,逐步解決,使我的畢業(yè)設(shè)計能夠有充分的發(fā)揮空間。 24 參考文獻(xiàn) [1] 胡航 . 語音信號處理 [M]. 哈爾濱 : 哈爾濱工業(yè)大學(xué)出版社 , 2020: 113116. [2] 張剛 , 張雪英 , 馬建芬 . 語音處理與編碼 [M]. 北京 , 兵器工業(yè)出版社 , 2020. [3] Rosalind W Picard. Affective puting[J], Minds and Machines, 1999, 9:443447. [4] Cowie R and Cornelius R. Describing the emotional stares that are expressed in Speech[J], HumanComputer Studies, 2020, 40:53. [5] D Ververidis and C Kotropoulos, Emotional speech recognition:Resources, features and methods[J], Speech Communication, 2020, 48(9):11621181. [6] Cowie, , , MeMahon, , , ’:An Instrument for Recording Perceived Emotion in Real Time. In ISCA Workshop on Speech and Emotion, Belfast 2020. [7] Cowie, , and hearers are people:Reflections on Speech deterioration as a consequence of acquired deafness in Profound Deafness and Speech Communication. London, 1995. [8] , , statistical analysis of the signal and prosodic signs of emotion in Proc. 4th Int. Conf. Spoken Language , PA, 1996:19891992. [9] Fernandez, Computational Model for the Automatic Recognition of Affect in Media Arts and Science, February 2020. [10] Ang J, Dhillon R, KruPSki A, Shriberg E, Stoleke automatic detection of annoyance and frustration in humanputer dialog[C], IPIC on spoken Language Processing, Denver, 2020, 3:20372040. [11] 趙力 , 蔣春輝 , 鄒采榮 . 語音信號中的情感特征分析和識別的研究 [N]. 電子學(xué)報 , 2020, 4:606609. [12] DanNingJiang, Lian Hong Cai. Classifying Emotion in Chinese Speech by Deposing Prosodic Signal Processing , 15:3236. [13] TSangLong Pao, YuTe Chen, JunHeng Yeh. Emotion Recognition From Mandarin Speech , 2020:301304. [14] 付麗琴 , 王玉寶 , 王長江 . 基于多特征向量的語音情感識別 [M]. 計算機(jī)科學(xué) , 2020, 36(6):231134. [15] Wang Qing, Xie Bo and Chen Gencai. Emotion recognition of speech in mandarin based on neural work[C]. The 1st Chinese Conference on Affective Computing and Intelligent Interaction(ACIf03), , Beijing, 2020. 25 [16] Ekman, Argument for Basic Emotions. Cognition and Emotion, 1992, 6:169200. [17] Plutchik, General Psychoevolutionary Theory of Emotion. In Emotion:Theory, Research, and Experience, 1980, l:333. [18] Shaver, , , ’Connor, Knowledge:Further Exploration of a Prototype Approach. Journal of Personality and Social Psychology, 1987, 52(6):10611086. [19] 謝波 , 普通話語音情感識別關(guān)鍵技術(shù) [D], 博士論文 , 浙江大學(xué) , 2020. [20] . Emotion:A psychoevolutionary synthesis[M]. New York Harper and Row, 1980. [21] M. Lee, J. van. Santen, B. Mobius and J. Olive. Formant Tracking Using ContextDependent Phonemic Information. IEEE Trans. on Speech and Audio Processing, 2020, 13(5): 741750. [22] 楊丹 , 姜占才 , 余鎣良 . 語音信號共振峰提取方法的研究分析 [D], 科技信息 , 161162. [23] 張雪英 . 數(shù)字語音處理及 MATLAB 仿真 [M]. 北京 , 電子工業(yè)出 版社 , 2020. [24] 郁伯康,郁梅 . LPC 方法提取語音信號共振峰的分析 [D], 電聲技術(shù), 2020,3:37 [25] 劉建新 , 曹榮 , 趙鶴鳴 . 一種 LPC 改進(jìn)算法在提取耳語音共振峰中的應(yīng)用 ,西華大學(xué)學(xué)報 [N], 2020,27(3):7780. [26] 章文義 , 朱杰 , 陳斐利 . 一種新的共振峰參數(shù)提取算法及在語音識別中的應(yīng)用 [D]. 2020,29 (13):6768. 26 致謝 在畢業(yè)論文即將完成之 際,我要向在這段時間里給予我?guī)椭椭С值睦蠋熀屯瑢W(xué)表示衷心的感謝! 首先十分感謝我的導(dǎo)師孫穎老師,本文從研究課題的確定到最后的修改,都是在她的悉心指導(dǎo)下完成的。 ( 4) 根據(jù)本文共振峰提取結(jié)果進(jìn)行分析,得出高興、生氣和中立三種情感語音的共振峰分析結(jié)論。圖 51 為共振峰提取框圖,圖 52為共振峰提取流程圖 [23]。因而它比原信號 x(n)更集中于原點(diǎn)附近,或者說它更具有短時性。在英語中,倒譜 Cepstrum是將譜 Spectrum中前四個字母倒置后得到的,因?yàn)?)(? ?jeX 一般為復(fù)數(shù),故稱 )(?nx 為復(fù)倒譜。把共振峰作為特征參數(shù)用于一個小詞匯量的漢語語音識別系統(tǒng)中,識別正確率達(dá)到了 98%[26]。并結(jié)合理論分析和實(shí)驗(yàn)結(jié)果表明,采用相 頻特性與對數(shù)幅 頻特性同樣能夠提取語音信號共振峰。 LPC 倒譜由于利用線性預(yù)測中聲道系統(tǒng)函數(shù) H(z)的最小相位特性,因此避免了一般同態(tài)處理中對復(fù)對數(shù)的麻煩。設(shè) 0)0(? ?h ,將兩邊同時對 z1求導(dǎo),得 ??????????? ??????????????????1111 )(11lo gnnipiiznhzzaz () 13 得到 ???????????????? piiipiiinnzaziaznhn111111)( () 有 ? ? ??? ??? ????? ???? ? ????????? ? 1 11 111 n iin npi ii ziaznhnza () 令式左右兩邊 z 的各次冪前系數(shù)分別相等得到: ?????????????????????????piiniinpninhaninhpninhanianhah1111)(?)1()(?1)(?)1()(?)1(? () 按照上式可直接從預(yù)測系數(shù) {ai}求得倒譜 )(?nh 。設(shè)與i 對應(yīng)的共振峰頻率為 Fi, 3dB 帶寬為 Bi,則它們存在下面的關(guān)系: iiTF ?? ?2 () iTB re i ?? ? () 所以: TF ii ??2? () TrB ii ?ln?? () 式中, T 是采樣周期。另外也可以采用拋物線內(nèi)插技術(shù),解決頻率分辨率較低的情況下的共振峰頻率值的求取。 圖 42 倒譜法求取的共振峰參數(shù)圖 LPC 法提取共振峰 從線性預(yù)測導(dǎo)出的聲道濾波器是頻譜包絡(luò)估計器的最新形式,線性預(yù)測提供了一個優(yōu)良的聲道模型(條件是語音不含噪聲)。在這樣的語音中,線性預(yù)測包絡(luò)峰值趨向于離開真實(shí)位置,而朝著最接近的諧波峰位移動。為了增加靈活性會給預(yù)測器增加 2~3 個額外的極點(diǎn),有時可利用這些極點(diǎn)代表虛假峰值。 共振峰參數(shù)的研究意義 漢語普通話發(fā)音中情感特征信息的特征參數(shù)主要包括發(fā)音持續(xù)時間、振幅能量、 基音 頻率和共振
點(diǎn)擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1