freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

強(qiáng)背景噪聲環(huán)境下語(yǔ)音增強(qiáng)算法的研究及應(yīng)用畢業(yè)論文(編輯修改稿)

2025-07-22 01:36 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 參考信號(hào)盡可能接近帶噪語(yǔ)音中的噪聲分量?;邴溈岁嚨恼Z(yǔ)音增強(qiáng)采用多個(gè)以一定方式排列的采集設(shè)備接收信號(hào)。由于不同的獨(dú)立信號(hào)源與各個(gè)采集設(shè)備之間的距離不同,最后在各個(gè)接受設(shè)備中的合成信號(hào)也會(huì)產(chǎn)生相應(yīng)的差異,再采用獨(dú)立成分分析技術(shù)將各個(gè)獨(dú)立信號(hào)分離出來(lái)。 論文研究工作基于單麥克的語(yǔ)音增強(qiáng)一直是各種語(yǔ)音增強(qiáng)方法中研究的熱點(diǎn),相關(guān)理論也相對(duì)成熟。本課題的應(yīng)用背景,提供的是單麥克,因此本文的研究工作是基于單麥克的語(yǔ)音增強(qiáng)。考慮到具體應(yīng)用的各種要求,主要是研究基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)。論文分析了各種語(yǔ)音增強(qiáng)方法的優(yōu)缺點(diǎn),并根據(jù)課題的需要,利用隨機(jī)信號(hào)處理的方法,研究并實(shí)現(xiàn)了基于MMSE短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法。針對(duì)目前流行的語(yǔ)音增強(qiáng)算法在低輸入信噪比(0dB以下)和非平穩(wěn)噪聲干擾環(huán)境下增強(qiáng)效果有限的問(wèn)題,論文借鑒國(guó)內(nèi)外提出的相關(guān)技術(shù),通過(guò)對(duì)噪聲統(tǒng)計(jì)特性估計(jì)、語(yǔ)音激活檢測(cè)、先驗(yàn)信噪比的估計(jì)、增益函數(shù)修正這幾個(gè)方面進(jìn)行改進(jìn),提高了短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法性能,拓寬了語(yǔ)音增強(qiáng)的應(yīng)用范圍。由于課題需要,論文對(duì)語(yǔ)音增強(qiáng)算法的實(shí)時(shí)應(yīng)用進(jìn)行了適應(yīng)性研究。在選定的DSP芯片處理能力有限的情況下,通過(guò)定點(diǎn)化和手寫(xiě)DSP匯編優(yōu)化程序達(dá)到了使用較少資源實(shí)時(shí)實(shí)現(xiàn)語(yǔ)音增強(qiáng)算法的目的。 論文內(nèi)容組織全文共分七章:第1章是引言;第2章是基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法概述;第3章噪聲統(tǒng)計(jì)特性估計(jì)的研究;第4章是語(yǔ)音激活檢測(cè)算法研究;第5章是語(yǔ)音增強(qiáng)算法的研究與實(shí)現(xiàn);第6章是基于TMS320C55x DSP硬件平臺(tái)的實(shí)時(shí)實(shí)現(xiàn);第7章是結(jié)論。 本章小結(jié)本章首先介紹了語(yǔ)音增強(qiáng)在語(yǔ)音處理系統(tǒng)中的作用,指出了選題背景和選題意義,并給出了加性噪聲情況下的帶噪語(yǔ)音模型,闡述了與語(yǔ)音增強(qiáng)密切相關(guān)的語(yǔ)音和噪聲的主要特性、人耳的感知特性以及背景噪聲對(duì)語(yǔ)音的影響。然后,簡(jiǎn)要概述了語(yǔ)音增強(qiáng)的發(fā)展和分類,并根據(jù)課題要求提出了本文的主要研究工作。最后,說(shuō)明了論文的結(jié)構(gòu)安排。87第2章 基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法概述第2章 基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法概述 本章引論語(yǔ)音增強(qiáng)的目的是針對(duì)帶噪語(yǔ)音盡可能地消除噪聲的影響,提取出純凈的原始語(yǔ)音。但是,由于噪聲干擾的隨機(jī)性,從帶噪語(yǔ)音中提取完全純凈的原始語(yǔ)音幾乎是不可能的。通常在對(duì)低信噪比的帶噪語(yǔ)音進(jìn)行增強(qiáng)時(shí),一些算法可以顯著地降低背景噪聲,改進(jìn)語(yǔ)音質(zhì)量,但是對(duì)語(yǔ)音也造成了很大的損傷。因此在研究過(guò)程中,通常要根據(jù)不同的要求,選用不同算法,設(shè)置不同的參數(shù),這就要熟悉語(yǔ)音增強(qiáng)的各種算法。本章就是對(duì)語(yǔ)音增強(qiáng)算法的概述。本章剩余章節(jié)將按照如下方式組織:;;;最后是本章小結(jié)。 語(yǔ)音增強(qiáng)算法概述由于噪聲的特性各異,語(yǔ)音增強(qiáng)的方法也各不相同。40多年來(lái),人們針對(duì)加性寬帶噪聲研究了各種語(yǔ)音增強(qiáng)算法。盡管語(yǔ)音增強(qiáng)在理論上并未完全解決,還待發(fā)展,但是某些增強(qiáng)算法已證明是有效果的,如噪聲對(duì)消法、諧波增強(qiáng)法、基于參數(shù)估計(jì)的語(yǔ)音再合成法和基于語(yǔ)音短時(shí)譜估計(jì)的增強(qiáng)算法等等。 自適應(yīng)噪聲對(duì)消法[19][20]噪聲對(duì)消的基本原理是從帶噪語(yǔ)音中減去噪聲,問(wèn)題是如何得到噪聲的復(fù)制品。通常采用兩個(gè)(或多個(gè))話筒進(jìn)行處理,一個(gè)(或多個(gè))采集帶噪語(yǔ)音,另一個(gè)(或多個(gè))采集噪聲。 給出了雙話筒采集的噪聲對(duì)消法原理框圖。采用噪聲對(duì)消法時(shí),兩個(gè)話筒之間必須要有相當(dāng)?shù)拈g隔度,但采集到的兩路信號(hào)之間不可避免地會(huì)有時(shí)間差,因此實(shí)時(shí)采集到的兩路信號(hào)中所包含的噪聲段是不同的,而且回聲以及其它可變衰減特性也將影響所采集噪聲的“純凈”性。因而,采集到的噪聲必須經(jīng)過(guò)自適應(yīng)濾波,以得到盡可能接近于帶噪語(yǔ)音中的噪聲。自適應(yīng)濾波器通常采用FIR 濾波器,其系數(shù)可以采用最小均方(LMS)法進(jìn)行估計(jì)。 雙話筒采集的噪聲對(duì)消法原理框圖大量實(shí)驗(yàn)表明,在強(qiáng)背景噪聲下,使用自適應(yīng)噪聲對(duì)消法進(jìn)行語(yǔ)音增強(qiáng)可以得到很好的消噪效果。如果采集的噪聲足夠充分,也可以直接在時(shí)域上相減。噪聲對(duì)消法的一個(gè)主要缺點(diǎn)是增強(qiáng)后的語(yǔ)音會(huì)有“音樂(lè)噪聲”,這種噪聲是頻譜相減的遺留產(chǎn)物,由于具有一定的節(jié)奏性起伏,聽(tīng)上去類似音樂(lè)聲。 諧波增強(qiáng)法[19][20]語(yǔ)音信號(hào)的濁音段有明顯的周期性,利用這一特點(diǎn),可以采用自適應(yīng)梳妝濾波器來(lái)提取語(yǔ)音分量,抑制噪聲。梳狀濾波器可以在時(shí)域?qū)崿F(xiàn),表達(dá)式為: ( 21 )這里,為基頻周期,為常數(shù)(通常不大);是濾波器輸入信號(hào)序列;為系數(shù),隨信號(hào)周期而變化。輸出信號(hào)是輸入信號(hào)的延時(shí)加權(quán)和的平均值。當(dāng)延時(shí)與周期一致時(shí),這個(gè)平均過(guò)程將使周期性分量得到加強(qiáng),而會(huì)使其他非周期性分量或與語(yǔ)音信號(hào)周期不同的其他周期性分量受到抑制。顯然,上述方法的關(guān)鍵是要準(zhǔn)確估計(jì)出語(yǔ)音信號(hào)的基音周期,這在強(qiáng)背景噪聲干擾下有一定的困難。在基音發(fā)生變化的過(guò)渡段,這種方法會(huì)受到嚴(yán)重影響。選擇可以減小這種影響,但增強(qiáng)效果下降。與梳狀濾波器的帶寬成反比。梳狀濾波器也可以在頻域?qū)崿F(xiàn)。對(duì)語(yǔ)音進(jìn)行傅里葉變換后可以鑒別出需要提取的各次諧波分量,然后經(jīng)傅里葉反變換恢復(fù)為時(shí)域信號(hào)。梳狀濾波不但可增強(qiáng)語(yǔ)音信號(hào),也可以用于抑制各種噪聲干擾,包括消除同聲道的其他語(yǔ)音的干擾。同時(shí)對(duì)兩個(gè)語(yǔ)音進(jìn)行梳狀濾波的主要問(wèn)題是:存在另一個(gè)人說(shuō)話干擾時(shí),如何跟蹤并準(zhǔn)確估計(jì)出講話者的基音。 基于語(yǔ)音生成模型的語(yǔ)音增強(qiáng)算法語(yǔ)音的發(fā)聲過(guò)程可以模型化為激勵(lì)源作用于一個(gè)線性時(shí)變?yōu)V波器,激勵(lì)源可以分濁音和清音兩類,濁音的激勵(lì)源為周期與基音相同的周期性脈沖串;而對(duì)于清音,激勵(lì)源為高斯白噪聲。時(shí)變?yōu)V波器則是聲道的模型。通常認(rèn)為聲道模型是一個(gè)全極點(diǎn)濾波器,濾波器參數(shù)可以通過(guò)線性預(yù)測(cè)分析得到。但若考慮到鼻腔的共鳴作用,采用零極點(diǎn)模型更為合適。顯然,如果能夠知道激勵(lì)參數(shù)和聲道濾波器的參數(shù),就能利用語(yǔ)音生成模型合成得到“純凈”的語(yǔ)音。這種增強(qiáng)方法稱為分析—合成法,關(guān)鍵在于如何從帶噪語(yǔ)音中準(zhǔn)確地估計(jì)語(yǔ)音模型的參數(shù),即激勵(lì)參數(shù)和聲道參數(shù)。另一種方法則是鑒于激勵(lì)參數(shù)難以準(zhǔn)確估計(jì),而只利用聲道參數(shù)構(gòu)造濾波器進(jìn)行濾波處理。 語(yǔ)音的全極點(diǎn)生成模型Lim和Oppenheim[8]采用了MAP準(zhǔn)則來(lái)估計(jì)聲道的全極點(diǎn)參數(shù)。對(duì)于語(yǔ)音平穩(wěn)隨機(jī)過(guò)程而言,相當(dāng)于乘了一個(gè)零相位的維納濾波器。主觀測(cè)量表明它可以減少可感知的噪聲從而改善語(yǔ)音的質(zhì)量,但對(duì)語(yǔ)音也造成了一定的損傷,原因是算法中的迭代缺乏明顯的收斂準(zhǔn)則,且隨著迭代次數(shù)的增加共振峰帶寬變小。Hansen和Clements[21]在上述迭代過(guò)程中加入了頻譜限制條件,使極點(diǎn)不太靠近單位圓,以防止共振峰帶寬過(guò)窄,但引起了共振峰位置的較大抖動(dòng)。 基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法如前所述,語(yǔ)音是非平穩(wěn)隨機(jī)過(guò)程,但在10 ~ 30msec的分析幀內(nèi)可以近似為平穩(wěn)的隨機(jī)過(guò)程。如果能從帶噪語(yǔ)音的短時(shí)譜中估計(jì)出“純凈”語(yǔ)音的短時(shí)譜,即可達(dá)到增強(qiáng)的目的。由于噪聲也是隨機(jī)過(guò)程,因此這種估計(jì)只能建立在統(tǒng)計(jì)模型基礎(chǔ)上。人耳感知對(duì)語(yǔ)音頻譜分量的相位不敏感,因此目前的增強(qiáng)算法主要針對(duì)短時(shí)譜幅度進(jìn)行估計(jì)。此類算法運(yùn)算量相對(duì)較小,適用信噪比范圍比較大,并且易于實(shí)時(shí)處理,因而得到廣泛應(yīng)用。譜相減法、維納濾波法以及MMSE法是短時(shí)譜估計(jì)中的三種行之有效的增強(qiáng)算法,下節(jié)將詳細(xì)介紹這三種算法的原理。 其他幾種形式的語(yǔ)音增強(qiáng)算法除上面介紹的幾種語(yǔ)音增強(qiáng)算法外,Ephraim和Van Trees[22]提出了一種基于信號(hào)子空間的語(yǔ)音增強(qiáng)算法,其基本思想是把帶噪語(yǔ)音信號(hào)的矢量空間通過(guò)KLT分解為噪聲子空間以及信號(hào)加噪聲的子空間,去除噪聲子空間后,在信號(hào)加噪聲子空間中濾波估計(jì)出語(yǔ)音信號(hào)。還有基于小波分析[14]的方法,其基本思想是小波變化把信號(hào)在多個(gè)尺度上進(jìn)行了子波分解,而各尺度上分解所得的子波變換系數(shù)代表原信號(hào)在不同分辨率上的信息,利用信號(hào)和隨機(jī)噪聲在不同尺度的特性關(guān)系進(jìn)行去噪處理。近年來(lái),人們正在探索將神經(jīng)網(wǎng)絡(luò)、隱馬爾可夫模型、人耳聽(tīng)覺(jué)掩蔽效應(yīng)以及多分辨率分析等理論用于語(yǔ)音增強(qiáng)算法。 基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法設(shè)帶噪語(yǔ)音的時(shí)域表示: ( 22 )其中,為純凈語(yǔ)音,為加性噪聲,是采集到的帶噪語(yǔ)音。通常,假定和統(tǒng)計(jì)獨(dú)立。一般分析時(shí)進(jìn)行分幀加窗處理,一幀的帶噪語(yǔ)音信號(hào)表示為 ( 23 )其中,為幀長(zhǎng)。相應(yīng)的頻域表示為 ( 24 )其中,,分別為,和的傅里葉變換系數(shù)。為了分析簡(jiǎn)單,假設(shè)各個(gè)傅里葉系數(shù)(即各個(gè)頻率分量)之間是互不相關(guān)的。由于和統(tǒng)計(jì)獨(dú)立,所以和互相獨(dú)立,并假定服從零均值高斯分布,方差可以通過(guò)無(wú)語(yǔ)音時(shí)對(duì)噪聲的分析獲得。語(yǔ)音增強(qiáng)的任務(wù)就是利用已知的噪聲功率譜信息,從中估計(jì)。由于人耳對(duì)頻譜分量的相位不敏感,所以只需估計(jì)頻譜分量的幅度,然后借用帶噪語(yǔ)音的相位,進(jìn)行反傅里葉變換后就可得到增強(qiáng)的語(yǔ)音。圖中,為的估值。下面將分別介紹短時(shí)譜估計(jì)的三種方法:譜減法、維納濾波法、MMSE估計(jì)法。 基于短時(shí)譜估計(jì)的語(yǔ)音增強(qiáng)算法原理框圖 譜減法的一般形式一般形式的譜相減法[9]即在頻域?qū)г胝Z(yǔ)音的功率譜減去噪聲的功率譜得到純凈語(yǔ)音的功率譜估計(jì),開(kāi)方之后得到語(yǔ)音譜幅度估計(jì),將其相位恢復(fù)之后采用逆-傅立葉變換恢復(fù)時(shí)域信號(hào)。 一般形式的譜相減法的結(jié)構(gòu)框圖FFT變換后有 ( 25 )由此可得: ( 26 )由于與相互獨(dú)立,而近似滿足零均值的高斯分布,所以: ( 27 )對(duì)于一個(gè)分析幀內(nèi)的短時(shí)平穩(wěn)過(guò)程,則有: ( 28 )其中為無(wú)語(yǔ)音時(shí)的統(tǒng)計(jì)平均值,由此可得原始語(yǔ)音的估計(jì)值: ( 29 )其中為增強(qiáng)后語(yǔ)音信號(hào)譜幅度。傅里葉反變換后經(jīng)過(guò)相位插入,即可得時(shí)域的增強(qiáng)后語(yǔ)音信號(hào)。定義增益函數(shù): ( 210 )及后驗(yàn)信噪比: ( 211 )式( 29 )改寫(xiě)為: ( 212 )于是,進(jìn)一步排除異常情況令。從式( 212 )中可以清楚地看出譜減法的物理意義:它相當(dāng)于對(duì)帶噪語(yǔ)音的每一個(gè)頻譜分量乘以一個(gè)系數(shù)。信噪比高時(shí),含有語(yǔ)音的可能性大,衰減小。反之,則認(rèn)為含有語(yǔ)音的可能性小,衰減大。注意到,如果假設(shè)具有高斯分布,則譜減法相當(dāng)于對(duì)作最大似然估計(jì)。因?yàn)榇藭r(shí)有 ( 213 )令 ( 214 )則有 ( 215 )這一結(jié)果與式 ( 29 )相同。如果不給定的分布,則此時(shí)的最大似然估計(jì)式可以用如下方法求得:由于 ( 216 )通過(guò)積分消去后,有 ( 217 )其中,為第0階修正貝塞爾函數(shù),令 ( 218 )則解方程后就可以得到的估計(jì)式。由于直接求解有一定困難,為此需要采取一定的簡(jiǎn)化措施。因?yàn)楫?dāng)時(shí),有,所以在較高信噪比條件下,解方程后得到 ( 219 ) 譜減法的改進(jìn)形式在實(shí)際應(yīng)用中,更多地采用譜相減法的改進(jìn)形式: ( 220 )所以, ( 221 )這種改進(jìn)形式與普通譜減法的差別在于引入了和這兩個(gè)參數(shù),為算法提供了很大的靈活性。顯然當(dāng)時(shí),算法退化為一般的譜減法形式。噪聲估計(jì)值乘以是出于這樣的考慮:一般的譜減法中,是以無(wú)聲期間統(tǒng)計(jì)平均的噪聲方差代替當(dāng)前分析幀各頻率點(diǎn)的噪聲頻譜分量。而噪聲頻譜具有高斯分布,即其幅度隨機(jī)變化范圍很寬。因此相減時(shí),若該幀某頻率點(diǎn)噪聲分量較大,就會(huì)有很大一部分殘留,在頻譜上呈現(xiàn)隨機(jī)出現(xiàn)的尖峰,在聽(tīng)覺(jué)上形成有節(jié)奏起伏的類似音樂(lè)的殘留噪聲。為了解決上述問(wèn)題,在語(yǔ)音能量較高的區(qū)域可以使,即有意識(shí)地多減去一些,這樣可以更好地相對(duì)突出語(yǔ)音頻譜。當(dāng)然,此時(shí)引起的失真也可能會(huì)增大。調(diào)節(jié)參數(shù)也可以取得類似的效果。 維納濾波法如果語(yǔ)音是一個(gè)平穩(wěn)過(guò)程,則維納濾波對(duì)應(yīng)著時(shí)域上的最小均方誤差準(zhǔn)則。其頻域表達(dá)式: ( 222 ) ( 223 )其中,分別為語(yǔ)音和噪聲的功率譜密度。然而實(shí)際語(yǔ)音只是短時(shí)平穩(wěn),功率譜密度也無(wú)法得到,因此增益改寫(xiě)成為: ( 224 )若定義先驗(yàn)信噪比 ( 225 )則式(224)改寫(xiě)為 ( 226 )與譜減法類似,維納濾波法也有如下推廣的式子 ( 227 )通過(guò)調(diào)整和,可以得到多種變形形式。維納濾波法最大的優(yōu)點(diǎn)是增強(qiáng)后的殘留噪聲類似白噪聲,而不是有節(jié)奏起伏的音樂(lè)噪聲。事實(shí)上,盡管維納濾波法導(dǎo)出的出發(fā)點(diǎn)不同,但形式上與譜減法差別不大,可以認(rèn)為是統(tǒng)一的。 MMSE估計(jì)法如前所述,譜減法為一種最大似然估計(jì),而維納濾波法則是平穩(wěn)條件下時(shí)域的最小均方誤差準(zhǔn)則意義下的估計(jì)。這兩種估計(jì)準(zhǔn)則都存在一定的缺陷:最大似然準(zhǔn)則完全放棄了對(duì)語(yǔ)音頻譜的分布假設(shè);維納濾波法將最小均方誤差準(zhǔn)則應(yīng)用于時(shí)域波形估計(jì),但對(duì)人耳來(lái)說(shuō),頻譜分量的幅度才是最重要的。而MMSE估計(jì)法就對(duì)應(yīng)頻域上的最小均方誤差準(zhǔn)則。設(shè)帶噪信號(hào)、干擾噪聲和純凈語(yǔ)音的頻譜分量分別用,表示,并假設(shè)語(yǔ)音譜和噪聲譜滿足獨(dú)立的高斯分布。尋找的MMSE估計(jì)為 ( 228 )即 ( 229 )假設(shè)各個(gè)頻譜分量相互獨(dú)立,由貝葉斯準(zhǔn)則得 ( 230 )根據(jù)語(yǔ)音譜和噪聲譜的高斯分布假設(shè),根據(jù)下式確定[12] ( 231 ) ( 232 )其中。式(231),式(232)代入式(230)中,可得: ( 233 )其中,;表示伽馬函數(shù),特別地。為合流超幾何函數(shù),可以用級(jí)數(shù)求和計(jì)算。分別表示0階和1階修正貝塞爾系數(shù),分別表示先驗(yàn)信噪比和后驗(yàn)信噪比。將式(233)寫(xiě)成增益函數(shù)的形式,定義 ( 234 )于是有 ( 235 )當(dāng)先驗(yàn)信噪比很高時(shí),即時(shí),這也意味著。此時(shí),合流超幾何函數(shù)可以近似為: ( 236 )代入式(235),得到 ( 237 )與式(226)中維納濾波法增益式比較,可以看出此時(shí)與維納濾波法相同。 基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法的關(guān)鍵技術(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1