freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

強(qiáng)背景噪聲環(huán)境下語(yǔ)音增強(qiáng)算法的研究及應(yīng)用畢業(yè)論文(文件)

 

【正文】 的功能框圖 Annex B標(biāo)準(zhǔn)的VAD采用短時(shí)全帶能量、短時(shí)低帶能量、LSF系數(shù)和短時(shí)過(guò)零率4種特征參數(shù)進(jìn)行語(yǔ)音激活檢測(cè)的判決。本章剩余章節(jié)按照如下方式組織:;(Uniformly Most Powerful)檢驗(yàn)的語(yǔ)音激活檢測(cè)算法;(Dual Tone Multiple Frequency)信號(hào)的生成與檢測(cè);最后是本章小結(jié)。第4章 語(yǔ)音激活檢測(cè)算法研究第4章 語(yǔ)音激活檢測(cè)算法研究 本章引論人們?cè)谡f(shuō)話過(guò)程中,不可避免地存在很多間歇和停頓,因此語(yǔ)音是不連續(xù)的媒介。歸一化均方誤差NMSE定義如下: ( 326 )表 本文快速估計(jì)算法和MS算法的NMSE白噪聲babble噪聲白噪聲~babble噪聲SNR(dB)MS算法本文算法MS算法本文算法MS算法本文算法50515~5,在各種噪聲干擾環(huán)境下,本文算法的歸一化均方誤差均小于MS算法,尤其在輸入信噪比為5dB情況下,NMSE下降較大,客觀測(cè)試再一次證明了本文快速估計(jì)算法在低信噪比和非平穩(wěn)噪聲環(huán)境下的優(yōu)越性。 白噪聲干擾下(INSNR=5dB)本文算法和MS算法性能比較 babble噪聲干擾下(INSNR=5dB)本文算法和MS算法性能比較,輸入信噪比由15dB迅速下降為5dB時(shí),本文快速估計(jì)算法和MS算法性能比較。采樣頻率,算法參數(shù)如下選?。簬L(zhǎng),DFT長(zhǎng)度。把代入式( 320 ) 計(jì)算新的時(shí)頻變化因子。當(dāng)語(yǔ)音不存在時(shí),先驗(yàn)信噪比為0。當(dāng)噪聲功率突然增大時(shí),噪聲幀的功率譜必然會(huì)大于功率譜最小值,這樣根據(jù)式(318)得到的關(guān)于語(yǔ)音存在概率的判定勢(shì)必會(huì)有較大誤差,這部分功率比較大的噪聲很容易誤判為語(yǔ)音。對(duì)以上結(jié)果平滑,得到語(yǔ)音存在概率的粗略值: ( 319 )其中,為平滑系數(shù)。當(dāng)語(yǔ)音不存在時(shí),帶噪語(yǔ)音功率譜應(yīng)等于或接近于式(317)所得的功率譜最小值。 不依賴窗長(zhǎng)的最小值搜索,采用固定窗長(zhǎng)幀的最小值搜索算法,在噪聲功率突然增大時(shí), 以上。由長(zhǎng)時(shí)信噪比計(jì)算得到: ( 316 )其中,為幀長(zhǎng)。在噪聲幀時(shí),考慮輸入帶噪語(yǔ)音功率譜的一階平滑: ( 39 )由于此時(shí)輸入語(yǔ)音為純?cè)肼?,?yīng)該接近于真實(shí)的噪聲功率譜,為了得到噪聲功率譜的最優(yōu)估計(jì),目標(biāo)是使得下式的估計(jì)誤差最?。? ( 310 )由于,將式( 39 )代入式( 310 )式,可以得到: ( 311 )令式(311)一階偏導(dǎo)等于0,可以得到最優(yōu)的平滑系數(shù)如下: ( 312 )由于當(dāng)前幀實(shí)際的噪聲功率譜是無(wú)法獲得的,而噪聲功率譜的估計(jì)值還未求得,故使用上一幀估計(jì)的噪聲功率譜來(lái)近似??梢钥闯?,(60幀)以上的延時(shí),而且存在著對(duì)噪聲過(guò)估計(jì)的情況,容易造成對(duì)微弱語(yǔ)音信號(hào)的抑制??梢钥闯?,對(duì)于平穩(wěn)白噪聲,MS方法得到了平滑準(zhǔn)確的噪聲估計(jì)。 最小統(tǒng)計(jì)(MS)算法測(cè)試結(jié)果將標(biāo)準(zhǔn)語(yǔ)音庫(kù)的語(yǔ)音材料與NOISEX92噪聲庫(kù)的噪聲材料根據(jù)SNR合成作為測(cè)試材料。越小,噪聲變化可能越大。為減少延時(shí),將長(zhǎng)窗分成個(gè)子窗,每個(gè)子窗長(zhǎng)為。代入式(34)即得。下面簡(jiǎn)要介紹方法。 基于最小統(tǒng)計(jì)(Minimum Statistics)的噪聲統(tǒng)計(jì)特性估計(jì)針對(duì)上述簡(jiǎn)單的直接噪聲統(tǒng)計(jì)特性估計(jì)的缺點(diǎn),人們陸續(xù)提出了一些改進(jìn)形式的直接噪聲統(tǒng)計(jì)特性估計(jì)方法。 簡(jiǎn)單的直接噪聲統(tǒng)計(jì)特性估計(jì)簡(jiǎn)單的直接噪聲統(tǒng)計(jì)特性估計(jì)方法如下: ( 32 )其在形式上與基于語(yǔ)音激活檢測(cè)的噪聲統(tǒng)計(jì)特性估計(jì)方法在噪聲幀的處理相同,只是通常設(shè)置為一個(gè)接近1的數(shù)值,并且在語(yǔ)音增強(qiáng)的全過(guò)程進(jìn)行更新。而且,如果在語(yǔ)音幀的噪聲特性改變較大,那么這種影響勢(shì)必更加嚴(yán)重。當(dāng)語(yǔ)音誤判為噪聲時(shí),必然使得噪聲統(tǒng)計(jì)特性的估計(jì)失真,進(jìn)而在語(yǔ)音增強(qiáng)處理中造成對(duì)語(yǔ)音的損傷,在低信噪比時(shí),甚至?xí)霈F(xiàn)切音現(xiàn)象,這將極大地降低增強(qiáng)語(yǔ)音的可懂度。~,的取值越小,越有利于對(duì)噪聲統(tǒng)計(jì)特性變化的跟蹤,但越依賴于語(yǔ)音激活檢測(cè)的準(zhǔn)確率。本章剩余章節(jié)按照如下方式組織:;;;最后是本章小結(jié)。噪聲統(tǒng)計(jì)特性的估計(jì)可以分為兩類方法:第一類方法是基于語(yǔ)音激活檢測(cè)的方法,即通過(guò)語(yǔ)音激活檢測(cè)判斷當(dāng)前幀是有語(yǔ)音還是無(wú)語(yǔ)音,在檢測(cè)為無(wú)語(yǔ)音時(shí)進(jìn)行噪聲統(tǒng)計(jì)特性的估計(jì)與更新,而在檢測(cè)為有語(yǔ)音時(shí),噪聲的統(tǒng)計(jì)特性用最近無(wú)語(yǔ)音時(shí)估計(jì)的噪聲統(tǒng)計(jì)特性代替。 本章小結(jié)本章對(duì)語(yǔ)音增強(qiáng)的相關(guān)算法做了全面論述,尤其對(duì)基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法做了詳細(xì)分析,指出了各種算法的優(yōu)缺點(diǎn)。而在先驗(yàn)信噪比和后驗(yàn)信噪比的計(jì)算中:為當(dāng)前幀的帶噪語(yǔ)音功率譜,是已知量;和為純凈語(yǔ)音短時(shí)功率譜和背景噪聲短時(shí)功率譜,是未知的,其估計(jì)的準(zhǔn)確度直接影響算法的增強(qiáng)效果。此時(shí),合流超幾何函數(shù)可以近似為: ( 236 )代入式(235),得到 ( 237 )與式(226)中維納濾波法增益式比較,可以看出此時(shí)與維納濾波法相同。式(231),式(232)代入式(230)中,可得: ( 233 )其中,;表示伽馬函數(shù),特別地。這兩種估計(jì)準(zhǔn)則都存在一定的缺陷:最大似然準(zhǔn)則完全放棄了對(duì)語(yǔ)音頻譜的分布假設(shè);維納濾波法將最小均方誤差準(zhǔn)則應(yīng)用于時(shí)域波形估計(jì),但對(duì)人耳來(lái)說(shuō),頻譜分量的幅度才是最重要的。然而實(shí)際語(yǔ)音只是短時(shí)平穩(wěn),功率譜密度也無(wú)法得到,因此增益改寫(xiě)成為: ( 224 )若定義先驗(yàn)信噪比 ( 225 )則式(224)改寫(xiě)為 ( 226 )與譜減法類似,維納濾波法也有如下推廣的式子 ( 227 )通過(guò)調(diào)整和,可以得到多種變形形式。當(dāng)然,此時(shí)引起的失真也可能會(huì)增大。噪聲估計(jì)值乘以是出于這樣的考慮:一般的譜減法中,是以無(wú)聲期間統(tǒng)計(jì)平均的噪聲方差代替當(dāng)前分析幀各頻率點(diǎn)的噪聲頻譜分量。如果不給定的分布,則此時(shí)的最大似然估計(jì)式可以用如下方法求得:由于 ( 216 )通過(guò)積分消去后,有 ( 217 )其中,為第0階修正貝塞爾函數(shù),令 ( 218 )則解方程后就可以得到的估計(jì)式。信噪比高時(shí),含有語(yǔ)音的可能性大,衰減小。 一般形式的譜相減法的結(jié)構(gòu)框圖FFT變換后有 ( 25 )由此可得: ( 26 )由于與相互獨(dú)立,而近似滿足零均值的高斯分布,所以: ( 27 )對(duì)于一個(gè)分析幀內(nèi)的短時(shí)平穩(wěn)過(guò)程,則有: ( 28 )其中為無(wú)語(yǔ)音時(shí)的統(tǒng)計(jì)平均值,由此可得原始語(yǔ)音的估計(jì)值: ( 29 )其中為增強(qiáng)后語(yǔ)音信號(hào)譜幅度。由于人耳對(duì)頻譜分量的相位不敏感,所以只需估計(jì)頻譜分量的幅度,然后借用帶噪語(yǔ)音的相位,進(jìn)行反傅里葉變換后就可得到增強(qiáng)的語(yǔ)音。相應(yīng)的頻域表示為 ( 24 )其中,分別為,和的傅里葉變換系數(shù)。近年來(lái),人們正在探索將神經(jīng)網(wǎng)絡(luò)、隱馬爾可夫模型、人耳聽(tīng)覺(jué)掩蔽效應(yīng)以及多分辨率分析等理論用于語(yǔ)音增強(qiáng)算法。此類算法運(yùn)算量相對(duì)較小,適用信噪比范圍比較大,并且易于實(shí)時(shí)處理,因而得到廣泛應(yīng)用。 基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法如前所述,語(yǔ)音是非平穩(wěn)隨機(jī)過(guò)程,但在10 ~ 30msec的分析幀內(nèi)可以近似為平穩(wěn)的隨機(jī)過(guò)程。 語(yǔ)音的全極點(diǎn)生成模型Lim和Oppenheim[8]采用了MAP準(zhǔn)則來(lái)估計(jì)聲道的全極點(diǎn)參數(shù)。但若考慮到鼻腔的共鳴作用,采用零極點(diǎn)模型更為合適。同時(shí)對(duì)兩個(gè)語(yǔ)音進(jìn)行梳狀濾波的主要問(wèn)題是:存在另一個(gè)人說(shuō)話干擾時(shí),如何跟蹤并準(zhǔn)確估計(jì)出講話者的基音。與梳狀濾波器的帶寬成反比。當(dāng)延時(shí)與周期一致時(shí),這個(gè)平均過(guò)程將使周期性分量得到加強(qiáng),而會(huì)使其他非周期性分量或與語(yǔ)音信號(hào)周期不同的其他周期性分量受到抑制。噪聲對(duì)消法的一個(gè)主要缺點(diǎn)是增強(qiáng)后的語(yǔ)音會(huì)有“音樂(lè)噪聲”,這種噪聲是頻譜相減的遺留產(chǎn)物,由于具有一定的節(jié)奏性起伏,聽(tīng)上去類似音樂(lè)聲。因而,采集到的噪聲必須經(jīng)過(guò)自適應(yīng)濾波,以得到盡可能接近于帶噪語(yǔ)音中的噪聲。 自適應(yīng)噪聲對(duì)消法[19][20]噪聲對(duì)消的基本原理是從帶噪語(yǔ)音中減去噪聲,問(wèn)題是如何得到噪聲的復(fù)制品。本章剩余章節(jié)將按照如下方式組織:;;;最后是本章小結(jié)。但是,由于噪聲干擾的隨機(jī)性,從帶噪語(yǔ)音中提取完全純凈的原始語(yǔ)音幾乎是不可能的。 本章小結(jié)本章首先介紹了語(yǔ)音增強(qiáng)在語(yǔ)音處理系統(tǒng)中的作用,指出了選題背景和選題意義,并給出了加性噪聲情況下的帶噪語(yǔ)音模型,闡述了與語(yǔ)音增強(qiáng)密切相關(guān)的語(yǔ)音和噪聲的主要特性、人耳的感知特性以及背景噪聲對(duì)語(yǔ)音的影響。針對(duì)目前流行的語(yǔ)音增強(qiáng)算法在低輸入信噪比(0dB以下)和非平穩(wěn)噪聲干擾環(huán)境下增強(qiáng)效果有限的問(wèn)題,論文借鑒國(guó)內(nèi)外提出的相關(guān)技術(shù),通過(guò)對(duì)噪聲統(tǒng)計(jì)特性估計(jì)、語(yǔ)音激活檢測(cè)、先驗(yàn)信噪比的估計(jì)、增益函數(shù)修正這幾個(gè)方面進(jìn)行改進(jìn),提高了短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法性能,拓寬了語(yǔ)音增強(qiáng)的應(yīng)用范圍。 論文研究工作基于單麥克的語(yǔ)音增強(qiáng)一直是各種語(yǔ)音增強(qiáng)方法中研究的熱點(diǎn),相關(guān)理論也相對(duì)成熟。噪聲對(duì)消法就是以此作為出發(fā)點(diǎn),其最大特點(diǎn)是需要采集背景噪聲作為參考信號(hào),參考信號(hào)準(zhǔn)確與否直接決定著噪聲對(duì)消法的性能。此類算法運(yùn)算量相對(duì)較小,適用信噪比范圍比較大,并且易于實(shí)時(shí)處理,因此得到廣泛應(yīng)用,譜減法、維納濾波法以及MMSE 法等方法都屬于此類。這種算法后來(lái)有很多發(fā)展,如在上述迭代過(guò)程中施加有關(guān)共振峰的約束,使處理后的信號(hào)更具有語(yǔ)音的特點(diǎn);或者把這類方法與隱馬爾可夫方法結(jié)合起來(lái),以更好地描述語(yǔ)音的時(shí)變特性。因此,要結(jié)合語(yǔ)音特性、人耳感知特性及噪聲特性,根據(jù)實(shí)際情況選用合適的語(yǔ)音增強(qiáng)方法。應(yīng)用獨(dú)立元分量分析來(lái)進(jìn)行語(yǔ)音信號(hào)盲分離和增強(qiáng)的方法,以及引入人耳聽(tīng)覺(jué)掩蔽效應(yīng)[17][18]的語(yǔ)音增強(qiáng)方法也是目前研究的熱點(diǎn)。統(tǒng)計(jì)方法中最典型的是隱馬爾可夫模型(HMM一Hiddnen Markov Mdel)方法,它既是語(yǔ)音識(shí)別的主要方法,也可以以概率方式將語(yǔ)音增強(qiáng)問(wèn)題納入其模型框架[13]。1980年,Mcaulay和Malpass[10]提出了軟判決噪聲抑制方法。1978年,Lim和Oppoenheim[8]提出了語(yǔ)音增強(qiáng)的維納濾波算法。不僅如此,強(qiáng)噪聲環(huán)境還對(duì)講話人產(chǎn)生影響,使講話人改變?cè)诎察o環(huán)境或低噪聲環(huán)境中的發(fā)聲方式,從而改變了語(yǔ)音的特征參數(shù),稱為L(zhǎng)ombard效應(yīng),它對(duì)語(yǔ)音識(shí)別系統(tǒng)有很大的影響。掩蔽的程度是聲音強(qiáng)度與頻率的二元函數(shù),對(duì)頻率臨近分量的掩蔽程度大于對(duì)頻差大的分量的掩蔽;5)語(yǔ)音短時(shí)譜中的共振峰對(duì)語(yǔ)音的感知十分重要,特別是第二共振峰比第一共振峰更為重要,因此對(duì)語(yǔ)音信號(hào)進(jìn)行一定程度的高通濾波不會(huì)對(duì)可懂度造成影響;6)人耳在兩人以上的講話環(huán)境中有能力分辨出需要聆聽(tīng)的聲音。目前針對(duì)同聲道語(yǔ)音干擾的增強(qiáng)處理還處于研究中。目前的語(yǔ)音增強(qiáng)主要是針對(duì)這種噪聲的處理。2)脈沖噪聲其表現(xiàn)為時(shí)域波形中出現(xiàn)的窄脈沖,主要源于爆炸、撞擊和放電等。加性噪聲大致上有:周期性噪聲、脈沖噪聲、寬帶噪聲和同聲道其它語(yǔ)音的干擾等。對(duì)于非加性噪聲,有些可以通過(guò)相應(yīng)的變換而轉(zhuǎn)變?yōu)榧有栽肼?。在高斯模型假設(shè)下,傅立葉展開(kāi)系數(shù)被認(rèn)為是獨(dú)立的高斯隨機(jī)變量,均值為0,方差時(shí)變。在語(yǔ)音增強(qiáng)中,對(duì)濁音的增強(qiáng)相對(duì)容易,而對(duì)清音的增強(qiáng)則是難點(diǎn)。2)語(yǔ)音大體上可以分為清音和濁音兩大類。 語(yǔ)音的主要特性語(yǔ)音的主要特性有:1)語(yǔ)音是一個(gè)時(shí)變的、非平穩(wěn)的隨機(jī)過(guò)程。這個(gè)帶噪語(yǔ)音模型將作為本文語(yǔ)音增強(qiáng)分析的基礎(chǔ)。目前流行的語(yǔ)音增強(qiáng)處理方法,雖然能夠在一定程度上去除背景噪聲,提高信噪比,但在低輸入信噪比和非平穩(wěn)噪聲干擾的情況下增強(qiáng)效果有限,殘留噪聲較多,部分弱語(yǔ)音信號(hào)會(huì)被當(dāng)作噪聲而完全抑制,從而造成語(yǔ)音可懂度的下降。但目前的識(shí)別系統(tǒng)大都是在安靜環(huán)境中工作的,在噪聲環(huán)境中尤其是強(qiáng)噪聲環(huán)境,語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率將受到嚴(yán)重影響。再如在軍用車載通信系統(tǒng)中,尤其是坦克車內(nèi)的通信系統(tǒng),所處的噪聲環(huán)境較一般環(huán)境更為惡劣,其噪聲強(qiáng)度可達(dá)到120分貝左右。其中,語(yǔ)音增強(qiáng)是語(yǔ)音數(shù)字信號(hào)處理系統(tǒng)進(jìn)入實(shí)用階段的重要環(huán)節(jié)。應(yīng)用現(xiàn)代化手段研究語(yǔ)音處理技術(shù),能更有效地產(chǎn)生、傳輸、存儲(chǔ)和獲取語(yǔ)音信息,這對(duì)促進(jìn)社會(huì)的信息化發(fā)展具有十分重要的意義。語(yǔ)言是人類交流的重要手段,它自然方便,準(zhǔn)確高效。同時(shí),利用軟判決信息,即有關(guān)語(yǔ)音存在的概率信息,修正增益函數(shù)表達(dá)式中的先驗(yàn)/后驗(yàn)信噪比,有效地消除了“音樂(lè)”噪聲,使去噪后的語(yǔ)音更加平滑、自然、易于接受。首先, 提出了一種快速估計(jì)噪聲統(tǒng)計(jì)特性的算法,減小了噪聲估計(jì)的跟蹤延時(shí),在一定程度上改善了噪聲過(guò)估計(jì)的現(xiàn)象,因而能夠在低輸入信噪比以及非平穩(wěn)噪聲干擾環(huán)境下快速準(zhǔn)確地跟蹤噪聲特性。語(yǔ)音增強(qiáng)作為一種預(yù)處理手段,不失為解決噪聲污染的一種有效途徑。密級(jí):內(nèi)部★ 2 年強(qiáng)背景噪聲環(huán)境下語(yǔ)音增強(qiáng)算法的研究及應(yīng)用Research and Application of Speech Enhancement in Strong Noise Environment(申請(qǐng)清華大學(xué)工學(xué)碩士學(xué)位論文)培 養(yǎng) 單 位:學(xué) 科:研 究 生:指 導(dǎo) 教 師:關(guān)于學(xué)位論文使用授權(quán)的說(shuō)明本人完全了解清華大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:清華大學(xué)擁有在著作權(quán)法規(guī)定范圍內(nèi)學(xué)位論文的使用權(quán),其中包括:(1)已獲學(xué)位的研究生必須按學(xué)校規(guī)定提交學(xué)位論文,學(xué)校可以采用影印、縮印或其他復(fù)制手段保存研究生上交的學(xué)位論文;(2)為教學(xué)和科研目的,學(xué)??梢詫⒐_(kāi)的學(xué)位論文作為資料在圖書(shū)館、資料室等場(chǎng)所供校內(nèi)師生閱讀,或在校園網(wǎng)上供校內(nèi)師生瀏覽部分內(nèi)容;(3)根據(jù)《中華人民共和國(guó)學(xué)位條例暫行實(shí)施辦法》,向國(guó)家圖書(shū)館報(bào)送可以公開(kāi)的學(xué)位論文。同時(shí),噪聲的存在也使低速率語(yǔ)音編碼以及語(yǔ)音識(shí)別等語(yǔ)音處理系統(tǒng)的性能下降。根據(jù)對(duì)短時(shí)譜幅度估計(jì)算法進(jìn)行分析,指出了影響其性能的關(guān)鍵技術(shù):噪聲統(tǒng)計(jì)
點(diǎn)擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1