freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

噪聲估計的算法及matlab實現(xiàn)畢業(yè)設(shè)計-在線瀏覽

2024-08-09 04:57本頁面
  

【正文】 效性。然而,語音增強技術(shù)作為一種預(yù)處理技術(shù),是消除這些噪聲干擾的一個最重要的手段,它通過對帶噪語音進行處理來改善語音質(zhì)量,使人們易于接受或提高語音處理系統(tǒng)的性能。在這種情況下,必須建立一個語音增強系統(tǒng),通過對帶噪語音進行處理,以消除背景噪聲,改善語音質(zhì)量,提高語音的清晰度、可懂度和自然度,提高語音處理系統(tǒng)的性能;或者將語音增強作為一種預(yù)處理手段,以提高語音處理處理系統(tǒng)的抗干擾能力。語音增強算法可從信號輸入的通道數(shù)上分為單通道的語音增強算法和多通道的語音增強算法。這種情況下語音和噪聲同時存在一個通道中,語音信息與噪聲信息必須從同一個信號中得出。因此,噪聲估計的準(zhǔn)確性會直接影響最終效果:噪聲估計過高,則微弱的語音將被去掉,增強語音會產(chǎn)生的失真;而估計過低,則會有較多的背景殘留噪聲。噪聲估計還在語音通訊領(lǐng)域非常重要,同時在統(tǒng)計學(xué)、圖像處理、軍事等方面也起著非常重要的作用. 由于噪聲的統(tǒng)計特性比語音的統(tǒng)計特性更平穩(wěn),所以噪聲估計在統(tǒng)計學(xué)中也很有研究意義。 國內(nèi)外研究的現(xiàn)狀有關(guān)抗噪聲技術(shù)的研究,在國內(nèi)外作為非常重要的研究課題,已經(jīng)作了大量的研究工作,取得了豐富的研究成果。傳統(tǒng)的噪聲估計方法是使用語音活動性監(jiān)測 ( VAD:Voice Active Detection)判別語音是否出現(xiàn),并分離出無聲段,此時無聲段主要表現(xiàn)為噪聲特性,然后在無聲區(qū)通過某種統(tǒng)計方法,獲得背景噪聲特性的近似估計,對噪聲譜進行更新。因此,為了實現(xiàn)精確的噪聲估計,就要對噪聲譜進行實時的估計。 的滑動窗口內(nèi)尋找每一頻率帶內(nèi)的頻譜最小值,經(jīng)過補償后和帶噪語音的功率譜進行比較。同時,為了能更快的跟蹤并更新局部最小值和頻譜最小值,把滑動窗口分為子窗口,在每個子窗口內(nèi)更新噪聲的估計譜,提高了精確度[4]。然后找出粗略噪聲中的在一定時間窗內(nèi)的最小值,對這個最小值進行一些偏差修正,即得到所要估計的噪聲的方差。但這種算法容易將語音電平的增長當(dāng)作噪聲電平的增長。2002年Cohen 和Berdugo提出了一種基于最小值控制遞歸平均法的噪聲估計算法,把最小追蹤法的魯棒性與遞歸平均方法的簡單性結(jié)合到一起,該算法能夠快速地追蹤突變的噪聲功率譜。具有能夠快速跟蹤噪聲譜的突變的能力。雖然比起Martin的最小值統(tǒng)計跟蹤算法效果要好的多,但無法完全避免在噪聲上升區(qū)域的噪聲欠估計及持續(xù)強語音后面區(qū)域出現(xiàn)的噪聲過估計的缺陷。2004年Rangachari 和Loizou提出了一種快速估計方法,不僅使得帶噪語音子帶中語音出現(xiàn)概率計算更準(zhǔn)確,而且噪聲譜的更新在連續(xù)時間內(nèi)不依賴固定時間的窗長,但是在語音或噪聲能量過高時噪聲的估計就會慢下來, 時,就會削弱一些語音能量。2009年余力, 陳穎琪提出了一種基于DCT變換的自適應(yīng)噪聲估計算法,采用DCT系數(shù)作為塊均勻度的度量,較好地適應(yīng)了高低噪聲的情況,算法復(fù)雜度不大,能適用于各種實時圖像視頻處理系統(tǒng)。此外,還能適應(yīng)不同質(zhì)量的圖像。但是,這些算法在各個頻帶進行噪聲估計,算法復(fù)雜度高,噪聲估計方差大。而且,在巴克域進行噪聲估計更符合人耳聽覺特性,增強語音具有更好的質(zhì)量。本文重點就是在前人研究的基礎(chǔ)上,跟蹤國內(nèi)外最新資料,研究了一種新的噪聲估計算法,使延遲時間能夠縮短,最好沒有延遲。噪聲估計算法研究的目的和意義及國內(nèi)外研究的現(xiàn)狀。Martin的最小統(tǒng)計量的估計算法, Cohen和Berdugo提出的基于最小統(tǒng)計量控制遞歸平均算法,通過比較最終提出改進的最小統(tǒng)計量控制遞歸平均算法,仿真結(jié)果表明,這種方法在非平穩(wěn)噪聲條件下,也具有較好的噪聲跟蹤能力和較小的噪聲估計誤差,可以有效地提高語音增強系統(tǒng)的性能。通過基于語音活動性檢測的噪聲估計算法,對能量和最小過零率的語音端點進行檢測,仿真結(jié)果得出,我們需要魯棒性更強的算法,即使在有語音存在的情況下,也能夠?qū)崿F(xiàn)噪聲的連續(xù)估計和不斷更新。首先研究了最小值統(tǒng)計跟蹤法通過仿真得出此算法不能快速跟蹤真實噪聲的變化,并研究了基于統(tǒng)計信息的非平穩(wěn)噪聲自適應(yīng)算法,但它的計算很復(fù)雜。 第五章 總結(jié)全文,并分析論文存在的不足及今后的的發(fā)展方向。2 幾種經(jīng)典的噪聲估計的算法 幾種噪聲估計算法的優(yōu)點(1) Martin提出的基于最小統(tǒng)計量的噪聲估計算法,是先用一個最優(yōu)平滑濾波對帶噪語音的功率譜濾波,得到一個噪聲的粗略估計。而且,為了能更快的跟蹤并更新局部最小值和頻譜最小值,把滑動窗口分為子窗口,在每個子窗口內(nèi)更新噪聲的估計譜,提高了精確度。采用遞歸平均進行噪聲估計,平滑參數(shù)受語音存在概率控制,并由最小統(tǒng)計量控制語音存在概率。它不需要語音的有聲/無聲檢測,噪聲譜在所有的幀中連續(xù)的更新,并不關(guān)心本幀是語音幀還是噪聲幀,對每一幀都重新計算其噪聲功率譜。 噪聲估計算法Martin提出的基于最小統(tǒng)計量的噪聲估計算法的基本思路是先用一個最優(yōu)平滑濾波對帶噪語音的功率譜濾波,得到一個噪聲的粗略估計。這種方法是在噪聲估計窗內(nèi)搜索最小值作為噪聲估計量,而且此算法對窗長的選擇比較敏感,當(dāng)窗長比較長時,對非平穩(wěn)噪聲的跟蹤速度慢,而且容易出現(xiàn)噪聲低估;當(dāng)窗長比較短時,比較容易出現(xiàn)將語音的低能量成分當(dāng)作噪聲。仿真結(jié)果表明:最小值統(tǒng)計跟蹤法對平穩(wěn)噪聲噪聲的估計是比較準(zhǔn)確的,但是對非平穩(wěn)噪聲就表現(xiàn)的不好了。這種算法不直接依賴于最小統(tǒng)計量,具有較好的魯棒性,它是使用一個平滑參數(shù)對功率譜的過去值進行平均,該平滑參數(shù)是根據(jù)每個子帶中語音存在的概率進行調(diào)整的。如果給定幀的某個子帶中存在語音,那么該子帶內(nèi)的噪聲譜等于上一幀的噪聲譜,如果不存在,則根據(jù)帶噪語音的功率譜更新噪聲譜。為了進一步提高算法性能,本文研究了一種改進的最小統(tǒng)計量控制遞歸平均算法。與Cohen提出的IMCRA算法相比,本文采用的是一種快速有效的最小統(tǒng)計量跟蹤算法,在IMCRA算法的基礎(chǔ)上,利用其對語音最小統(tǒng)計量估計的魯棒性,采用了一種簡單有效的最小統(tǒng)計量估計算法,在保證噪聲估計準(zhǔn)確性的同時,減小了算法的復(fù)雜度。3 基于語音活動性檢測的噪聲估計算法及MATLAB實現(xiàn)傳統(tǒng)的噪聲估計方法使用語音活動監(jiān)測(VAD)技術(shù)分離出無聲段,這時無聲段主要表現(xiàn)為噪聲特性,然后再通過某種統(tǒng)計方法,即可獲得背景噪聲特性的近似估計。從實用性、易實現(xiàn)性等方面考慮,很多算法都是建立在相對理想的實驗室條件下的,要求背景噪聲保持平穩(wěn),信噪比較高,而且需要一定的訓(xùn)練算法以預(yù)先得到背景噪聲及語音的統(tǒng)計信息。而且在低信噪比下,VAD 的誤檢率會增大,在不能正確判斷出有聲/無聲段的情況下,估計出來的噪聲很難保證準(zhǔn)確性。近年來,人們提出了一種自適應(yīng)連續(xù)噪聲譜估計方法,它是一種專門用語單聲道語音增強系統(tǒng)的噪聲估計。本章從語音活動檢測和連續(xù)更新噪聲兩方面入手,將幾種算法的基本原理及過程進行了詳細的描述,并分析了實驗結(jié)果。因此,語音段的能量一般要大于噪聲段的能量。這就是僅僅基于短時能量的端點檢測方法。短時能量主要有下面幾個應(yīng)用:首先利用短時能量可以區(qū)分清音和濁音,因為濁音的能量要比清音的能量大得多;其次可以用短時能量對有聲和無聲段進行判斷。其中,當(dāng)信號為單一正弦波時,過零率為信號頻率的兩倍。過零率有兩個重要應(yīng)用:第一,用于粗略地描述信號的頻譜特性。由上面定義出發(fā),計算過零率容易受低頻干擾,所以需要對上述定義做一點修改,設(shè)置一個門限T,將過零率的含義修改為跨過正負門限。即使存在較小的隨機噪聲,只要它不使信號越過正負門限所構(gòu)成的帶,就不會產(chǎn)生虛假的過零率。而且在一些特殊情況下,在以某些音為開始或結(jié)尾時,如當(dāng)弱摩擦音(如[f],[h]等音素)、弱爆破音(如[p],[t],[k]等音素)為開始或結(jié)尾;以鼻音(如[ng],[n],[m]等音素)為語音的結(jié)尾時,只用其中一個參數(shù)量來判別語音的起點和終點是有困難的,往往會漏掉某些音素,必須同時使用這兩個參數(shù)。這種方法也常稱為雙門限比較法。通常是利用過零率來檢測清音,用短時能量來檢測濁音,兩者配合實現(xiàn)可靠的語音端點檢測。這樣就可以用該語音信號的最初幾幀(一般取10 幀)信號作為背景噪聲的統(tǒng)計樣本來計算其過零率閾值ZT 及能量閾值EL(低能量閾)和EU(高能量閾)。計算EL 和EU 時,先算出最初10 幀信號每幀的短時平均能量或平均幅度E,最大值記為EMAX,最小值記為EMIN。先根據(jù)EL,EU 計算出初始起點S1。但若后續(xù)n幀的平均能量或幅度尚未超過EU 而能量又降到EL 之下,則該幀不能作為初始起點S1,然后繼續(xù)尋找下一個平均能量或幅度超過EU 的幀,若后續(xù)n 幀的平均能量或幅度超過EU,則將此幀計為S1,該幀就可以作為根據(jù)能量信號找到的語音的起點。這是由于語音的起始段往往存在著能量很弱的清輔音(如[f],[s]等),僅依靠能量很難把它們和無聲區(qū)分開。當(dāng)S1 確定后,從S1 幀之前的30 幀搜索,依次比較各幀的過零率,若有3 幀以上的過零率超過ZT,則將起始點S1 定為滿足ZZT 的最前幀的幀號,如果這些幀的過零率都小于門限ZT 則將S1 作為起點。 實驗仿真下面是以一段語音為例,進行語音端點檢測的Matlab 仿真。語音和噪聲都是以8KHz 采樣,16bit 量化,wav 格式存儲,并通過Matlab 按一定線形比例混合成不同信噪比的帶噪語音。為了驗證其魯棒性,利用了Matlab 給以上信號添加信噪比5db 的高斯白噪聲,采用同樣的算法,其仿真結(jié)果如下圖所示:圖34 加入高斯白噪聲的語音波形圖圖35 加入高斯白噪聲的能量曲線圖圖36 加入高斯白噪聲的短時過零率曲線圖由以上圖中可看出,在較強背景噪聲的環(huán)境下,上述算法的準(zhǔn)確性急劇下降,已經(jīng)不能準(zhǔn)確的檢測出信號的端點了。4 最小統(tǒng)計遞歸平均的噪聲估計算法及MATLAB仿真本章先研究了經(jīng)典的噪聲估計算法即最小值跟蹤法,然后研究了基于統(tǒng)計信息的非平穩(wěn)噪聲自適應(yīng)算法,最后對這兩種噪聲估計算法做了實驗仿真。 最小值統(tǒng)計法 最優(yōu)平滑設(shè)帶噪語音信號為y(t),它由純凈語音和噪聲組成,即y(t) = s(t) + n(t),這里t代表采樣的時間標(biāo)號。為了將信號轉(zhuǎn)化到頻域,將信號分成長度為L 個采樣點的幀信號,幀間重疊為R 點。上述估計還很粗糙,為了進一步提高估計的準(zhǔn)確性還要考慮以下問題:第一,固定的α 值將不適應(yīng)有聲/無聲的變化與噪聲的變化。第三,最小值的跟蹤過程比真實的噪聲要滯后。為了簡化計算,假設(shè)信號處于無聲狀態(tài)。為了提高在非穩(wěn)定的噪聲環(huán)境中的平滑效果。因為隨機變量的最小值總會小于平均值,所以用最小功率譜密度值的估計存在著偏差,要得到平均值就要對最小功率譜密度進行偏差修正。設(shè)在D個連續(xù)的短時功率譜密度估計P(λ, k)中的最小值為,那么: (47)假設(shè)獨立同分布,所以P(λ, k)的概率密度函數(shù)為: (48)由于與\成正比,并且的方差正比于。我們定義符號: (49) (410)M(D)和H(D)都是關(guān)于D的系數(shù)函數(shù),其中D取96,M(96)=,D(96)=。另外,噪聲估計是通過最小值來搜索,然后再對其進行修正,所以算法比較簡單。圖中橫坐標(biāo)是時間,縱坐標(biāo)表示功率譜,實線表示真實的噪聲譜,虛線表示估計的噪聲譜。圖41 真實噪聲譜和MS算法估計的噪聲譜 (5dB高斯白噪聲)圖42 真實噪聲譜和MS算法估計的噪聲譜 (信噪比從10dB突變?yōu)?dB)由上圖可知,當(dāng)噪聲和信噪比同時突變的情況下,此算法仍然不能快速跟蹤真實噪聲的變化。雖然此局限能夠得以克服,但是代價卻是很高的計算復(fù)雜度。如果噪聲功率譜估計太低,那么所殘留的噪聲干擾將會被聽得到。最簡單的方法就是在純凈語音的間隙去估計和更新噪聲功率譜,例如,語音活性(VAD)算法,盡管這種方法在平穩(wěn)噪聲中(如白噪聲),可能表現(xiàn)的較好,但是在大多數(shù)的實際環(huán)境中表現(xiàn)的就沒那么好了,因為在這樣的環(huán)境中噪聲是時變的。在帶噪語音的每一幀處,基于帶噪語音的功率譜和其局部最小值的比率來判斷純凈語音是否存在,結(jié)果表明在噪聲水平突然增加的情況下,。(2)利用幀間相關(guān)性估計純凈語音存在概率。 非平穩(wěn)噪聲自適應(yīng)算法設(shè)觀察到的帶噪語音為: (417)其中,s(t)是純凈語音,n(t)是加性噪聲。(1) 跟蹤帶噪語音最小值在以前的算法中(如martin的最小值跟蹤法),通過一個固定的窗長去跟蹤帶噪語音功率譜的最小值。下面用遞歸法則去跟蹤最小值:if thenelse end其中,是帶噪語音的局部最小功率譜, 。噪聲是由白噪聲和F16戰(zhàn)斗機噪聲組合而成,信噪比SNR=5dB 。原因是:在語音盲點時刻,帶噪語音功率譜接近于其局部最小值,因此,在(312)式中比率越小,處于語音間隙的可能性就越大。從上式的判斷規(guī)則,用下式來更新語音存在概率: (422)其中, 。)(2) 計算時頻平滑參數(shù)利用上面的語音存在概率估計,用下式計算時頻平滑參數(shù): (423),的取值范圍是:(3) 更新噪聲功率譜最后,在計算了時頻平滑參數(shù)后,利用下式來更新噪聲功率譜: (424)其中,是噪聲功率譜的估計值,整個算法的描述過程:根據(jù)式(421)判斷何時是語音存在頻點,何時是語音間隙頻點。再根據(jù)式(423)來更新時頻平滑參數(shù)。圖44描繪了真實的噪聲功率譜和用我們的算法所估計出來的噪聲功率譜,噪聲是由白噪聲和F16戰(zhàn)斗機噪聲組合而成,Fs=8k,信噪比SNR=5dB??梢钥闯鲈诖蠹s100幀處,噪聲功率突升,估計噪聲功率也即刻突升,表明算法能夠即刻跟蹤噪聲的變化。該方法使用一個平滑參數(shù)對功率譜的過去值進行平均,該平滑參數(shù)是根據(jù)每個子帶中語音存在的概率進行調(diào)整的。如果給定幀的某個子帶中存在語音,那么該子帶內(nèi)的噪聲譜等于上一幀的噪聲譜,如果不存在,則根據(jù)帶噪語音的功率譜更新噪聲譜。Mcaulay提出語音存在和語音缺失的兩態(tài)假設(shè)模型[28] (425)其中,(1)式代表語音缺失,(2)式代表語音存在,Y(λ,
點擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1