【正文】
的概率則和一幀信號中純語音信號的短時能量S的大小有關(guān),能量大則誤判率低,而在信噪比SN為8dB時誤判率約為30%.我們用判斷為純噪聲的那些幀來計算噪聲的短時能量譜,雖然在判斷噪聲時,可能會有錯判,但錯判的幀中,一般語音的能量能非常小,對估計噪聲不會產(chǎn)生太大的影響.由于它對噪聲特性的估計更為準(zhǔn)確,取得了很好的結(jié)果,信噪比大大的提高,并且語音的可懂度也明顯提高。 算法的實現(xiàn)本課題在譜減法的研究基礎(chǔ)上,將得到的帶噪語音進(jìn)行先驗信噪比估計,從而得到增強(qiáng)后語音。它主要包括以下幾步:1,帶噪語音輸入,計算輸入信噪比。2,將帶噪語音進(jìn)行分幀,計算各幀能量。3,取一門限值,對各幀進(jìn)行有聲/無聲判斷。4,對各幀進(jìn)行傅立葉變換,若為寂靜幀則將該幀判為零,否則利用式()估計出該幀的信噪比。5,用先驗信噪比計算出濾波函數(shù),最終計算增強(qiáng)后語音的頻譜函數(shù)。6,對各幀的譜函數(shù)進(jìn)行逆傅立葉變換,得到增強(qiáng)后語音。 對以上的步驟,其中寂靜幀的判定和先驗信噪比的估計在前面已有了詳細(xì)的介紹和分析。帶噪語音輸入分幀有聲/無聲判決無聲重置噪聲譜有聲頻譜計算信噪比估計先驗信噪比利用G(w)算增強(qiáng)后語音計算信噪比傅立葉逆變換的時域圖增強(qiáng)后語音輸出 語音增強(qiáng)流程圖 參數(shù)的估計式 中i指幀系數(shù),是調(diào)節(jié)系數(shù)但當(dāng)噪聲不變時,就必須考慮進(jìn)去。在這里,=。 實驗結(jié)果和分析 為了研究該算法的有效性,我們以一段英文為純凈的語音信號,以平穩(wěn)的高斯白噪聲為濾波對象。采樣頻率為22050Hz,幀長為256,語音總共長為110033。選取漢明窗(hamming)對信號加窗。根據(jù)文獻(xiàn)將信號在頻域中等分三個子帶。橫坐標(biāo)為時間軸,縱坐標(biāo)為幅度軸。每幅圖中從上往下的波形依次是純凈的語音信號,帶噪語音信號,和增強(qiáng)后的語音信號。從圖中可以看出,無論信噪比是低還是高,帶噪語音信號經(jīng)增強(qiáng)處理后都能有較好地恢復(fù)。但低信噪比下改進(jìn)的好。 改進(jìn)型譜減法的仿真圖(信噪比為3dB) 改進(jìn)型譜減法的仿真圖(信噪比為3dB)第五章 性能評價我們對本文所提出的算法進(jìn)行性能評價,并將它和基本譜減法進(jìn)行比較。 信噪比改進(jìn) 噪聲減少通常是以信噪比改進(jìn)來衡量的,本文提出的是輸入,輸出的分段信噪比來加以比較,即: ()其中L表示信號的幀長度,N表示每幀的采樣點。利用該方法我們對含有高斯白噪聲的語音信號進(jìn)行處理,語音為一段英文,采樣率為22050Hz。對處理結(jié)果我們用信噪比進(jìn)行評價。 3dB 0dB 3dB基本譜減法 改進(jìn)型譜減法 信噪比改進(jìn)程度 ,從圖中可以看出:兩種譜減法提供的信噪比改進(jìn)都相似,但改進(jìn)型算法提高了對低輸入信噪比的改進(jìn)。 主觀評價為了確證客觀性能評估,我們采用了主觀聽覺測試。聽覺測試是在4個聽眾中進(jìn)行的,內(nèi)容是對語音的殘留噪聲,仍存在的背景噪聲,語音失真和音樂噪聲的全面評價。對于每個話音都有下列步驟:1) 純凈語音和帶噪語音均被重復(fù)播放兩次;2) 每個測試信號都被重復(fù)兩次,且以隨機(jī)順序播放三次。測試的結(jié)果:利用本方法增強(qiáng)的語音的剩余噪聲和“音樂噪聲”均大大降低。 結(jié)論單通道譜減系統(tǒng)在減少背景噪聲上很有效,然而它帶來了可感知的令人煩躁的“音樂噪聲”。在本文中,提出了基于先驗信噪比的改進(jìn)型譜減法,提出的算法提高了對低輸入信噪比的改進(jìn)。主觀聽覺測試也說明本方法殘留噪聲對語音的干擾比基本譜減法小的多。該算法的主要優(yōu)點如下:1) 設(shè)計思路簡單,運算量小與基本譜減法相當(dāng)。2) 性能好,剩余噪聲和“音樂噪聲”均大大降低。 本文用該算法對不同信噪比的帶噪語音進(jìn)行測試并和基本譜減法作對比。通過實驗結(jié)果和信噪比得到的客觀評估,結(jié)合主觀聽覺結(jié)果顯示:與基本方法相比,音樂噪聲和殘留噪聲的語音結(jié)構(gòu)都減少了,而語音失真也在可接受的范圍內(nèi)。因此可以得出這樣的結(jié)論:基于先驗信噪比的改進(jìn)型譜減法比基本譜減法有較大的改進(jìn),特別是在低信噪比的情況下。本文所處理的還只限于平穩(wěn)隨機(jī)噪聲,對噪聲特性變化劇烈的含噪語音,上述方法就無能為力了。而許多環(huán)境下的干擾噪聲是非平穩(wěn)的,人類的聽覺系統(tǒng)還是能從這類噪聲中提取有用信息,因此研究非平穩(wěn)隨機(jī)噪聲下的語音增強(qiáng)具有重要的意義,這方面的工作有待進(jìn)一步展開。參考文獻(xiàn)[1] ,And , Enhancement and Bandweidch Compression of Noise Speech[J].PROCEEDINGS OF THE IEEE,[2] Wang DL,Lim JS,The unimportance of phase in speech enhancement [J].IEEE Trans Acoust Speech Signal Processing,1982,30(4):679681.[3] Ephraim Y, Malah D. Speech enhancement using a minimum meansquare error shorttime spectra amplitude estimator [J].IEEE Trans Acoust Speech Signal Processing,(6):11091121.[4] S. F. Boll, “Suppression of acoustic noise in speech using spectral subtraction”, IEEETransaction on Acoustics, Speech and Signal Proc., Vol. 27, pp. 113–120,1979[5] M. Berouti, R. Schwartz, J. Makhoul, “Enhancement of speech corrupted by acoustic noise”, Proc. IEEE ICASSP, , Washington, DC, April 1979[6] P. Lockwood, J. Boudy, “Experiments with a nonlinear spectral subtraction(NSS),hidden Markov models and projection for robust recognition in cars”, Speech Communication, November 1992[7] B. Lim Sim, Y. C. Tong, “A parametric formulation of the generalized spectralsubtraction method”, IEEE Transaction on Speech and Audio Processing,June 1998[8] N. Virag, “Single channel speech enhancement based on masking properties of human auditory system”, IEEE Transactions on Speech and Audio Processing, , July 1999[9] “,And , Enhancement and Bandweidch Compression of Noise Speech[J].PROCEEDINGS OF THE IEEE,Vol,67(12):15861604”[10] 張波等,“低信噪比下的一種自適應(yīng)有聲/無聲判決算法”,信號處理,1996[11] 沈亞強(qiáng),程仲文。一種基于自適應(yīng)的語音增強(qiáng)方法[J]。信號處理,1993,9(1):914[12] 付強(qiáng),易克初,田斌,語音信號處理[M] 國防工業(yè)出版社[13] 張金杰,曹志剛等。一種基于聽覺巖壁效應(yīng)的語音增強(qiáng)方法。清華大學(xué)學(xué)報(自然科學(xué)版),2001,41(7):14[14] 廖春波。語音增強(qiáng)及其相關(guān)技術(shù)的研究。[大連理工大學(xué)學(xué)位論文]2003[15] Tsoukalas D E, Mourjopoulos J N. Speech enhancement based on audible noise Speech and AudioProcessing,1997,5(6)497514[16] 劉海濱,“非平穩(wěn)環(huán)境下基于人耳聽覺掩蔽特性的語音增強(qiáng)”,信號處理,,,2003[17] 王永紅等,“譜相減技術(shù)中“音樂噪聲”的抑制”,桂林電子工業(yè)學(xué)院學(xué)報,,19