freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

基于改進型譜減法的語音增強技術研究(編輯修改稿)

2025-06-12 19:40 本頁面
 

【文章內容簡介】 4) 對于緩慢變化的非平穩(wěn)噪聲環(huán)境,譜減法算法中有話音激活檢測環(huán)節(jié)以便適時的判斷并進行調整。 5) 假設主要噪聲影響的消除可以通過僅僅從帶噪語音譜幅度中減去噪聲而實現(xiàn)。 FFT IFFT 相位信息 2|)(| ?wY 2/1|)(| ?wS 減去估計噪聲 ]|)([| 2?wNE 增強后的語音 )(ms? 帶噪語 音 )(my啊 11 “音樂噪聲”的產生 譜減法技術大多數都是在頻域上進行,也有在時域的。由于在譜減法處理過程中,是以無聲期間統(tǒng)計平均的噪聲方差代替當前分析幀各頻率點的噪聲頻率分量,而噪聲頻 譜具有高斯分布,即其幅度隨機變化范圍很寬,因此相減時,若該幀某頻率點噪聲分量較大,就會有很大一部分保留,具體來講,由譜相減所產生的噪聲稱為殘余噪聲,與語音信號不相關,是由具有隨機頻率和幅度的窄帶信號所組成。在頻譜上呈現(xiàn)隨機出現(xiàn)的尖峰,便產生了間歇短暫的突發(fā)聲調,在聽覺上形成有節(jié)奏性起伏的類似音樂噪聲的殘留噪聲。 這種具有音樂特性的殘余噪聲是各幀內在隨機頻率上出現(xiàn)的許多聲調的群體結果。它比原始語音中的噪聲清楚的多,也更易令人反感。這種噪聲具有“音樂”的聽覺效果,聽起來像有“咕咕”的流水聲,因此稱為“音樂噪聲” 。聽者常常能發(fā)現(xiàn)處理后的語音中的“音樂噪聲” 比原始信號中的噪聲更為清晰,這是由于在短時譜估計中,在各幀的隨機頻率點上出現(xiàn)多種頻率的組合而產生的。 語音端點檢測技術 由上述分析可知,在譜減法中噪聲功率譜的估計至關重要,如果噪聲估計偏差較大的話,將毫無疑問的影響語音增強質量 。 傳統(tǒng)的噪聲估計方是由 Rainer Martin 提出 的基于最優(yōu)平滑和最小統(tǒng)計的噪聲估計,本文采用改進的算法 —— 基于語音活性檢測 (Voice Activity Detector)的噪聲估計算法。 語音激活檢測 (VAD, Voice Activity Detection)指從一段包含語音的信號中確定出語音的起始點和終點,又稱端點檢測 (Ending Detection)。語音端點檢測的目的就是從連續(xù)記錄的帶噪語音信號中分離出我們真正感興趣的語音信號。 語音激活檢測是各種語音處理中必需的重要環(huán)節(jié),精確地確定輸入語音的起點和終點將保證語音處理系統(tǒng)良好的性能,語音激活檢測是語音增強中的一個關鍵問題。一些系統(tǒng)中,對于語音和噪聲的處理方法也不同,如果不能判斷當前語音幀是含噪語音幀或是噪聲幀的話,就不能進行適當的處理,這種系統(tǒng)對語音存在性的判斷要求就 更高一些,要求把每一幀噪聲都判斷出來。在語音增強系統(tǒng)中,語音知識的學習和噪聲源信息估計的積累都依賴于準確的端點檢測。 12 對于語音激活檢測應用,在語音增強中,為了得到更多的背景噪聲特性,語音端點檢測更注重于如何準確的檢測出無音段。 通常的語音激活檢測是基于語音幀來進行的,語音幀的長度在 10~ 30ms 不等。語音活性檢測的方法可以綜述為:從輸入信號中提取一個或一系列的對比特征參數,然后將其和一個或一系列的門限閾值進行比較,如圖 32所示。如果超過門限則表示當前為有音段,否則就表示當前為無音段。 門限通常是根據無音段 時語音特征確定的。但是由于語音和環(huán)境噪聲的不斷變化,使得這一判決過程變得非常的復雜。于是一個好的語音活性檢測算法必須具備對各種噪聲的魯棒性,同時要簡單,適應性好,易于實時實現(xiàn)。 圖 32 語音激活檢測框圖 目前語音端點檢測所采取的方法大體可以分為兩類: 第一類是噪聲環(huán)境下基于 HMM 模型的語音信號端點檢測的方法,該方法要求背景噪聲保持平穩(wěn)且信噪比較高。 第二類方法是基于信號的短時能量進行檢測的算法,它通過對背景噪聲能量的統(tǒng)計,定出能量門限,利用能量門限來確定語音信號起始點。 在本文中,語音端點檢測采用了第二類方法,即 基于信號的短時能量進行檢測的算法。 基于信號的短時能量檢測具體算法如下: 1) 計算每一幀的 語音能量: )(102 mxE Nm nn ???? (37) 式中 N 為幀長, n 為幀的編號, Ln??1 , L 為幀數, m 為每一幀中的各點;然而它有一個缺陷,即它對高電平非常敏感(信號的二次方計算)。為此,定義短時平均幅度函數來表征一幀語音信號的能量大小,定義: ????10 )(Nm nn mxM (38) 加窗分幀 特征提取 與閥值比較 判斷有無語音 帶噪語音 13 2) 計算前 20 幀平均噪聲能量 EMN ; 3) 求能量最大值和能量最小值 EAX , EMIN ; 4) 根據式 (39)確定門限 ]4,)( i n [ E M NE M NE M I NE A XT ??? (39) 基于端點檢測法的算法流程圖如下: 圖 33 端點檢測算法流程圖 該算法建立在平穩(wěn)高斯噪聲模型基礎上,在背景噪聲幅度保持恒定且遠低于語音信號幅度時,可以十分有效地檢測出語音信號的端點。 14 本文應用譜相減法實現(xiàn)語音增強基本原理是 通過對帶噪語音譜減去噪聲譜得到語音譜, 因此, 語音激活檢測這一環(huán)節(jié)非常重要。因為準確地確定 語音的起始點 和終止點對噪聲譜估計有著 重要 的 作用。 基音檢測的后處理 基音檢測算法可能產生檢測誤差,使求得的基音周期軌跡中有一個或幾個基音周期估計值偏離了正常軌跡(通常是偏離到正常值的 倍或 2倍 ),稱這種偏離點為基音軌跡的“野點”。為了去除這些野點,可以采用各種平滑算法,最常用 的是中值平滑算法和線性平滑算法。 本文采用組合平滑算法 , 將中值平滑和線性平滑組合,為使平滑的基音軌跡更貼近,并采用二次平滑的算法。設所要平滑的信號為 ?????(??),經過一次組合得到的信號為 ????(??)。那么首先應求出兩者的差值信號 ?????(??) = ????(??)?????(??),再對 ?????(??)進行組合平滑,得到 ?????(??),令輸出等于 ????(??) +?????(??),就得到更好的基音周期估計軌跡。全部算法的框圖如圖 34所示。 圖 34 組合二次平滑算法流程圖 基于譜減法的語音增強算法流程 本論文采用了 MATLAB 語言實現(xiàn)了整個基于譜減法的語音增強算法,具體MATLAB 程序見附錄,其算法流程如下: 1)對輸入的語音信號進行預濾波 ; 2)對濾波后的語音信號進行預加重; 15 3)將語音信號按每幀 128 個信號 點 進行分幀 ,幀移為 64; 4)對信號幀加漢明窗 (Haming); 5)對加窗后的信號幀進行 FFT 變換; 6)對各幀語音信號求功率譜; 7)根據前 20 幀求取平均噪聲功率; 8)利用 VAD 進行噪聲估計檢測寂靜段,進而組合遞歸平滑,更新噪聲譜; 9)進行譜減運算,得到估計出的語音信號功率譜; 10)插入相位譜,計算出 語音譜; 11)進行 IFFT 變換 ,得到 還原 的語音幀; 12)根據各個語音幀組合為語音信號; 13)對語音信號進行去加重處理,得到最終信號。 根據以上譜減法的算法流程,采用 MATLAB 語言進行仿真試驗,試驗用的語音材料是 WAV 格式的語音,經處理后去噪效果明顯, 較 好 地 抑制了噪聲,提高了語音的可懂度。 仿真實驗的結果 在仿真實驗中,采用的是在實驗室內錄制的純凈男語音信號“基于改進型譜減法的語音增強”,采樣率 8kHz,使用 MATLAB 函數 wavread( )調用,在程序中對純凈語音加入高斯白噪聲 ,調用 MATLAB 函數的 wavwrite( )進行輸出,命名為 “ noised” 。根據譜減法的假設 :假定純凈語音 與 高斯白噪聲 相互獨立 ,故我們可將兩者 直接相加得到帶噪的語音信號 。 當得到帶噪語音信號 后 ,對其進行譜減去噪處理,便到去噪后的語音信號,并調用 MATLAB 函數的 wavwrite( )進行輸出,命名為 “ enhanced” 。 從聲音文 件的測聽效果來說,是令人滿意的。 在本論文的 MATLAB 程序中,分別畫出了純凈語音 (見圖 35)、加噪語音 (見圖 36)、增強后語音 (見圖 37)的 語 音圖 。從 的 語音圖中可以很容易發(fā)現(xiàn),本論文提出的算法具 較 明顯的去噪效果。 16 圖 35 純凈語音信號 圖 36 帶噪語音信號 17 圖 37 增強后的語音信號 模型 的 缺點及進一步改進思想 在 本文 采用的 功率譜減法中 ,我們 假設噪聲和語音是相互獨立且噪聲是零均值的高斯分布,但在現(xiàn)實世界中的噪聲幾乎都不是零均值的高斯分布, 并且語音和噪聲具有一定的相關性。 因此 ,直接采用譜減法進行語音增強具有一定的局限性。 基于此點考慮,我們對下式 (功率譜) 作進一步的 分析 。 )()c os ()(*)(2)()()()()( 2222 功率譜???????? NSNSNSNSY ?????????其中: )e xp ()()()e xp ()()()e xp ()()(NSYiNNiSSiYY???????????? )(?Y 為帶噪語音的頻譜、 )(?S 為純凈語音的頻譜、 )(?N 為噪聲的頻譜 。 兩邊同時 求期望:? ? ? ? ? ? )][c os (*])([*])([2)()()( 222 NSENESENESEYE ??????? ???? 18 在上文的分析中, 由于 假設 語音和噪聲是相互獨立的,因此可得到 0)][c os (*])([*])([2 ?? NSENESE ???? 通過式子的分析可知,為了體現(xiàn)原始信號與噪聲通常的 相關 性, 上式 的值 不可忽略, 尤其是在 低信噪比的條件下, 上式 更 不可被輕易忽略 。 因此 將 問題轉化為如何估計上式。 從數學的角度出發(fā),我們知道方差 )(XD 有如下性質: 0)]([)()( 22 ??? XEXEXD 由此,可作如下估計: ? ? ? ?? ?212)()( ??? SESE ? ? ? ? ?? ?212)()( ??? NENE ? 其中, 10 ?? ??, ,且 令 ? ?)co s( NSE ????? ?? ,則也有 10 ??? ,原期望等式可變形為: ? ? ? ? ? ? ? ? ? ?? ? 2122222 )(*)(2)()()( ?????? NESENESEYE ??? 因此, 對一幀內的短時平穩(wěn)過程 的功率譜 , 有: )(*)(2)()()( 222 ?????? NSNSY ??? 由此 式可看出, 只要 較好地 估計出 ? 的值,就可以估計出更接近實際 (語音與噪聲不相互獨立) 的噪聲功率譜 2)(?N 。 基于 以上 的 改進思想, 我們 做了數學上 簡要 的推導分析, 從得到的 結論可以看出 ,此思想 具有一定可行性, 也 為今后進一步的研究工作提供了一個方向 。 附錄 參考文獻 [1] 程乾生 .數字信號處理簡明教程 [M].北京:高等教育出版社, [2] 趙力 .語音信號處理(第二版) [M].北京:機械工業(yè)出版社, [3] 李正周 .MATLAB 數字信號處理與應用 [M].北京:清華大學出版社, [4] 王正林,劉明 .精通 MATLAB 7[M].北京:電子工業(yè)出版社, [5] John G. Proakis 著,湯俊 譯 .統(tǒng)計信號處理算法 [M].北京:清華大學出版社, 19 [6] 柳春 .一種改進的基于短時平均幅度的語音端點檢測算法研究 [J].西南名族大學學報,: 5659 [7] 胡科開,吳憑天 等 .一種基于改進型譜減法的語音增強新算法 [J].大眾科技, 9期 :2526 [8] 職振華,馬建芬 .改進的譜減法在語音增強中的應用 [J].語音技術, [9] 鄭方 .語音端點檢測、前端處理和特征抽取的研究 [J].畢業(yè)設計論文, MATLAB 仿真程序 load test %s 純凈的語音信號 %n 白噪聲信號 %x 加噪后的語音信號 %y 加重后的語音信號 %y_fft 頻域信號 %y_w 信號幀每幀的功率譜 %y_w_dec 減譜后的功率譜 %x_new 減譜后的語音信號 Wp=[*pi,*pi]。 %通帶上下截止頻率 Ws=[*pi,*pi]。 %阻帶上下截止頻率 Ap=10。 %通帶內衰減 As=60。 %阻帶內衰減 N=128。 %每幀的信號個數 p=。 %白噪聲信號的方差 alpha=。 %加重系數 beta=。%去重系數 %產生均值為 0,方差為 p,服從高斯分布的白噪聲信號 n n=noise(p,length(s))。 %純凈的語音信號 s 加上白噪聲信號 n,得到帶噪語音信號 x x=s+n。 %預處理 %產生帶通濾波器 w [db,mag,pha,grd,w]=bandpass(Wp,Ws,Ap,As,leng
點擊復制文檔內容
高考資料相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1