freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)設(shè)計-語音增強(qiáng)的應(yīng)用--基于小波變換的噪聲抑制-文庫吧

2024-11-17 10:26 本頁面


【正文】 .................................................................................. 32 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 1 引 言 語言是人類進(jìn)行思想,觀點和情感交流最自然 便捷的交互方式,而不同語種國家的人在交流上必然存在著一定的局限和障礙。隨著信息時代的到來,基于語音識別,機(jī)器翻譯,語音合成的語音人機(jī)交互通信系統(tǒng)就應(yīng)運而生。無論是人與人之間還是人與機(jī)器之間的語音通信,語音信號處理,特別是語音信號數(shù)字處理的理論和技術(shù)都具有特別重要的作用 [1]。 語音識別既是個理論問題,也是一個工程化的問題。它綜合多學(xué)科的理論成果,如:聲學(xué) 、語音學(xué)、語言學(xué)、生理學(xué)、數(shù)字信號處理、信息工程、通信理論、電子技術(shù)、計算機(jī)科學(xué)、模式識別、人工智能等,結(jié)合語音信號的特點,產(chǎn)生一系列語音識別的理論。而 在 實 際運用過程中還有一個工程化問題需要解決,語音識別的成果走出實驗室,所面臨的問題比語音識別技術(shù)本身還要多 ,還要復(fù)雜 ,還要難。首先遇到的是各種噪聲干擾,其次是各種信道條件下的頻譜畸變,還有不同用戶的不同需求等等。 由 于噪聲的存 在 會產(chǎn)生很多問題 。 識別系統(tǒng)大都是在 安 靜環(huán)境 下工 作的 , 在噪聲環(huán)境 中 尤其是強(qiáng)噪聲環(huán)境 ,語音識別系統(tǒng)的識別率將受到嚴(yán)重影響。低率編碼 , 特別是參數(shù)編碼 (如聲碼器 ), 也遇到類似問題 。 由于語音生成模型是低速率參數(shù) 編碼 的基礎(chǔ) , 而在語音通信中不可避免地會受到來自周圍環(huán)境 , 傳輸媒介引入的噪聲、 通信設(shè) 備內(nèi)部電噪 聲 乃 至其他說話人的干擾 。這些干擾將使接收端接收到的參數(shù) 不 是 純凈的原始語音參數(shù) , 而 是 受 噪 聲 污染 的參數(shù) 。當(dāng)噪聲干擾嚴(yán)重時 , 重建語音的質(zhì)量將急劇惡化 ,甚至 變得完全 不 可懂 。 而特別遺憾的是 , 線性預(yù)測技術(shù)作為語音處理中最有效的手段 , 恰恰 是最容易受噪聲影響的。 語音經(jīng)過話筒變換成電信號后,加在識別系統(tǒng)輸入端,首先要經(jīng)過預(yù)處理。語音增強(qiáng)技術(shù)作為語音編碼和語音識別的預(yù)處理, 是 解決噪聲污染的一種 有 效方法 , 它的一個主 要目標(biāo)是從帶 噪 語音信號中提取盡可能 純凈 的原始語音 。 由 于 干擾通常都是隨機(jī)的 ,因 而從帶噪語音中提取完全純凈的語音幾乎不 可能。在這種情況下, 語音 增強(qiáng)的 目 的 主要 有兩個:一是改進(jìn)語音質(zhì) 量 ,消除背景噪聲,使聽者樂于接受,不感覺疲勞 。 這是 一種主觀度 量; 二是提高語音可懂度,這是一種客觀度量。這兩個目的 往往 不能兼得 [1]。 本文將主要利用小波變換的一些特性來抑制噪聲,以達(dá)到語音增強(qiáng)的目的。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 2 第一章 預(yù)處理 在對 語音信號進(jìn)行分析和處理 之前 , 必須對其進(jìn)行預(yù) 處理 ,預(yù) 處理除了 數(shù)字化 , 還包括反混疊 濾 波、預(yù)加 重 、端點檢測 等。 語音信號的數(shù)字化模型 語音信號數(shù)字化之前,必須先進(jìn)行防混疊濾波及防工頻干擾濾波。其中防混疊濾波指濾除高于 1/2 采樣頻率的信號 成分或噪聲,使信號帶寬限制在某個范圍內(nèi);否則,如果采樣率不滿足采樣定理,則會產(chǎn)生頻譜混疊,此時信號中的高頻成分將產(chǎn)生失真;而工頻干擾指 50Hz 的電源干擾。由于防混疊和防工頻干擾濾波器都做在一個集成塊中 , 因此,目前語音信號的數(shù)字化的質(zhì)量是有保證的。 語音信號的數(shù)字化包括兩個步驟: 采 樣和量化。 Nyquist 采樣定理要求取樣率必須大于或等于信號帶寬的 2 倍,因此,一般需要對輸入的語音信號作低通(防混疊)濾波,然后進(jìn)行 A/D 轉(zhuǎn) 換 ,如圖 所示。如果工頻干擾( 50Hz 或 60Hz)不嚴(yán)重或另有措施抑制,則不必用帶通濾波 器而只需用低通濾波器就可以了,截 止 頻率由實際語音信號帶寬確定。典型的反混疊濾波器的技術(shù)指標(biāo)是:通帶內(nèi)波動絕對值小于 1dB,通帶帶寬 3400Hz,在 4000Hz 處衰減 14dB, 4600Hz 以上衰減 32dB,對某些更高要求的應(yīng)用,阻帶衰減 50dB以上。 采 樣之后要對信號進(jìn)行量化 , 量化后的信號值與原信號之間的差值稱為量化誤差,又稱為量化噪聲 。 目前 8bit量化較通用,試驗表明,如果語音波形的動態(tài)范圍為 55dB,10bit以上量化更為合適。 圖 語音信號的數(shù)字化 語音信號預(yù)處理 常用的特征包括:短 時平均能量,短時平均過零率,短時自相關(guān)函數(shù)等。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 3 短時能量分析 : 短時能量序列反映了語音振幅或能量隨著時間緩慢變化的規(guī)律。從原始語音信號圖中可以看到語音信號幅度隨時間有相當(dāng)?shù)淖兓?,特別是清音段的幅度一般比濁音段的幅度小很多,語音信號的短時能量給出了反映這些幅度變化的一個合適的描述方法 [2]。 語音信號 s(n)的短時能量的定義為: 2[ ( ) ( ) ]nE s m w n m?????? (11) 其中窗函數(shù) w(n)為矩形窗、漢明窗 、 漢 寧窗的任意一種,這里窗長 N 的選擇對于反映語音信號的幅度變化起著決定性的作用。如果 N 很大 , 它等效于很窄的低通濾波器,此時 En 隨時間的變化很小 , 不能反映語音信號的幅度變化 , 信號的變化細(xì)節(jié)就看不出來;反之 , N 太小時 , 濾波器的通帶變寬 ,En隨時間有急劇的變化,不能得到平滑的能量函數(shù)。因此,窗口長度的選擇應(yīng)合適 。 短時平均能量的主要用途有: ① 區(qū)分清音段和濁音段,語音為濁音時的短時能量值比清音時大得多,根據(jù)語音信號短時能量值的變化,可大致判定濁音變?yōu)榍逡艉颓逡糇優(yōu)闈嵋舻臅r刻。 ② 在高信噪比的語音信號中,可以用來區(qū)分有無語 音。此時,無語音信號的噪聲能量很小,而有語音信號時,短時能量值顯著地增大到某一數(shù)值,由此可以區(qū)分語音信號的 起 始點和終止點。 短時過零分析: 過零分析是語音時域分析中最簡單的一種,顧名思義,過零就是信號通過零值。對于連續(xù)語音信號,可以考察其時域波形通過時間軸的情況。而對于離散時間信號,如果相鄰的取樣值改變符號則稱為過零。由此可以計算過零數(shù),過零數(shù)就是樣本改變符號的次數(shù)。單位時間內(nèi)的過零數(shù)稱為平均過零數(shù)。 語音信號短時過零數(shù)定義為:| s g n [ ( ) ] s g n [ ( 1 ) ] | ( ) | s g n [ ( ) ] s g n [ ( 1 ) ] | ( )n mZ s m s m w n m s n s n w n?? ? ?? ? ? ? ? ? ? ?? ( 12) 式中 ??sgn? 為符號函數(shù)。 即: 1 ( ( ) 0 )s g n [ ( ) ]1 ( ( ) 0 )snsn sn ??? ???? (13) ()wn 為窗口函數(shù)。其作用與求短時平均能量時一樣。一般取 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 4 1 01() 20nNwn N? ? ? ??? ??? 其 他 (14) 這里窗口幅度為 1/2N,是對窗口范圍內(nèi)的過零數(shù)取平均的意思。因為在窗口內(nèi)共有N 個 樣本,而每個樣本使用了 2 次。當(dāng)然也可以不用直角窗,而采用其它形式的窗。 短時過零可用于清音和濁音的大分類上,還可用于從背景噪聲中找出語音信號??捎糜谂袛嗉澎o無語音和有語音的起點與終點位置 , 用于確定一個一個單詞的語音信號。 短時自相關(guān): 自相關(guān)是一種常用的時域波形分析法。它有自相關(guān)和互相關(guān)之分 , 分別用自相關(guān)函數(shù)和互相關(guān)函數(shù)來定義。相關(guān)函數(shù)用于測定兩個信號在時域內(nèi)的相似性。 語音信號短時自相關(guān)函數(shù)( Short Time Autocorrelation Function)定義: ( ) ( ) ( ) ( ) ( )n mR k s m w n m s m k w n m k?? ? ?? ? ? ? ?? ( 15) 自相關(guān)函數(shù)具有以下的性質(zhì): ㈠ 如果序列是周期的,則自相關(guān)函數(shù)也是周期的函數(shù)。 ㈡ 自相關(guān)函數(shù)是偶函數(shù)。 ㈢ 當(dāng) K=0 時 , 自相關(guān)函數(shù)具有極大值。 ㈣ R( 0)等于確定性信號序列的能量或隨機(jī)性序列的平均功率。 自相關(guān)函數(shù)的這些性質(zhì)完全可以用于信號的時域分析之中。 反混疊失真濾波器 為了防止混疊失真和噪聲干擾,必須在取樣前用一個銳截止模擬低通濾波器對語音信號進(jìn)行濾波。該濾波器稱為反混疊失真濾波器或者去偽濾波器。它主要是為了去除個體發(fā)音差異和設(shè)備、 環(huán)境引起的噪聲影響等。 要實現(xiàn)滿足以上指標(biāo)的銳截止濾波器是比較困難的,因此,通常允許有一定過渡帶,如果取樣頻率為 8kHz,那么折疊頻率是 4kHz,這意味著在取樣過程中只有 以上的頻率成分才會反映到 以下的 通 帶中造成混疊失真。然而這些高頻成分已經(jīng)受到阻帶很大的衰減,所以造成的混疊失真可以忽略不計。通過計算可以知道,為了把混疊失真效應(yīng)一起的失真減小到與量化器的噪聲相同的水平,阻帶的衰減應(yīng)當(dāng)約為 66dB,對內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 5 通帶內(nèi)的波紋的要求就沒有這么高了。這是因為: ⑴ 頻率分量的出現(xiàn)意味著感興趣的頻率范圍內(nèi)的 某些頻率成分的信息已經(jīng)丟失。而通帶 內(nèi)的波紋實際上不會引起這種信息的丟失,只會 引 起某種失真。 ⑵ 混疊失真是可以聽出來的,而通帶波紋引起的頻譜失真幾乎聽不出來,因此,通常允許通帶內(nèi)的波紋達(dá)到 。 上述指標(biāo)可以用一個 9 階橢圓濾波器來實現(xiàn)。這種濾波器常用于高質(zhì)量語音信號處理系統(tǒng)中。 預(yù)加重器 由于語音信號的平均功率譜受聲門激勵和口鼻輻射影響,高頻端大約在 800Hz 以上按 6dB/倍頻程跌落,即 6dB/oct(2 倍頻 )或 20dB/dec(10 倍頻 ),所以求語音頻譜時,頻率越高相應(yīng)的成分越小,高頻部分的頻譜比 低頻部分的難求,為此要在預(yù)處理中進(jìn)行預(yù)加重 (Preemphasis)處理。預(yù)加重的目的是在于濾除低頻干擾,尤其是 50Hz 或 60Hz 的工頻干擾,將對于語音識別更為有用的高頻部分的頻譜進(jìn)行提升,以便于語音參數(shù)分析。 預(yù)加重的一般做法是將語音信號通過一個一階高通濾波器 11 ?? ,通常稱之為預(yù)加重濾波器,在計算語音參數(shù) (如短時能量 )之前應(yīng)使用該濾波器,可以起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的效果。 預(yù)加重濾波器傳遞函數(shù)為 : 1( ) 1 75H Z Z ??? (16) 若 S(n)是預(yù)加重前的語音信號,則經(jīng)過預(yù)加重濾波器后得到的信號 ()Sn 為 : ( ) ( ) ( 1 )S n S n S n? ? ? (17) 端點檢測器 在許多實際應(yīng)用中,都要求首先對系統(tǒng)的輸入信號進(jìn)行判斷,準(zhǔn)確找出語音段的起始點和終 止 點。只有準(zhǔn)確地找出語音段的起始點和終止點,才有可能使采集到的數(shù)據(jù)是真正要分析的語音信號,這樣不但減少了 數(shù)據(jù)量、運算量和處理時間,同時也有利于系統(tǒng)識別率的改善。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 6 判斷語音信號的起始點和終止點的問題 主 要歸結(jié)為區(qū)別語音和噪聲的問題。如果環(huán)境噪聲和系統(tǒng)輸入噪聲非常小,以至能夠保證系統(tǒng)的輸入信噪比很高(即使最低電平的語音的能量也比噪聲的能量要高),那么只要計算輸入信號的短時能量就能夠把語音段和噪聲背景區(qū)別開來。但是,實際應(yīng)用中很難保證這么高的信噪比,因而不能夠只依靠短時能量來判別會遇到的特殊困難,例如當(dāng)語音段的開始和終止都是弱摩擦音或弱爆破音的情況。在這種情況下,只能依靠短時能量來判別語音段的起止點,往往會把起始和末尾的這些音素漏掉。因此常常還利用短時平均過零率進(jìn)行判斷。因為清音和以上所舉的音素的短時平均過零率比背景噪聲的平均過零率要高出好幾倍。 內(nèi)蒙古科技大學(xué)畢業(yè)設(shè)計說明書(畢業(yè)論文) 7 第二章 語音增強(qiáng)概述 語音早已成為人類進(jìn)行交流的一種主要方式,通過語音傳遞信息是人類最重要、最有效和最方便的交換信息的途徑。因此,語音信號是人們思想疏通和感情交流的最主要的信號形式之一。同時,隨著信息技術(shù)的發(fā)展,語音信號作為信息的最普遍最直接的表達(dá)方式,在許多領(lǐng)域也一樣具有廣泛的應(yīng)用前景。然而在實際環(huán)境下語音信號處理的 關(guān)鍵是抗噪聲技術(shù),因為噪聲的消減對一些語音應(yīng)用如語音識別、語音編碼、語音合成等的實用
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1