freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于譜減法的語音增強(qiáng)及其dsp實現(xiàn)-在線瀏覽

2024-11-05 18:51本頁面
  

【正文】 ......................... 27 ................................................................................................. 27 IV .......................................................................................... 29 ................................................................................................. 32 .................................................... 32 ............................................................................ 35 第六章 結(jié)論與展望 ................................................................................................................... 37 ................................................................................................. 37 ................................................................................................. 37 致 謝 ........................................................................................................................................ 38 參考文獻(xiàn) ................................................................................................................................... 39 附錄 外文文獻(xiàn) .......................................................................................................................... 40 1 第一章 緒論 課題研究意義 當(dāng)今世界正處在信息時代。語音是人類相互之間進(jìn)行交流最自然和最方便的形式之一,語音通信是一種理想的人機(jī)通信方式。 語音數(shù)字信號處理是一門涉及面很廣的交叉學(xué)科,研究領(lǐng)域涉及到信號處理、人工智能、模式識別、數(shù)理統(tǒng)計、神經(jīng)生理學(xué)和語言學(xué)等許多學(xué)科,在數(shù)字語音通信、聲控打印機(jī)、自動語音翻譯和多媒體信息處理等許多方面都有著非常重 要 的應(yīng)用。在語音數(shù)字信號處理的諸多研究領(lǐng)域中,語音增強(qiáng)是語音數(shù)字信號處理系統(tǒng)進(jìn)入實用階段,保證語音識別系統(tǒng)、說話人識別系統(tǒng)和各種實際環(huán)境下語音編碼系統(tǒng)性能的重要環(huán)節(jié)。通常情況下,語音增強(qiáng)的主要目標(biāo)是從帶噪語音信號中提取盡可能純凈的原始語音。在這種情況下,語音增強(qiáng)的目的主要有兩個:一是改進(jìn)語音質(zhì)量,消除背景噪聲,這是一種客觀度量;二是提高可懂度,使聽者樂于接受,不感覺疲勞,這是一種主觀度量,但這兩個目的往往不能兼得。 ( 2) 語音生成模型是低速率參數(shù)編碼的基礎(chǔ),當(dāng)模型參數(shù)的提取受到混雜在語音中的背景噪聲嚴(yán)重干擾時,重建語音的質(zhì)量將急劇惡 化,甚至完全不可懂。2 ( 4) 在醫(yī)學(xué)領(lǐng)域中,在復(fù)雜語音環(huán)境下,幫助聽力障礙的人獲取正常人的聽力,正確分辨說話人的位置,選擇所聽取的語音信號。到了 20 世紀(jì) 70年代,隨著數(shù)字 信號處理理論的不斷發(fā)展,人們對語音增強(qiáng)技術(shù)的研究形成了一個高潮 ,些基礎(chǔ)性成果,這使語音增強(qiáng)發(fā)展 成為語音信號數(shù)字處理的一個重要分支。但由于各種算法計算量問 題,導(dǎo)致它們的實用性受到影響。 90 年代后,移動通信的飛速發(fā)展為語音增強(qiáng)研究提供了現(xiàn)實的動力,由于對之增強(qiáng)效果仍然不夠滿意,又進(jìn)行了新的嘗試。一直以來,針對不同的背景噪聲或者某個特殊的應(yīng)用要求,人們提出了各種新的語音增強(qiáng) 算法。 語音增強(qiáng) 算法可從信號輸入的通道數(shù)上分為單通道的語音增強(qiáng)算法與多通道的語音 強(qiáng)算法。這種情況下語音與噪聲同時存在一個通道中,語音信息與噪聲信息必須從同一個信號中得出。如果系統(tǒng)是一個多通道 的語音系統(tǒng),各個通道之陽極存在著某些相關(guān)的特性,這些相關(guān)特性對 語音增強(qiáng)的 處理十分有利。 多年來,人們對寬帶加性噪聲的模型進(jìn)行研究,提出了各種算法。語音增強(qiáng)的算法從處理方法上大體上可以分為 4 類 :噪聲對消法,基于語音譜特征的諧波增強(qiáng)法,基于短時譜幅度估計的語音增強(qiáng)算法和基于參數(shù)估計的語音合成法。通過語音增強(qiáng)技術(shù)來改善語音質(zhì)量的過程如圖 11 所示。 譜減法及其改進(jìn)算法是一種基于短時譜估計的語音增強(qiáng)算法,由于它的運(yùn)算量相對較小,容易實時 實現(xiàn),而且增強(qiáng)的效果也較好,是目前最常用的語音增強(qiáng)算法。 圖 11 語音增強(qiáng)處理改善語音質(zhì)量 主要研究內(nèi)容 本論文采用數(shù)字信號處理和聲學(xué)研究相結(jié)合的方法,圍 繞語音增強(qiáng)問題,展開研究工作。在對高級語言仿真程序進(jìn)行測試分析之后,在系統(tǒng)上實現(xiàn)語音信號的增強(qiáng)。 純凈語音 信道 干擾語音和背景噪聲 傳輸噪聲 語音增強(qiáng)處理 增強(qiáng)語音 4 第二章 語音增強(qiáng)的基礎(chǔ)知識 語音 信號處理是一門綜合性的學(xué)科,它研究如何用數(shù)字信號處理技術(shù)對語音信號進(jìn)行處理,包括四大分支 —— 語音識別,語音合成,語音編碼和語音增強(qiáng)。這里,簡要介紹一下語音信號處理的基礎(chǔ)知識。聲帶既是閥門,又是振動部件。聲帶開啟和閉合使氣流形成一系列脈沖?;l決定了聲音頻率的高低,隨發(fā)音人的性別、年齡及具體情況而定。 聲道是由咽、口腔和鼻腔組成,是一個分布參數(shù)系統(tǒng),可視為一諧振腔,它放大某一頻率而衰減其它頻率分量。這些諧振頻率稱為共振峰頻率,簡稱為共振峰,語音的頻率特性主要是由共振峰決定的。 人的聽覺特性 一個完整的語音通信系統(tǒng)總是涉及到說(語音的產(chǎn)生)和聽(語音的接收)兩個方面,正常人的聽覺系統(tǒng)是極為靈敏的,人耳所能感覺的最低聲壓接近空氣中分子熱運(yùn)動所產(chǎn)生的聲壓。當(dāng)兩個響度不同的聲音作用于人耳時,則響度較高頻率成分的存在會影響到人耳對響度較低頻率成分的感受,使其變得不易被覺察,稱之為掩蔽效應(yīng) (Masking effect)。對于目前的大多數(shù)研究和應(yīng)用,數(shù)學(xué)模型完全滿足要求,該模型中包括三個部分:激勵源、聲道模型和輻射模型。為了使?jié)嵋舻募钚盘柧哂新曢T氣流脈沖的實際波形,需要使上述的沖激序列通過一個聲門脈沖模型濾波器。 聲道模型 聲道可近似地看作是由多段均勻截面積的聲管級聯(lián)而成,采用流體力學(xué)的方法可以推導(dǎo)出, N 節(jié)級聯(lián)的無損聲管的系統(tǒng)函數(shù)是一個 N 階的全極點函數(shù): ?? ?? pi iizazv 01)( (21) 其中 0a = 1, ia 為實數(shù), p 為全極點濾波器的階。 輻射模型 基音頻率 周期脈沖發(fā)生器 聲門脈沖模型 G( Z) Av 隨機(jī)噪聲發(fā) 生器 Au 聲道模型 V(Z) 聲道參數(shù) 輻射模型 R(Z) 語音信號 s(n) 6 聲道的終端為口和唇,因此輻射模型與嘴型有關(guān)??诖降妮椛湫?yīng)可表示為: )1()( 10 ??? zRzR (22) 綜上所述,完整的語音信號數(shù)字模型可以用三個子模型:激勵模型、聲道模型和輻射模型的串 聯(lián)來表示。所以把每個短時的語音段稱為一個分析幀,對該幀進(jìn)行處理就相當(dāng)于對固定特性的持續(xù)語音進(jìn)行處理 。 預(yù)濾波、采樣、 A/D 變換 預(yù)濾波的目的有兩個: (1)抑制輸入信號各頻域分量中頻率超出 2sf (sf 為采樣率 )以防止混疊干擾。這樣,預(yù)濾波器必須是一個帶通濾波器,其上、下截至頻率分別是 Hf 和 Lf 。語音信號經(jīng)預(yù)濾波和采樣后,由 A/D 變換器變換為二進(jìn)制數(shù)字碼。w(n)。根據(jù)不同應(yīng)用,通常采用矩形窗、海明窗和漢寧窗等窗函數(shù)來逼近理想的頻率響應(yīng)。從應(yīng)用的角度來說,矩形窗有最高的頻域分辨率,但泄漏較高,海明窗可以有效克服泄漏7 現(xiàn)象,具有平滑的低通特性。假設(shè) s(n)的 DTFT 是 (exp( ))Sj? ,且 w(n)的 DTFT 是 (exp( ))Wj? ,那么 (exp( ))Sj? ? 是 (exp( ))Sj? 和 (exp( ))Wj? 的周期卷積。為了使 ()Sk? 具有較高的分辨率,所取的 DFT 以及相應(yīng)的 FFT 點數(shù) 1N 較 nws??? 的長度 N 要大。為了將 nws??? 的點數(shù)從 N 擴(kuò)大為 1N ,可以在擴(kuò)大的部分添 若干 的0 采樣值。可以由它的量值粗略判別語音信號的有無,同時也可以由它 判斷該幀是濁音還是清音。為了克服這個缺點,定義短時平均幅度 mM 來衡量語音幅度的變化。 短時過零率 短時過零率其定義為: ?????????????????1)()]1(s g n [)](s g n [)()]1(s g n [)](s g n [NnnmmnmnwnxnxmnwnxnxZ ( 27) 其中 sgn[短時過零率也可以表征清音幀與濁音幀,及區(qū)別語音的有無。一般實際應(yīng)用中多設(shè)置一個門限電平,以使過零率檢測有一定的抗干擾性。 語音特性 1. 語音是一個時變的、非平穩(wěn)隨機(jī)過程 人類發(fā)聲系統(tǒng)的生理結(jié)構(gòu)的變化速度是有限的,在 10~ 30ms 時間段內(nèi)具有相對穩(wěn)定性,可以認(rèn)為其特性是不變的,因此語音的短時譜分析也有相對穩(wěn)定性。 3. 語音感知對語音增強(qiáng)研究有重要作用 語音增強(qiáng)效果的最終度量是人的主觀感受。 (1)人耳對語音的感知是通過語音信號中各頻譜分量幅度獲得的,對各分量的相位則不敏感; 9 (2)人耳對頻譜分量強(qiáng)度的感受是頻率和能譜的二元函數(shù),響度與頻譜幅度的對數(shù)成正比; (3)人耳有掩蔽效應(yīng),掩蔽的程度是聲音強(qiáng)度與 頻率的二元函數(shù)。因此對語音信號進(jìn)行一定程度的低通濾波不會對可懂度造成影響。對于乘性噪聲,有些可以通過變換而轉(zhuǎn)變?yōu)榧有栽肼暋? 1. 周期性噪聲 具有許多離散的線譜,主要來源于發(fā)動機(jī)等周期性運(yùn)轉(zhuǎn)的機(jī)械,可以用梳狀濾波器予以抑制。 2. 脈沖噪聲 表現(xiàn)為時域波形中突然出現(xiàn)的窄脈沖,來源于爆作、撞擊和放電等。 3. 寬帶噪聲 寬帶噪聲來源很多,熱噪聲、氣流 (風(fēng)、呼吸 )噪聲及各種隨機(jī)噪聲源 ,量化噪聲也可視為寬帶噪聲。這種噪聲只有在語音間歇期才單獨存在。不具有白色頻譜的噪聲,可以先進(jìn)行預(yù)白化處理。但當(dāng)多個語音疊合在一起,在單信道傳輸時,雙耳信號因合并而消失。 語音增強(qiáng)效果的評價方法 語音增強(qiáng)效果可以用主觀測量或客觀測量來評價。 主觀評定方法符合人類聽話時對語音質(zhì)量的感覺,目前得到了廣泛的應(yīng)用。參加測試的實驗者在聽完所測語音后,從五個等級中選擇某一級作為他對所測語音質(zhì)量的評定。 DRT 是反映清晰度或可懂度的一種測試 方法,使用若干對同韻母進(jìn)行測試,其主要用于低速率語音編碼的質(zhì)量測試。 至于客觀測試方法,可以直接觀測語音的時域 /頻域波形,也可以給出客觀的數(shù)值度量,通常采用原始語音信號功率與歸一化后的增強(qiáng)語音和原始語音之差的功率比值來度量,簡稱信噪比 ( SNR) 。本文基于 MATLAB 對譜減法進(jìn)行設(shè)計和實現(xiàn)。 譜減法在頻域?qū)г胝Z音的功率譜減去噪聲的功率譜得到純凈語音功率譜估計,開方后就得到語音幅度譜估計,用帶噪語音的相位來近似純凈語音的相位,在采用反傅里葉變換恢復(fù)時域信號。 假定語音為平穩(wěn)信號,而噪聲和語音為加性信號且彼此不相關(guān)。因為減譜法不需分析語音信號的頻譜特性,所以本文采用矩形窗函數(shù)。語音增強(qiáng)的任務(wù)就是利用估計的噪聲功率譜信息,從 kY 中得到 kS 。減譜法的原理框圖如圖 31 所示: y( n) 經(jīng) FFT 變化后,有 k k kY S N= + ,由此可得 kkkkkkk NSNSNSY ?? ???? 222 (32) 其中, *表示共軛。對于一個分析幀內(nèi)的時平穩(wěn)過程,有: )(22 kSY nkk ??? (34) 其中, n? ?( k) 為無語音時 2kN 的統(tǒng)計平均值,即 n? ?( k) = 2kEN?????。當(dāng)信噪比高時,含語音的可能性很大,衰減小。 應(yīng)
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1