freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

強(qiáng)背景噪聲環(huán)境下語(yǔ)音增強(qiáng)算法的研究及應(yīng)用畢業(yè)論文-資料下載頁(yè)

2025-06-25 01:36本頁(yè)面
  

【正文】 NR合成作為測(cè)試材料,噪聲選取平穩(wěn)白噪聲和非平穩(wěn)噪聲代表多說(shuō)話人(babble)噪聲。采樣頻率,算法參數(shù)如下選?。簬L(zhǎng),DFT長(zhǎng)度。,并和MS算法進(jìn)行了比較??疾榈念l率成分為(1kHz)。可以看出,估計(jì)的噪聲功率譜與真實(shí)噪聲功率譜并不完全相同,代表的是平均意義上的統(tǒng)計(jì);在低輸入信噪比和非平穩(wěn)噪聲環(huán)境下,本文算法較MS算法都能更迅速更準(zhǔn)確地跟蹤噪聲功率,并在一定程度上改善了過(guò)估計(jì)的現(xiàn)象。 白噪聲干擾下(INSNR=5dB)本文算法和MS算法性能比較 babble噪聲干擾下(INSNR=5dB)本文算法和MS算法性能比較,輸入信噪比由15dB迅速下降為5dB時(shí),本文快速估計(jì)算法和MS算法性能比較。圖(a)表示輸入的帶噪語(yǔ)音信號(hào),在第150幀時(shí),噪聲功率迅速增加,信噪比突然降低。圖(b)中,本文算法經(jīng)過(guò)很短的時(shí)間()即跟蹤上了噪聲的變化。 噪聲功率變化劇烈時(shí)本文算法和MS算法性能比較,本文快速估計(jì)算法噪聲功率譜估計(jì)的歸一化均方誤差對(duì)比。歸一化均方誤差NMSE定義如下: ( 326 )表 本文快速估計(jì)算法和MS算法的NMSE白噪聲babble噪聲白噪聲~babble噪聲SNR(dB)MS算法本文算法MS算法本文算法MS算法本文算法50515~5,在各種噪聲干擾環(huán)境下,本文算法的歸一化均方誤差均小于MS算法,尤其在輸入信噪比為5dB情況下,NMSE下降較大,客觀測(cè)試再一次證明了本文快速估計(jì)算法在低信噪比和非平穩(wěn)噪聲環(huán)境下的優(yōu)越性。 本章小結(jié)本章研究了影響語(yǔ)音增強(qiáng)算法性能重要因素之一的噪聲統(tǒng)計(jì)特性估計(jì)算法。首先,介紹了基于語(yǔ)音激活檢測(cè)的噪聲統(tǒng)計(jì)特性估計(jì)方法和直接噪聲統(tǒng)計(jì)特性估計(jì)方法的特點(diǎn),并闡述和分析了目前應(yīng)用比較廣泛的最小統(tǒng)計(jì)的估計(jì)算法。針對(duì)現(xiàn)有算法的過(guò)估計(jì)和跟蹤延時(shí)等問(wèn)題,提出了更適應(yīng)于低輸入信噪比和非平穩(wěn)噪聲干擾環(huán)境下的快速估計(jì)算法,并給出了詳細(xì)的測(cè)試結(jié)果。第4章 語(yǔ)音激活檢測(cè)算法研究第4章 語(yǔ)音激活檢測(cè)算法研究 本章引論人們?cè)谡f(shuō)話過(guò)程中,不可避免地存在很多間歇和停頓,因此語(yǔ)音是不連續(xù)的媒介。語(yǔ)音激活檢測(cè)(Voice Activity Detection),又稱(chēng)有語(yǔ)音無(wú)語(yǔ)音檢測(cè),是指采用一定的信號(hào)處理技術(shù),檢測(cè)出信號(hào)是否是語(yǔ)音信號(hào),或是信號(hào)中是否包含語(yǔ)音信號(hào)。語(yǔ)音激活檢測(cè)的應(yīng)用范圍非常廣泛,既可以在語(yǔ)音增強(qiáng)算法中為噪聲統(tǒng)計(jì)特性的估計(jì)、先驗(yàn)信噪比的計(jì)算等提供相關(guān)統(tǒng)計(jì)信息,也可以作為獨(dú)立的模塊應(yīng)用于變速率語(yǔ)音編碼,回聲抵消等系統(tǒng)中。本章主要針對(duì)語(yǔ)音激活檢測(cè)算法進(jìn)行研究。本章剩余章節(jié)按照如下方式組織:;(Uniformly Most Powerful)檢驗(yàn)的語(yǔ)音激活檢測(cè)算法;(Dual Tone Multiple Frequency)信號(hào)的生成與檢測(cè);最后是本章小結(jié)。 傳統(tǒng)語(yǔ)音激活檢測(cè)算法傳統(tǒng)的語(yǔ)音激活檢測(cè)算法的基本思想是提取某種能夠區(qū)分語(yǔ)音和噪聲的特征參數(shù),如能量,過(guò)零率等,通過(guò)和某一分界門(mén)限比較得到是否有語(yǔ)音的判決結(jié)果,也可依據(jù)多個(gè)特征參數(shù)進(jìn)行聯(lián)合判決。 語(yǔ)音激活檢測(cè)的一般方法 Annex B標(biāo)準(zhǔn), Annex A標(biāo)準(zhǔn)以及ETSI的GSM標(biāo)準(zhǔn)中都有傳統(tǒng)語(yǔ)音激活檢測(cè)算法模塊。 Annex B標(biāo)準(zhǔn)的語(yǔ)音激活檢測(cè)算法 Annex B[30]中推薦的語(yǔ)音激活檢測(cè)系統(tǒng)的功能框圖。 Annex B中推薦的語(yǔ)音激活檢測(cè)系統(tǒng)的功能框圖 Annex B標(biāo)準(zhǔn)的VAD采用短時(shí)全帶能量、短時(shí)低帶能量、LSF系數(shù)和短時(shí)過(guò)零率4種特征參數(shù)進(jìn)行語(yǔ)音激活檢測(cè)的判決。相應(yīng)的4種距離量度為:譜差異: ( 41 )全帶能量差異: ( 42 )低帶能量差異: ( 43 )短時(shí)過(guò)零率差異: ( 44 )其中,,分別為輸入的帶噪語(yǔ)音信號(hào)的第個(gè)線譜頻率,全帶能量,低帶能量,短時(shí)過(guò)零率。而,,為相應(yīng)的背景噪聲參數(shù)的更新估計(jì)。計(jì)算得4種距離量度后,否則判決為無(wú)語(yǔ)音,相關(guān)常量參見(jiàn)相關(guān)標(biāo)準(zhǔn)[30]。表 Annex B語(yǔ)音激活檢測(cè)判決條件列表然后,對(duì)初步判決結(jié)果進(jìn)行平滑,得到最終判決。最后,根據(jù)一定的條件對(duì)噪聲相關(guān)特征參數(shù)進(jìn)行更新。 Annex A標(biāo)準(zhǔn)的語(yǔ)音激活檢測(cè)算法 Annex A[31]中推薦的語(yǔ)音激活檢測(cè)系統(tǒng)的功能框圖。 Annex A中推薦的語(yǔ)音激活檢測(cè)系統(tǒng)的功能框圖 Annex A標(biāo)準(zhǔn)的VAD算法基本上是一個(gè)能量檢測(cè)器。將逆濾波器的輸出信號(hào)能量與一個(gè)閾值進(jìn)行比較,當(dāng)大于閾值時(shí),判定為有語(yǔ)音,否則判定為無(wú)語(yǔ)音。具體步驟如下: 逆濾波:將輸入信號(hào)用一個(gè)系數(shù)為的FIR濾波器進(jìn)行逆濾波的處理: ( 45 )其中,是經(jīng)過(guò)逆濾波處理的輸出信號(hào)。濾波后信號(hào)能量計(jì)算:通過(guò)下式計(jì)算經(jīng)過(guò)逆濾波后的信號(hào)的能量。 ( 46 )噪聲幅度計(jì)算:根據(jù)幀噪聲幅度和能量以及自適應(yīng)使能標(biāo)志,對(duì)第幀噪聲幅度進(jìn)行更新。第幀時(shí)的噪聲幅度被限制在范圍之內(nèi)。如果,則,否則。根據(jù)調(diào)整: ( 47 )此時(shí)。閾值計(jì)算:閾值與噪聲幅度有如下近似關(guān)系: ( 48 )VAD判決:通過(guò)對(duì)當(dāng)前幀的能量與閾值的比較進(jìn)行判決: ( 49 )拖尾延遲保護(hù):當(dāng)連續(xù)2幀或以上判決為語(yǔ)音時(shí),則在判決的語(yǔ)音段結(jié)束之后的6幀仍將作為語(yǔ)音段處理。 GSM標(biāo)準(zhǔn)的語(yǔ)音激活檢測(cè)算法GSM[32]標(biāo)準(zhǔn)中的語(yǔ)音激活檢測(cè)算法是基于多參數(shù)聯(lián)合判決的VAD 檢測(cè)算法, 所示。圖 GSM中推薦的語(yǔ)音激活檢測(cè)系統(tǒng)的功能框圖 基于高斯模型和一致最大勢(shì)檢驗(yàn)的語(yǔ)音激活檢測(cè)算法傳統(tǒng)的語(yǔ)音激活檢測(cè)方法往往建立在語(yǔ)音和噪聲的特征參數(shù)的區(qū)別假定上,比如語(yǔ)音的能量遠(yuǎn)遠(yuǎn)大于噪聲的能量,而噪聲的過(guò)零率又遠(yuǎn)遠(yuǎn)大于語(yǔ)音的過(guò)零率等等。但是在強(qiáng)背景噪聲環(huán)境下,語(yǔ)音可能完全淹沒(méi)在噪聲中,周期性噪聲的出現(xiàn)或是語(yǔ)音過(guò)零率較高時(shí),也會(huì)使兩者過(guò)零率之間的區(qū)別不再明顯。因此,傳統(tǒng)的語(yǔ)音激活檢測(cè)算法在低輸入信噪比以及非平穩(wěn)噪聲干擾環(huán)境下的誤檢率會(huì)提高,性能顯著惡化。 近年來(lái),Sohn等人[33]提出了基于統(tǒng)計(jì)模型的語(yǔ)音激活檢測(cè)方法,得到了較好的檢測(cè)效果。論文結(jié)合相關(guān)最新發(fā)表成果,研究了一種基于高斯統(tǒng)計(jì)模型和一致最大勢(shì)(UMP)檢驗(yàn)的語(yǔ)音激活檢測(cè)算法。該算法能夠改善上述惡劣環(huán)境下的檢測(cè)性能,同時(shí)仍然適用于平穩(wěn)噪聲及高信噪比環(huán)境。 基于高斯模型的似然比檢測(cè)假定語(yǔ)音和噪聲的頻譜分量滿足獨(dú)立的復(fù)高斯分布,并考慮加性噪聲。在語(yǔ)音不存在和語(yǔ)音存在兩種假設(shè)下,帶噪語(yǔ)音分別表示如下: ( 410 )其中,為幀長(zhǎng)。帶噪語(yǔ)音的頻譜分量在兩種條件下的分布分別為: ( 411 ) ( 412 )其中,和分別表示純凈語(yǔ)音和噪聲的功率譜分量。相應(yīng)地,在頻率成分的似然比(LR)為 ( 413 )其中,先驗(yàn)信噪比,后驗(yàn)信噪比。對(duì)似然比對(duì)數(shù)取幾何平均,得到 ( 414 )其中,為判決門(mén)限,為頻率成分?jǐn)?shù)。 一致最大勢(shì)檢驗(yàn)準(zhǔn)則 式(413)中,檢測(cè)量可以改寫(xiě)為 ( 415 )即如果 ( 416 ) 則得到判決為語(yǔ)音存在??紤]到,對(duì)式(416)取對(duì)數(shù)化簡(jiǎn)后,得到 ( 417 )即檢測(cè)條件為 ( 418 )通過(guò)噪聲功率譜估計(jì)可得,假定其為已知量,而在的條件下的單邊檢驗(yàn),存在一致最大勢(shì)(UMP)檢驗(yàn) [34],即當(dāng)給定虛警概率時(shí),此類(lèi)檢測(cè)產(chǎn)生最大的檢測(cè)概率,而且檢測(cè)門(mén)限值是與未知量無(wú)關(guān)的。因?yàn)檎Z(yǔ)音和噪聲的頻譜分量滿足獨(dú)立的復(fù)高斯分布,所以帶噪語(yǔ)音的頻譜分量也是高斯分布的。由復(fù)高斯分布的性質(zhì)知,帶噪語(yǔ)音的頻譜幅度滿足瑞利分布[34][35]。在和條件下,的概率分布分別如下: ( 419 ) ( 420 )其中,表示階躍函數(shù)。根據(jù)虛警概率的定義, ( 421 )而又由 ( 422 )得到檢測(cè)門(mén)限 ( 423 )可以看到,此自適應(yīng)檢測(cè)門(mén)限獨(dú)立于未知的純凈語(yǔ)音功率譜分量,只和虛警概率和噪聲功率譜估計(jì)相關(guān),因此能更好地適應(yīng)噪聲的變化,尤其是非平穩(wěn)噪聲環(huán)境。為了計(jì)算的方便,取檢測(cè)量為頻譜幅度的平方,并求各個(gè)頻率分量的平均,判決準(zhǔn)則如下: ( 424 ) 短時(shí)譜最優(yōu)化平滑以及自適應(yīng)門(mén)限平滑充分考慮語(yǔ)音的相關(guān)性能夠使語(yǔ)音激活檢測(cè)更準(zhǔn)確,因此需要對(duì)檢測(cè)量和檢測(cè)門(mén)限進(jìn)行有效的平滑。文獻(xiàn)[36]中對(duì)帶噪語(yǔ)音頻譜幅度采用了固定平滑因子進(jìn)行平滑,為了得到更好的檢測(cè)性能,論文算法借鑒噪聲統(tǒng)計(jì)特性估計(jì)中的自適應(yīng)最優(yōu)平滑方案,對(duì)短時(shí)譜進(jìn)行基于MMSE原則的最優(yōu)化平滑。 ( 425 )其中,分別表示第幀和第個(gè)頻率分量。得到最優(yōu)的平滑系數(shù)如下: ( 426 )其中,為調(diào)整因子。為前一幀的噪聲功率譜的估計(jì)值。,這里不再贅述。檢測(cè)門(mén)限是與噪聲估計(jì)自適應(yīng)的,所以,門(mén)限平滑采用固定平滑因子即可。平滑的自適應(yīng)門(mén)限如下: ( 427 )其中,為平滑因子。論文算法中,取 拖尾延遲保護(hù)(hangover)通過(guò)短時(shí)譜幅度平方和自適應(yīng)門(mén)限比較后得到了初步的VAD判決結(jié)果,但是初步判決有時(shí)存在著誤判的情況。當(dāng)把有語(yǔ)音誤判為無(wú)語(yǔ)音時(shí),造成了語(yǔ)音切斷的現(xiàn)象;相反,把無(wú)語(yǔ)音誤判為有語(yǔ)音時(shí),勢(shì)必會(huì)造成過(guò)多的殘留噪聲存在。為了降低誤判的概率,語(yǔ)音激活檢測(cè)算法中常引入拖尾延遲保護(hù)機(jī)制。論文算法在充分考慮語(yǔ)音相關(guān)性的基礎(chǔ)上,把輸入的帶噪語(yǔ)音分為三種狀態(tài),即語(yǔ)音狀態(tài)、噪聲狀態(tài)及語(yǔ)音和噪聲之間的轉(zhuǎn)換狀態(tài),并為語(yǔ)音狀態(tài)轉(zhuǎn)換為噪聲狀態(tài)以及噪聲狀態(tài)轉(zhuǎn)換為語(yǔ)音狀態(tài)分別設(shè)置了不同的延遲保護(hù)長(zhǎng)度。如果當(dāng)前幀的初步判決結(jié)果在保護(hù)長(zhǎng)度之內(nèi),則判定當(dāng)前幀為轉(zhuǎn)換狀態(tài),而初步判決結(jié)果作為累計(jì)值保存起來(lái);如果當(dāng)前幀的初步判決結(jié)果超出了保護(hù)長(zhǎng)度的范圍,則判定當(dāng)前幀為新的語(yǔ)音狀態(tài)或噪聲狀態(tài)。,T表示初步判決,VAD表示最終判決。拖尾延遲保護(hù)提供了由無(wú)語(yǔ)音到有語(yǔ)音的無(wú)條件迅速判決,而延遲了由有語(yǔ)音到無(wú)語(yǔ)音的判決時(shí)間,判決時(shí)間由轉(zhuǎn)換狀態(tài)的持續(xù)時(shí)間決定。這樣有效地保護(hù)了微弱語(yǔ)音以及字間的短暫停頓,有效地防止了切音現(xiàn)象,保證了語(yǔ)音的連貫悅耳。 拖尾延遲保護(hù)的狀態(tài)轉(zhuǎn)移圖 基于高斯模型和UMP檢驗(yàn)的VAD算法流程。首先對(duì)輸入的帶噪語(yǔ)音信號(hào)進(jìn)行分幀加窗處理,進(jìn)行DFT變化得到相關(guān)的頻譜系數(shù)。然后對(duì)短時(shí)譜進(jìn)行最優(yōu)化平滑并對(duì)噪聲功率譜進(jìn)行跟蹤估計(jì),利用式( 423 )和式( 427 )計(jì)算每個(gè)頻率分量的平滑的自適應(yīng)門(mén)限。最后,通過(guò)平均譜幅度平方和平均門(mén)限比較判決,得到初步的判決結(jié)果,經(jīng)拖尾延遲保護(hù)得到最終VAD判決結(jié)果。 基于高斯模型和UMP檢驗(yàn)的VAD算法流程流程圖 測(cè)試結(jié)果以及結(jié)論算法在低輸入信噪比和非平穩(wěn)噪聲環(huán)境下測(cè)試。將標(biāo)準(zhǔn)語(yǔ)音庫(kù)的語(yǔ)音材料與NOISEX92噪聲庫(kù)的噪聲材料根據(jù)SNR合成作為測(cè)試材料,噪聲選取平穩(wěn)噪聲代表白噪聲、粉紅噪聲以及非平穩(wěn)噪聲代表多說(shuō)話人(babble)噪聲。,輸入時(shí)的檢測(cè)判決結(jié)果。其中,圖(a)為原始純凈語(yǔ)音,圖(b)為帶噪語(yǔ)音,圖(c)為本文VAD算法判決結(jié)果,噪聲幀輸出為0,語(yǔ)音幀直接輸出帶噪語(yǔ)音,并用紅色框標(biāo)出。由此可見(jiàn),本文算法在低信噪比下有良好的檢測(cè)性能。 白噪聲干擾下本文VAD算法判決結(jié)果 粉紅噪聲干擾下本文VAD算法判決結(jié)果,輸入時(shí)本文算法和Sohn’s算法[33]的檢測(cè)性能比較。其中,圖(a)為原始純凈語(yǔ)音,圖(b)為帶噪語(yǔ)音,圖(c)為本文算法的判決結(jié)果,圖(d)為Sohn’s算法的判決結(jié)果。由于本文算法檢測(cè)門(mén)限和噪聲統(tǒng)計(jì)特性相適應(yīng),并且采用了合理的拖尾延遲保護(hù),因而得到了較準(zhǔn)確的判決結(jié)果,而Sohn算法把很多babble噪聲誤判為語(yǔ)音,造成錯(cuò)誤擴(kuò)散,檢測(cè)性能?chē)?yán)重下降。 babble噪聲干擾下本算法和Sohn’s算法檢測(cè)性能比較因此,基于高斯模型和UMP檢驗(yàn)的VAD算法在保持平穩(wěn)噪聲干擾下的高判決能力的同時(shí),針對(duì)非平穩(wěn)噪聲環(huán)境,相比同類(lèi)算法,也能夠提供較準(zhǔn)確的判決結(jié)果,檢測(cè)性能顯著提高。 雙音多頻信號(hào)的生成與檢測(cè)雙音多頻(Dual Tone Multiple Frequency)信號(hào)是美國(guó)ATamp。T貝爾實(shí)驗(yàn)室開(kāi)發(fā)的一種通訊傳輸方法,其在電話網(wǎng)絡(luò)領(lǐng)域的快速發(fā)展取代了脈沖信號(hào)。除了應(yīng)用于電話撥號(hào)系統(tǒng)中,DTMF信號(hào)在頻率編碼遙控系統(tǒng)及數(shù)據(jù)編碼傳輸中的應(yīng)用也很普遍。DTMF信號(hào)是指用兩個(gè)不同頻率的正弦信號(hào)來(lái)表示電話撥號(hào)鍵盤(pán)上的16個(gè)數(shù)字或字母信息。每個(gè)雙音多頻信號(hào)都由相應(yīng)的行頻率和列頻率而確定,并且對(duì)應(yīng)一個(gè)數(shù)字或字母,行頻率為低頻成分,列頻率為高頻成分。如數(shù)字信息“1”,只包含兩個(gè)頻率成分,分別為行頻697Hz,列頻1209Hz,理論上在其他頻率成分的能量為0。[37],DTMF信號(hào)發(fā)持續(xù)時(shí)間在45~55msec之間,信號(hào)發(fā)送間隔至少為45msec。 雙音多頻信號(hào)的行頻和列頻 雙音多頻信號(hào)的生成DTMF生成器由兩個(gè)二階數(shù)字正弦波振蕩器合成,每個(gè)振蕩器分別對(duì)應(yīng)行頻或列頻[38]。 DTMF生成器框圖為了得到每個(gè)數(shù)字或字母信息對(duì)應(yīng)的頻率,振蕩器需要合適的系數(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
數(shù)學(xué)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1