freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語(yǔ)音信號(hào)端點(diǎn)檢測(cè)技術(shù)的研究畢業(yè)論文-閱讀頁(yè)

2025-07-09 18:14本頁(yè)面
  

【正文】 圖34 5分貝火車噪聲仿真圖圖35 0分貝火車噪聲仿真圖基于時(shí)頻方差和的端點(diǎn)檢測(cè)方法[25],其本質(zhì)就是分別計(jì)算某一幀信號(hào)時(shí)域和頻域能量的方差,然后對(duì)時(shí)域和頻域能量方差進(jìn)行求和,將時(shí)頻方差和作為特征參數(shù)檢測(cè)語(yǔ)音起點(diǎn)和終點(diǎn)。1. 時(shí)域方差由于語(yǔ)音信號(hào)是不穩(wěn)定的,首先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重、分幀、加窗等一些預(yù)處理。 (34)N為幀長(zhǎng),為消除突發(fā)脈沖噪聲的影響,對(duì)N為幀長(zhǎng),為消除突發(fā)脈沖噪聲的影響,對(duì)Xt(m)進(jìn)行平滑,得到,平滑方法見(jiàn)式(35)。 (39)使用公式(310)進(jìn)一步對(duì)進(jìn)行平滑。根據(jù)這一特征,可以很明顯地區(qū)分語(yǔ)音和噪聲。時(shí)頻方差和特征相當(dāng)于交流能量,它包含了兩個(gè)信息,各頻帶間的起伏程度和這一幀信號(hào)的短時(shí)能量。因此,可以利用短時(shí)頻帶方差來(lái)判斷語(yǔ)音的起止點(diǎn)。圖36 純凈語(yǔ)音仿真圖圖37 15分貝火車噪聲仿真圖圖38 10分貝火車噪聲仿真圖圖39 5分貝火車噪聲仿真圖圖310 0分貝火車噪聲仿真圖有些端點(diǎn)檢測(cè)算法在安靜環(huán)境下,可以達(dá)到較好的檢測(cè)效果,但是,一旦處于強(qiáng)噪聲環(huán)境下,性能下降速度很快,特別是處于多種噪聲的情況下。解決這一問(wèn)題有兩種方法,一種是尋找更具普遍性的可以區(qū)分語(yǔ)音和噪聲的特征,另一種是把多個(gè)特征結(jié)合起來(lái),利用多個(gè)特征參量共同檢測(cè)出語(yǔ)音的起止點(diǎn)[26]。在信噪比較低或者在一些特殊情況下,例如當(dāng)語(yǔ)音段的開(kāi)始和結(jié)束都是弱摩擦音時(shí),例如“四”字的開(kāi)始段的能量就比較小,以鼻音結(jié)尾的語(yǔ)音,其末端的短時(shí)能量也比較小,它們都容易與噪聲混淆。短時(shí)能量特征需要和其它特征相結(jié)合使用。短時(shí)過(guò)零率是語(yǔ)音信號(hào)時(shí)域分析中較簡(jiǎn)單的一種特征,它指每幀信號(hào)內(nèi)通過(guò)零值的次數(shù)。圖311 短時(shí)過(guò)零示意圖和短時(shí)能量一樣,短時(shí)過(guò)零率也是隨機(jī)參數(shù),對(duì)應(yīng)于無(wú)聲段!清音段以及濁音段,它們分別具有的短時(shí)過(guò)零率概率函數(shù)如圖312。短時(shí)過(guò)零率可以區(qū)別語(yǔ)音是清音還是濁音[30?;诙虝r(shí)能量和短時(shí)過(guò)零率的端點(diǎn)檢測(cè)方法充分利用過(guò)零率和能量特點(diǎn),使用過(guò)零率檢測(cè)清音,用短時(shí)能量檢測(cè)濁音,兩者配合,而且采用雙門(mén)限判定法來(lái)檢測(cè)語(yǔ)音端點(diǎn)?;诙虝r(shí)過(guò)零率和短時(shí)能量的端點(diǎn)檢測(cè)在不同分貝噪聲下的仿真圖如圖。譜減法是語(yǔ)音增強(qiáng)中最常用的一種方法,由于該算法的計(jì)算復(fù)雜度低,實(shí)時(shí)性強(qiáng),一直受到了語(yǔ)音增強(qiáng)研究者的廣泛重視。語(yǔ)音信號(hào)雖然是非平穩(wěn)隨機(jī)過(guò)程,但在10~30ms的分析幀內(nèi)可以近似看成是平穩(wěn)的如果能從帶噪語(yǔ)音的短時(shí)譜中估計(jì)出“純凈”語(yǔ)音的短時(shí)譜,則可達(dá)到增強(qiáng)的目的。圖315語(yǔ)音短時(shí)譜估計(jì)原理圖圖315中是的傅里葉系數(shù),是傅里葉系數(shù)的估計(jì)值。以加性噪聲為代表進(jìn)行分析,則干凈語(yǔ)音、噪聲、帶噪語(yǔ)音三者之間的加性模型滿足。按照開(kāi)始的假設(shè),干靜語(yǔ)音和噪聲是不相關(guān)的,所以,和兩者的乘積為零,則式(319)可以簡(jiǎn)化為 (320)由于平穩(wěn)噪聲的功率譜在發(fā)聲前和發(fā)聲期基本沒(méi)有變化,可以通過(guò)發(fā)音前的語(yǔ)音幀來(lái)估計(jì)噪聲的功率譜,于是,可以從帶噪語(yǔ)音的功率譜中估計(jì)出干凈語(yǔ)音的功率譜。 (323)對(duì)進(jìn)行反傅里葉變換,就可以得到降噪后的語(yǔ)音信號(hào)。譜減法進(jìn)行語(yǔ)音增強(qiáng)是較為傳統(tǒng)的方法,它對(duì)于整個(gè)語(yǔ)音段采用減去相同噪聲功率譜,.這樣處理的增強(qiáng)效果不是很理想,因?yàn)檎Z(yǔ)音的能量一般集中在某些頻段,在這些頻段內(nèi)語(yǔ)音幅度較高,所以,使用譜減法進(jìn)行增強(qiáng)后可能仍然會(huì)有較大的殘余噪聲,如果這些噪聲沒(méi)有消除掉的話就會(huì)產(chǎn)生純音噪聲。使用多種特征進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)成為這方面研究的一種趨勢(shì),文獻(xiàn)[34]提出一種方法,綜合采用了語(yǔ)音信號(hào)中的4個(gè)相互之間獨(dú)立性強(qiáng)的特征:短時(shí)能量、倒譜距離、能量譜方差和能量熵特征,有效地改進(jìn)傳統(tǒng)的基于單一語(yǔ)音特征方法的缺陷。文獻(xiàn)[36]采用另一種應(yīng)用語(yǔ)音的多個(gè)特征參量的語(yǔ)音端點(diǎn)檢測(cè)算法,采用的語(yǔ)音特征參數(shù)是:短時(shí)能量、短時(shí)自相關(guān)和短時(shí)過(guò)零率,它針對(duì)漢語(yǔ)語(yǔ)音、非特定人、基于對(duì)噪聲的學(xué)習(xí),對(duì)白噪聲、脈沖噪聲、一般環(huán)境噪聲都有很好的魯棒性。圖316 “長(zhǎng)度”語(yǔ)音的仿真圖圖317 “圖像”語(yǔ)音的仿真圖 本章小結(jié)本章詳細(xì)介紹了幾種語(yǔ)音端點(diǎn)檢測(cè)算法,包括基于短時(shí)能量的端點(diǎn)檢測(cè)算法、基于時(shí)頻方差和的端點(diǎn)檢測(cè)算法、基于多特征相結(jié)合的檢測(cè)算法?;跁r(shí)頻方差和的檢測(cè)算法結(jié)合時(shí)域和頻域的方差兩個(gè)特征,在頻譜分布比較均勻的噪聲環(huán)境下,如白噪聲,性能較好,但在非平穩(wěn)噪聲環(huán)境下性能下降。 第4 章 基于距離熵的語(yǔ)音端點(diǎn)檢測(cè)算 法 第4章 基于距離熵的語(yǔ)音端點(diǎn)檢測(cè)算法熵的概念,是由德國(guó)物理學(xué)家魯?shù)婪蚩藙谛匏乖?850年首次提出的,熵的英語(yǔ)名字為entropy,希臘語(yǔ)源意為“內(nèi)向”,表示一個(gè)系統(tǒng)不受外部干擾時(shí)往內(nèi)部最穩(wěn)定狀態(tài)發(fā)展的特性。設(shè)想有一組硬幣共10個(gè),每一個(gè)硬幣有兩個(gè)面,擲出10個(gè)硬幣,每個(gè)硬幣可能正面向上或者是反面向上,兩個(gè)面是等價(jià)的,正面和反面朝上的概率都為1/2,擲硬幣時(shí)得到最有規(guī)律的狀態(tài)是10個(gè)都是正面或10個(gè)都是反面,這兩種狀態(tài)都只有一種構(gòu)型排列。事件發(fā)生的不確定性與它發(fā)生的概率存在著密切的關(guān)系。對(duì)于不確定性比較大的事件,其發(fā)生后提供的信息量也比較大,相反的,對(duì)于不確定性比較小的事件包含的信息量也就比較小。熵用來(lái)表示任何一種能量在空間中分布的均勻程度,是一個(gè)系統(tǒng)混亂程度的度量。熵在控制論、概率論、數(shù)論、天體物理、生命科學(xué)等領(lǐng)域都有重要應(yīng)用,是十分重要的參量[37],在不同的學(xué)科中也引申出的更為具體的定義。香農(nóng)指出,一個(gè)隨機(jī)事件準(zhǔn)確信息量應(yīng)該等于,其中為隨機(jī)變量發(fā)生的概率。對(duì)帶噪語(yǔ)音信號(hào),經(jīng)過(guò)分幀,加窗,傅里葉變換等操作后,便可得到其頻率分量氣的能量譜,每個(gè)頻率分量的頻譜概率密度函數(shù)表示。 (42)則第m幀的熵H計(jì)算方法為 (43)使用譜熵進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)實(shí)質(zhì)是通過(guò)檢測(cè)譜的平坦程度來(lái)區(qū)分有用語(yǔ)音和噪聲譜熵具有如下特征,語(yǔ)音信號(hào)的譜熵不同于噪聲信號(hào)的譜熵,理論上,如果譜的分布保持不變,語(yǔ)音信號(hào)幅值的大小不會(huì)影響歸一化概率密度函數(shù)。在某種程度上講,譜熵對(duì)噪聲具有一定的抗噪性。由熵的計(jì)算公式可以看出要得到熵特征,關(guān)鍵要獲得適當(dāng)?shù)母怕拭芏群瘮?shù)。該算法通過(guò)一系列的變換得到每一點(diǎn)的倒譜系數(shù),再利用倒譜系數(shù)求得每一點(diǎn)的歐式距離,根據(jù)歐式距離計(jì)算概率密度函數(shù),最后將概率密度函數(shù)代入熵的計(jì)算公式求得距離熵,根據(jù)開(kāi)始的和最后的無(wú)聲段的距離熵值的大小確定門(mén)限值,采用雙門(mén)限檢測(cè)出語(yǔ)音起止點(diǎn)。 (44)(例如第一行的數(shù)據(jù)是第一幀的所有點(diǎn),每一幀有L個(gè)點(diǎn),表示第一幀的第一點(diǎn))。圖41為幾種基于短時(shí)傅里葉變換譜之間的關(guān)系。圖41幾種基于短時(shí)傅里葉變換譜之間的關(guān)系c(n)也是一個(gè)N*L的二維矩陣,見(jiàn)式(45)。 (45)經(jīng)過(guò)觀察語(yǔ)音圖形可知帶噪語(yǔ)音的最前面一小段為純?cè)肼?不包含有用語(yǔ)音,可以利用這一段來(lái)近似估計(jì)噪聲的倒譜系數(shù)。 (46)把倒譜系數(shù)的二維矩陣c(n)與噪聲倒譜系數(shù)估計(jì)向量c對(duì)應(yīng)點(diǎn)進(jìn)行公式(47)的運(yùn)算,式中的r和v是經(jīng)驗(yàn)系數(shù),則可得到帶噪語(yǔ)音每一幀各點(diǎn)的距離H。 (48)根據(jù)向量Psum和矩陣H,則可計(jì)算出帶噪語(yǔ)音的概率密度函數(shù),用表示第i幀第j點(diǎn)的歸一化概率密度函數(shù),的計(jì)算方法見(jiàn)式(49)。圖42算法構(gòu)架對(duì)干凈語(yǔ)音進(jìn)行加噪,并進(jìn)行格式轉(zhuǎn)換,從Noisex92噪聲庫(kù)中選擇一部分噪聲,與干凈語(yǔ)音合成滿足實(shí)驗(yàn)測(cè)試要求的帶噪語(yǔ)音。,分幀的幀長(zhǎng)為240,幀移為120,對(duì)每幀信號(hào)加240點(diǎn)的Hamming窗。無(wú)論采用哪一種端點(diǎn)檢測(cè)算法,可能提取的特征值大小變化快,從而產(chǎn)生檢測(cè)錯(cuò)誤。平滑不僅可以使特征變化趨于平穩(wěn),而且可以防止突發(fā)脈沖噪聲的影響。 (411)帶噪語(yǔ)音的最前一段和最后一段為無(wú)聲段,為了能準(zhǔn)確的估計(jì)噪聲的特征,本文根據(jù)開(kāi)始的第1到第10幀特征的平均值和最后面的倒數(shù)第1到第10幀特征的平均值進(jìn)行門(mén)限值的設(shè)定,使用自適應(yīng)雙門(mén)限判別,較小門(mén)限值為tmin,較大門(mén)限值為tmax。門(mén)限值的確定方法如下,Num表示總的幀數(shù),a和b是由實(shí)驗(yàn)得出的經(jīng)驗(yàn)值。將帶噪語(yǔ)音分為無(wú)聲段,過(guò)渡段,語(yǔ)音段, 結(jié)尾段四個(gè)部分,類似基于短時(shí)能量的檢測(cè)過(guò)程,采用雙門(mén)限進(jìn)行起點(diǎn)和終點(diǎn)的檢測(cè)。檢測(cè)時(shí)使用一個(gè)變量status表示當(dāng)前狀態(tài)。過(guò)渡段時(shí)當(dāng)距離熵的大小回落到低門(mén)限以下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài),如果過(guò)渡段中距離熵的大小超過(guò)高門(mén)限,則認(rèn)為進(jìn)入語(yǔ)音段。,每個(gè)干凈語(yǔ)音分別混合bueeaneer2噪聲、destroyerengine噪聲、pink噪聲、white噪聲4種噪聲,并且,每種噪聲環(huán)境下分別合成0db、5db、10db、15db四種信噪比的帶噪語(yǔ)音。對(duì)基于譜熵的檢測(cè)算法和本文提出的基于距離熵的端點(diǎn)檢測(cè)算法使用Matlab進(jìn)行測(cè)試,得到不同信噪比下使用兩種算法對(duì)帶噪語(yǔ)音進(jìn)行起點(diǎn)和終點(diǎn)檢測(cè)的準(zhǔn)確率。 (412) (413)距離熵算法在不同噪聲情況下的仿真結(jié)果如下圖?;诰嚯x熵的端點(diǎn)檢測(cè)算法有效的利用了倒譜系數(shù)和熵的抗噪性,通過(guò)對(duì)帶噪語(yǔ)音進(jìn)行一些處理獲得對(duì)應(yīng)的倒譜系數(shù),使用倒譜系數(shù)求得歐式距離,進(jìn)一步使用歐式距離計(jì)算概率密度函數(shù),最后通過(guò)概率密度函數(shù)計(jì)算距離熵。
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1