freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音信號端點檢測技術(shù)的研究畢業(yè)論文-預(yù)覽頁

2025-07-18 18:14 上一頁面

下一頁面
 

【正文】 的端點檢測方法。此方法的優(yōu)點是具有一定的魯棒性,但仍然存在信噪比低時的失效問題。文獻[14]中使用UMP(uniformly most powerful)根據(jù)LRT(likelihood ratio test)得出新的決策規(guī)則,再利用高斯分布和UMP對帶噪語音檢測語音段和非語音段[15]。目前的端點檢測算法大多只針對語音的某一個特征進行檢測[17],大量的文獻調(diào)研與實際研究發(fā)現(xiàn),現(xiàn)有的各種語音信號端點檢測技術(shù)都存在各自的不足,在低信噪比下檢測結(jié)果不是很令人滿意,有待進一步深入研究。第1章為緒論,主要介紹了語音端點檢測的研究背景、研究意義和研究動態(tài)。第4章介紹基于距離熵的語音端點檢測方法,此方法對帶噪語音信號進行一系列變換,得到倒譜系數(shù),再根據(jù)倒譜系數(shù)計算歐式距離,最后利用歐式距離建立熵。作用的方式有三種,第一種把從肺部呼出的直氣流變成音源,即變成交流的斷續(xù)流或者亂流;第二種是對音源起共振和反共振的作用,使它帶有音色;第三種是從嘴唇或鼻孔向空間輻射的作用。激勵的情況不同發(fā)不同性質(zhì)的音,激勵大致分為兩大類:濁音激勵和清音激勵。預(yù)加重的中心思想是利用信號特性和噪聲特性的差別來有效地對信號進行處理,目的是提升高頻部分,使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分析或聲道參數(shù)分析。目前絕大多數(shù)的語音信號處理技術(shù)均是在短時的基礎(chǔ)上對語音信號進行分幀處理,然后分別對每一幀提取特征參數(shù)段。圖22 幀長和幀移示意圖對語音信號進行分幀后要進行加窗操作,這是為了避免截斷效應(yīng)。在語音信號處理中最常用的兩種窗函數(shù)是矩形窗和漢明窗,它們的表達式分別為:(l)矩形窗 (23)(2)漢明窗 (24)N表示窗長,窗函數(shù)的選擇對于短時分析參數(shù)的特性影響很大。漢明窗的主瓣寬度比矩形窗大一倍,帶外衰減也比矩形窗大一倍多,矩形窗的譜平滑性能較好,但損失了高頻成分,使波形細節(jié)丟失。時域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,因為,進行語音分析時,時域波形最先接觸而且也最直觀,表示語音信號物理意義明確,運算量少,容易實現(xiàn), 語音信號的時域參數(shù)有短時能量,短時幅度,短時過零率,短時自相關(guān)函數(shù),短時平均幅度差函數(shù)等,下面分別對這些時域參數(shù)進行簡單介紹。短時過零率是指一幀語音中語音信號波形穿過零電平的次數(shù)。濾波器分析語音信號的頻譜具有一些優(yōu)點,使用簡單,實時性好,受外界環(huán)境的影響小。由于語音信號的特性是隨著時間緩慢變化,所以采用短時傅里葉變換,相應(yīng)的求得特征為短時頻域特征,這里的窗函數(shù)都使用漢明窗。由于語音信號可視為聲門激勵信號和聲道沖擊響應(yīng)的卷積,可以對語音信號進行解卷。熵H代表x的信息量,當(dāng)x的分布概率相等時,熵取最大值,也就是說,的概率分布越模糊,越難判斷,H值也越大。特征提取目的是將輸入信號轉(zhuǎn)化為特征參數(shù),然后利特征參數(shù)進行語音段與無聲段的區(qū)分。 影響語音端點檢測的原因及噪聲分類 影響語音端點檢測的原因?qū)嶋H環(huán)境中,影響語音端點檢測性能的因素主要有:(1)噪聲的影響實際環(huán)境中噪聲無處不在,甚至在安靜的實驗室中,敲打鍵盤聲!咳嗽都是噪聲,環(huán)境中的噪聲是復(fù)雜多變的,噪聲是非平穩(wěn)的隨機過程,其能量無法精確估計。(3)人的動作的影響發(fā)音時,人的順嘴聲或其他某些雜音會使語音波形產(chǎn)生一個很小的尖鋒,并可能超過所設(shè)計的門限值,此時人呼吸的氣流也會產(chǎn)生較高電平。起點處是弱摩擦音時或終點處是鼻音時,語音的特性與噪聲極其相似,其中鼻韻還拖得很長。乘性噪聲可以通過解卷積處理轉(zhuǎn)化為加性噪聲,所以一般只對加性噪聲加以討論。(1)穩(wěn)定噪聲:能量分布基本不隨時間改變的噪聲,例如,熱噪聲,機器穩(wěn)定轟鳴等,穩(wěn)定噪聲的能量序列是各態(tài)歷經(jīng)的平穩(wěn)高斯隨機序列。(5)階躍噪聲:能量分布呈臺階式陡變的噪聲,例如電信信道的突變,機器的開啟或關(guān)閉等,在階躍點后可歸類為穩(wěn)定、緩變或波動噪聲。相對的,其他不具有這一性質(zhì)的噪聲信號被稱為有色噪聲。例如,熱噪聲和散彈噪聲在很寬的頻率范圍內(nèi)具有均勻的功率譜密度,通??梢哉J為它們是白噪聲。如果一個噪聲,它的幅度分布服從高斯分布,而它的功率譜密度又是均勻分布的,則稱它為高斯白噪聲。由于語音是不穩(wěn)定的,所以,我們采用“短時能量”所謂短時能量,就是先對語音信號進行分幀處理,然后對每一幀分別求其能量。語音信號第i幀的短時能量可以用下面三種方法得到?;诙虝r能量的語音端點檢測方法只適用于非常純凈的語音信號,在信噪比很高時,噪聲很小,背景噪聲對應(yīng)的短時能量較小,接近于零,語音的能量比背景噪聲的能量大?;诙虝r能量的端點檢測在不同分貝噪聲下的仿真圖如圖圖31 純凈語音仿真圖圖32 15分貝火車噪聲仿真圖圖33 10分貝火車噪聲仿真圖圖34 5分貝火車噪聲仿真圖圖35 0分貝火車噪聲仿真圖基于時頻方差和的端點檢測方法[25],其本質(zhì)就是分別計算某一幀信號時域和頻域能量的方差,然后對時域和頻域能量方差進行求和,將時頻方差和作為特征參數(shù)檢測語音起點和終點。 (34)N為幀長,為消除突發(fā)脈沖噪聲的影響,對N為幀長,為消除突發(fā)脈沖噪聲的影響,對Xt(m)進行平滑,得到,平滑方法見式(35)。根據(jù)這一特征,可以很明顯地區(qū)分語音和噪聲。因此,可以利用短時頻帶方差來判斷語音的起止點。解決這一問題有兩種方法,一種是尋找更具普遍性的可以區(qū)分語音和噪聲的特征,另一種是把多個特征結(jié)合起來,利用多個特征參量共同檢測出語音的起止點[26]。短時能量特征需要和其它特征相結(jié)合使用。圖311 短時過零示意圖和短時能量一樣,短時過零率也是隨機參數(shù),對應(yīng)于無聲段!清音段以及濁音段,它們分別具有的短時過零率概率函數(shù)如圖312?;诙虝r能量和短時過零率的端點檢測方法充分利用過零率和能量特點,使用過零率檢測清音,用短時能量檢測濁音,兩者配合,而且采用雙門限判定法來檢測語音端點。譜減法是語音增強中最常用的一種方法,由于該算法的計算復(fù)雜度低,實時性強,一直受到了語音增強研究者的廣泛重視。圖315語音短時譜估計原理圖圖315中是的傅里葉系數(shù),是傅里葉系數(shù)的估計值。按照開始的假設(shè),干靜語音和噪聲是不相關(guān)的,所以,和兩者的乘積為零,則式(319)可以簡化為 (320)由于平穩(wěn)噪聲的功率譜在發(fā)聲前和發(fā)聲期基本沒有變化,可以通過發(fā)音前的語音幀來估計噪聲的功率譜,于是,可以從帶噪語音的功率譜中估計出干凈語音的功率譜。譜減法進行語音增強是較為傳統(tǒng)的方法,它對于整個語音段采用減去相同噪聲功率譜,.這樣處理的增強效果不是很理想,因為語音的能量一般集中在某些頻段,在這些頻段內(nèi)語音幅度較高,所以,使用譜減法進行增強后可能仍然會有較大的殘余噪聲,如果這些噪聲沒有消除掉的話就會產(chǎn)生純音噪聲。文獻[36]采用另一種應(yīng)用語音的多個特征參量的語音端點檢測算法,采用的語音特征參數(shù)是:短時能量、短時自相關(guān)和短時過零率,它針對漢語語音、非特定人、基于對噪聲的學(xué)習(xí),對白噪聲、脈沖噪聲、一般環(huán)境噪聲都有很好的魯棒性?;跁r頻方差和的檢測算法結(jié)合時域和頻域的方差兩個特征,在頻譜分布比較均勻的噪聲環(huán)境下,如白噪聲,性能較好,但在非平穩(wěn)噪聲環(huán)境下性能下降。設(shè)想有一組硬幣共10個,每一個硬幣有兩個面,擲出10個硬幣,每個硬幣可能正面向上或者是反面向上,兩個面是等價的,正面和反面朝上的概率都為1/2,擲硬幣時得到最有規(guī)律的狀態(tài)是10個都是正面或10個都是反面,這兩種狀態(tài)都只有一種構(gòu)型排列。對于不確定性比較大的事件,其發(fā)生后提供的信息量也比較大,相反的,對于不確定性比較小的事件包含的信息量也就比較小。熵在控制論、概率論、數(shù)論、天體物理、生命科學(xué)等領(lǐng)域都有重要應(yīng)用,是十分重要的參量[37],在不同的學(xué)科中也引申出的更為具體的定義。對帶噪語音信號,經(jīng)過分幀,加窗,傅里葉變換等操作后,便可得到其頻率分量氣的能量譜,每個頻率分量的頻譜概率密度函數(shù)表示。在某種程度上講,譜熵對噪聲具有一定的抗噪性。該算法通過一系列的變換得到每一點的倒譜系數(shù),再利用倒譜系數(shù)求得每一點的歐式距離,根據(jù)歐式距離計算概率密度函數(shù),最后將概率密度函數(shù)代入熵的計算公式求得距離熵,根據(jù)開始的和最后的無聲段的距離熵值的大小確定門限值,采用雙門限檢測出語音起止點。圖41為幾種基于短時傅里葉變換譜之間的關(guān)系。 (45)經(jīng)過觀察語音圖形可知帶噪語音的最前面一小段為純噪聲,不包含有用語音,可以利用這一段來近似估計噪聲的倒譜系數(shù)。 (48)根據(jù)向量Psum和矩陣H,則可計算出帶噪語音的概率密度函數(shù),用表示第i幀第j點的歸一化概率密度函數(shù),的計算方法見式(49)。,分幀的幀長為240,幀移為120,對每幀信號加240點的Hamming窗。平滑不僅可以使特征變化趨于平穩(wěn),而且可以防止突發(fā)脈沖噪聲的影響。門限值的確定方法如下,Num表示總的幀數(shù),a和b是由實驗得出的經(jīng)驗值。檢測時使用一個變量status表示當(dāng)前狀態(tài)。,每個干凈語音分別混合bueeaneer2噪聲、destroyerengine噪聲、pink噪聲、white噪聲4種噪聲,并且,每種噪聲環(huán)境下分別合成0db、5db、10db、15db四種信噪比的帶噪語音。 (412) (413)距離熵算法在不同噪聲情況下的仿真結(jié)果如下圖。
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1