freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音信號端點檢測技術(shù)的研究畢業(yè)論文-資料下載頁

2025-06-24 18:14本頁面
  

【正文】 時頻方差和的檢測算法結(jié)合時域和頻域的方差兩個特征,在頻譜分布比較均勻的噪聲環(huán)境下,如白噪聲,性能較好,但在非平穩(wěn)噪聲環(huán)境下性能下降?;诙嗵卣鞯臋z測方法結(jié)合多種特征,有效的增強了算法的魯棒性,但同時也增強了算法的復(fù)雜度。 第4 章 基于距離熵的語音端點檢測算 法 第4章 基于距離熵的語音端點檢測算法熵的概念,是由德國物理學(xué)家魯?shù)婪蚩藙谛匏乖?850年首次提出的,熵的英語名字為entropy,希臘語源意為“內(nèi)向”,表示一個系統(tǒng)不受外部干擾時往內(nèi)部最穩(wěn)定狀態(tài)發(fā)展的特性。先來看一個例子。設(shè)想有一組硬幣共10個,每一個硬幣有兩個面,擲出10個硬幣,每個硬幣可能正面向上或者是反面向上,兩個面是等價的,正面和反面朝上的概率都為1/2,擲硬幣時得到最有規(guī)律的狀態(tài)是10個都是正面或10個都是反面,這兩種狀態(tài)都只有一種構(gòu)型排列。反之,如果是最混亂的情況,有5個正面5個反面,排列構(gòu)型可以有252種。事件發(fā)生的不確定性與它發(fā)生的概率存在著密切的關(guān)系。對于小概率事件,它的不確定性大,而對于大概率事件,它的不確定性小。對于不確定性比較大的事件,其發(fā)生后提供的信息量也比較大,相反的,對于不確定性比較小的事件包含的信息量也就比較小。一個體系完全均勻分布時,這個系統(tǒng)的不確定性就達(dá)到最大值。熵用來表示任何一種能量在空間中分布的均勻程度,是一個系統(tǒng)混亂程度的度量。熵是一個重要的物理概念,隨著科學(xué)交叉與綜合化的發(fā)展,它又遠(yuǎn)遠(yuǎn)超出了物理學(xué)范圍,在自然科學(xué)和社會科學(xué)眾多領(lǐng)域里得到了廣泛應(yīng)用,并成為一些新學(xué)科的理論基礎(chǔ)。熵在控制論、概率論、數(shù)論、天體物理、生命科學(xué)等領(lǐng)域都有重要應(yīng)用,是十分重要的參量[37],在不同的學(xué)科中也引申出的更為具體的定義。1948年,香農(nóng)()把關(guān)于熵的概念引入信息論中,把熵作為一個隨機事件的不確定性的量度。香農(nóng)指出,一個隨機事件準(zhǔn)確信息量應(yīng)該等于,其中為隨機變量發(fā)生的概率。熵是信息論中用于度量信息量的一個概念,一個系統(tǒng)越是有序,熵就越低,反之,一個系統(tǒng)越是混亂,熵就越高[38]。對帶噪語音信號,經(jīng)過分幀,加窗,傅里葉變換等操作后,便可得到其頻率分量氣的能量譜,每個頻率分量的頻譜概率密度函數(shù)表示。 (41)式中N為FFT變換的長度,因為語音的能量主要集中在250Hz到6000Hz之間,為了增強概率密度函數(shù)區(qū)分語音和非語音的能力,對上式加入一些約束條件。 (42)則第m幀的熵H計算方法為 (43)使用譜熵進行語音端點檢測實質(zhì)是通過檢測譜的平坦程度來區(qū)分有用語音和噪聲譜熵具有如下特征,語音信號的譜熵不同于噪聲信號的譜熵,理論上,如果譜的分布保持不變,語音信號幅值的大小不會影響歸一化概率密度函數(shù)。但實際上,語音譜熵隨語音隨機性而變化,與能量特征相比,譜熵的變化是很小的。在某種程度上講,譜熵對噪聲具有一定的抗噪性。熵是一種具有魯棒性的特征,具有一定的抗噪能力,因此很多研究者對熵進行研究,例如:一種叫做近似熵的端點檢測方法。由熵的計算公式可以看出要得到熵特征,關(guān)鍵要獲得適當(dāng)?shù)母怕拭芏群瘮?shù)。本文對經(jīng)典的基于譜熵的檢測算法進行改進,提出一種基于距離熵特征的端點檢測算法。該算法通過一系列的變換得到每一點的倒譜系數(shù),再利用倒譜系數(shù)求得每一點的歐式距離,根據(jù)歐式距離計算概率密度函數(shù),最后將概率密度函數(shù)代入熵的計算公式求得距離熵,根據(jù)開始的和最后的無聲段的距離熵值的大小確定門限值,采用雙門限檢測出語音起止點。對帶噪語音進行幀長為L幀移為INC的分幀操作,得到其幀數(shù)為N,分幀后得到的結(jié)果是一個大小為(幀數(shù)*幀長)的二維矩陣。 (44)(例如第一行的數(shù)據(jù)是第一幀的所有點,每一幀有L個點,表示第一幀的第一點)。對分幀后的每一幀語音加漢明窗。圖41為幾種基于短時傅里葉變換譜之間的關(guān)系。從圖中可以看出,通過對預(yù)處理后的帶噪語音的時域信號進行傅里葉變換,可以得到其頻域譜,對)進行自乘操作,則可得到頻域功率譜,對功率譜取對數(shù),然后進行逆傅里葉變換,則可得到帶噪語音每一點的倒譜系數(shù)。圖41幾種基于短時傅里葉變換譜之間的關(guān)系c(n)也是一個N*L的二維矩陣,見式(45)。和y(n)類似,是第一幀所有點的倒譜系數(shù)。 (45)經(jīng)過觀察語音圖形可知帶噪語音的最前面一小段為純噪聲,不包含有用語音,可以利用這一段來近似估計噪聲的倒譜系數(shù)。本文使用第1幀到第10幀的倒譜系數(shù)的平均值近似代替噪聲的倒譜系數(shù),噪聲的倒譜系數(shù)估計值計為。 (46)把倒譜系數(shù)的二維矩陣c(n)與噪聲倒譜系數(shù)估計向量c對應(yīng)點進行公式(47)的運算,式中的r和v是經(jīng)驗系數(shù),則可得到帶噪語音每一幀各點的距離H。 (47)計算矩陣H每一行所有點的和并用Psum表示,則Psum是長度為N的向量Psum的計算方法見式48。 (48)根據(jù)向量Psum和矩陣H,則可計算出帶噪語音的概率密度函數(shù),用表示第i幀第j點的歸一化概率密度函數(shù),的計算方法見式(49)。 (49)將每一點的概率密度代入熵的計算公式,則可以得到每一幀語音的距離熵DE為: (410)基于距離熵的端點檢測算法總共分為五部分,如圖42所示。圖42算法構(gòu)架對干凈語音進行加噪,并進行格式轉(zhuǎn)換,從Noisex92噪聲庫中選擇一部分噪聲,與干凈語音合成滿足實驗測試要求的帶噪語音。語音信號處理都是在語音短時特性基礎(chǔ)上進行研究,所以,在對帶噪語音進行變換前先對它進行一定的預(yù)處理,包括濾波、分幀、加窗等。,分幀的幀長為240,幀移為120,對每幀信號加240點的Hamming窗。這一部分的任務(wù)是對帶噪語音進行轉(zhuǎn)換,最終提取能夠明顯區(qū)分語音和噪聲的距離熵特征,傅里葉變換和逆傅里葉變換的參數(shù)為240點。無論采用哪一種端點檢測算法,可能提取的特征值大小變化快,從而產(chǎn)生檢測錯誤。為了消除這個缺陷,可以對特征進行平滑。平滑不僅可以使特征變化趨于平穩(wěn),而且可以防止突發(fā)脈沖噪聲的影響。本實驗對距離熵進行相鄰五幀動態(tài)平滑。 (411)帶噪語音的最前一段和最后一段為無聲段,為了能準(zhǔn)確的估計噪聲的特征,本文根據(jù)開始的第1到第10幀特征的平均值和最后面的倒數(shù)第1到第10幀特征的平均值進行門限值的設(shè)定,使用自適應(yīng)雙門限判別,較小門限值為tmin,較大門限值為tmax。采用雙閥值的策略有兩個方面的優(yōu)點,一方面:有利于增強端點檢測抗噪魯棒性,使得突發(fā)性噪聲對結(jié)果不會產(chǎn)生影響;另一方面:可以加大端點檢測精度。門限值的確定方法如下,Num表示總的幀數(shù),a和b是由實驗得出的經(jīng)驗值。圖43 檢測過程圖語音端點檢測的過程如圖43。將帶噪語音分為無聲段,過渡段,語音段, 結(jié)尾段四個部分,類似基于短時能量的檢測過程,采用雙門限進行起點和終點的檢測。,tmin、tmax為兩個閥值,且tamxtmin。檢測時使用一個變量status表示當(dāng)前狀態(tài)。最開始是靜音段,如果距離熵超過低門限tmin,就開始標(biāo)記起點,進入過渡段。過渡段時當(dāng)距離熵的大小回落到低門限以下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài),如果過渡段中距離熵的大小超過高門限,則認(rèn)為進入語音段。處于語音段時,如果距離熵小于低門限,而且總的計時長度小于最短時間長度,則認(rèn)為是一段噪音,繼續(xù)掃描以后的語音段,否則標(biāo)記端點。,每個干凈語音分別混合bueeaneer2噪聲、destroyerengine噪聲、pink噪聲、white噪聲4種噪聲,并且,每種噪聲環(huán)境下分別合成0db、5db、10db、15db四種信噪比的帶噪語音。聲音的位速為128kbps,音頻采樣大小為16位,頻道為單聲道,音頻的采樣級別為8kHz,音頻格式為PCM。對基于譜熵的檢測算法和本文提出的基于距離熵的端點檢測算法使用Matlab進行測試,得到不同信噪比下使用兩種算法對帶噪語音進行起點和終點檢測的準(zhǔn)確率。true_begin是起點檢測準(zhǔn)確的聲音個數(shù),true_end是終點檢測準(zhǔn)確的聲音個數(shù),count是用于測試的聲音總數(shù),p_begin表示起點檢測結(jié)果的準(zhǔn)確率,p_end表示終點檢測結(jié)果的準(zhǔn)確率,起點檢測準(zhǔn)確率采用式(412)計算,終點檢測準(zhǔn)確率采用式(413)計算。 (412) (413)距離熵算法在不同噪聲情況下的仿真結(jié)果如下圖。圖44 純凈語音距離熵算法仿真結(jié)果圖45 15分貝火車噪聲距離熵算法仿真結(jié)果圖46 10分貝火車噪聲距離熵算法仿真結(jié)果圖47 5分貝火車噪聲距離熵算法仿真結(jié)果圖48 0分貝火車噪聲距離熵算法仿真結(jié)果本章在基于譜熵的端點檢測方法的基礎(chǔ)上,提出了一種基于距離熵的檢測算法?;诰嚯x熵的端點檢測算法有效的利用了倒譜系數(shù)和熵的抗噪性,通過對帶噪語音進行一些處理獲得對應(yīng)的倒譜系數(shù),使用倒譜系數(shù)求得歐式距離,進一步使用歐式距離計算概率密度函數(shù),最后通過概率密度函數(shù)計算距離熵。對基于譜熵以及基于距離熵的端點檢測方法使用matlab進行仿真,實驗結(jié)果表明,基于譜熵的端點檢測算法,在平穩(wěn)高斯噪聲環(huán)境下能較有效的檢測出語音的兩個端點,而在其它不穩(wěn)定噪聲環(huán)境下,當(dāng)信噪比較低時,語音噪聲的特征基本無法區(qū)分,而基于距離熵的端點檢測算法,在各種噪聲環(huán)境下,均能得到較好的特征。
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1