freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

語音端點檢測算法的研究及matla程序仿真與實現(xiàn)畢業(yè)設計(文件)

2025-07-10 08:21 上一頁面

下一頁面
 

【正文】 =length(x2) x2(end+1)=x1(end)+countsilence/21。 elseif amp(n) amp2 | ... % 可能處于語音段 zcr(n) zcr2 status = 1。 switch status case {0,1} % 0 = 靜音, 1 = 可能開始 if amp(n) amp1 % 確信進入語音段 x1(end+1) = max(ncount1,1)。amp2 = min(amp2, max(amp)/8)。diffs = (tmp1 tmp2)。silence = 0。maxsilence = 8。%指定幀移amp1 = 10。 x = double(x)。)。本次畢業(yè)設計自始至終是在他們的指導和幫助下完成的,在此,再一次向他們致以深深的敬意和感謝!再次衷心感謝所有關心和幫助我的老師和同學和朋友們致以最誠摯的謝意!附錄程序%過零率和短時能量clear all。在畢業(yè)設計過程中,使我學到很多新的知識,同時也加深了以前所學的知識,讓我理解和學習了語音端點檢測這項語音信號處理技術,積累了寶貴的經驗。語音產業(yè)需要更加開放的環(huán)境,使有興趣和實力的企業(yè)都能加入到這方面的研究和開發(fā)中,逐步改變。(2)首先進行了傳統(tǒng)的基于短時能量和過零率的語音端點算法研究,在高、低兩種噪聲比進行了實驗仿真。隨后的仿真實驗驗證了在嘈雜的環(huán)境下,基于熵譜的算法能夠很好的進行端點檢測。信號倒譜的一種定義是信號的能量譜密度函數(shù)s(ω)的對數(shù)的傅里葉反變換,或者可以將信s(n)的倒譜c(n)看成是logS(ω)的傅里葉級數(shù)展開,倒譜能很好表示語音的特征,因此在大多數(shù)語音識別系統(tǒng)中選擇倒譜系數(shù)作為輸入特征矢量。又根據(jù)三種端點檢測算法的matlab 仿真過程,得出三種算法的優(yōu)缺點,其如表31所示:表31 語音端點檢測算法比較算法類別優(yōu)點缺點測評基于能零率算法(1)原理簡單(2)運算量小,便于實時實現(xiàn)(1)近適應于平穩(wěn)噪聲的檢測,對于不同噪聲的魯棒性差(2)只能檢測高信噪比的語音一般基于倒譜特征算法(1)原理簡單(2)特征參數(shù)受語音信號時域、頻域參數(shù)變化影響小,魯棒性較好(1)當噪聲與語音信號的相應特征參數(shù)差別不大時,方法失效(2)對于清音的檢測效果一般一般基于譜熵特征算法(1)大多數(shù)算法運算量較小,便于實時實現(xiàn)(2)能夠實現(xiàn)低信噪比平穩(wěn)噪聲環(huán)境下帶噪語音信號的檢測(1)當噪聲與語音先好的時域或頻域分布類似時。e)f)圖312 高低信噪比基于不同算法的語音端點檢測仿真在低信噪比下,基于能零比雖能夠稍微顯示噪聲信號與語音信號的不同,但在過零率和短時能量則顯示比較平緩,不能清晰的進行端點檢測。 算法比較在語音識別系統(tǒng)中產生錯誤識別的原因之一是端點檢測有誤差,在高信噪比情況下,正確地確定語音的端點并不困難。對于頻帶寬度受限的情況而言,例如語音信號的頻率主要集中在300Hz~3400Hz,所以在此范圍內,則認為語音信號的隨機事件比較多,平均信息量大,熵值大,在背景噪聲在此頻率范圍受限的情況下,則熵值較小。(5)設置判決門限。該算法最簡單的實現(xiàn)原理框圖如下圖39所示:預加重分幀加窗求功率譜概率密度求語音信號譜熵值圖39 譜熵語音端點檢測實現(xiàn)原理框圖其大概檢測思路如下:(1)首先對語音信號進行分幀加窗、取FFT變換的點數(shù)。另外,由于每個頻率分量在求其概率密度函數(shù)的時侯都經過了歸一化處理,所以從這一方面也證明了語音信號的譜熵只會與語音分布有關,而不會與幅度大小有關。 (2)理論上,如果譜的分布保持不變,語音信號幅值的大小不會影響歸一化。若其發(fā)生的概率越大,其包含的信息量就越大。如圖37所示:圖37 安靜環(huán)境下倒譜特征端點檢測我們對語音信號加長度為語音長度的一序列參數(shù)來模擬噪聲,以降低信噪比來進行仿真,如圖38:圖38 加噪后的倒譜端點檢測從圖37中看出,在安靜環(huán)境倒譜語音端點檢測效果不是太好,但仍能語音段的倒譜特征與噪聲段的倒譜特征有明顯的不同。如果在進入語音段后,持續(xù)的時間小于最短語音,則被認為是噪聲,當結束后,持續(xù)的時間小于最短靜音,則被認為是語音還沒結束,則繼續(xù)語音信號的檢測 基于倒譜特征的語音端點檢測試驗分析倒譜能很好表示語音的特征,因此在大多數(shù)語音識別系統(tǒng)中選擇倒譜系數(shù)作為輸入特征矢量,在噪聲環(huán)境下短時能量與其它特征參數(shù)都不能很好地區(qū)分語音段與非語音段,因此采用倒譜系數(shù)來作為端點檢測的參數(shù)。從步驟上來看,可以把一個語音信號分成四個階段,靜音、開始過渡結束四個階段。其中T2為比較低的門限,其數(shù)值比較小,對信號的變化比較敏感,很容易就會超過。如果當前幀的值大于,則記錄該幀位置為start,然后繼續(xù)計算后面各幀的值,若在該幀之后若干幀以內,有連續(xù)三幀的值都大于,則認為start為語音的起點,否則繼續(xù)搜索。(3)逐幀計算值:對每一幀先計算出它的倒譜系數(shù),由它的倒譜系數(shù)和估計的噪聲倒譜系數(shù)計算當前幀的倒譜距離。然后對其加窗分幀,窗函數(shù)用的是漢明窗,一幀的是240個采樣點,80點的幀移,也就是三分之一的幀移。由其原理得出計算公式,如下: (321) (322) (k1) (323)式中表示倒譜系數(shù),表示美爾倒譜系數(shù),n為迭代次數(shù),k為倒譜階數(shù),一般n=k。LPC倒譜是由線性預測法而發(fā)展過來的。 LPC倒譜 LPC系數(shù)推測和估計語音信號的倒譜,這也是語音信號短時倒譜分析中一種比較特殊的處理方法。語音信號分幀采樣后,各個語音樣點之間存在著聯(lián)系,可以用前幾幀的采樣點來預測當前幀或者后幾幀的樣點值,即可以用先前的幀的參數(shù)值通過線性組合來近擬后面的幀的采樣值。 LPC倒譜特征 本文選用LPC倒譜特征,其基本的原理是由線性預測系數(shù)而推出的倒譜系數(shù),線性預測系數(shù)有較快的計算速度,沒有傅里葉變換中的復雜卷積,使其保持較高的檢測速度。首先,假定前幾幀信號是背景噪聲,計算這些幀的倒譜系數(shù)矢量,利用前幾幀倒譜矢量的平均值可估計背景噪聲的倒譜矢量,噪聲倒譜矢量的近似值可按規(guī)則311進行更新,即當前幀被認為是非語音幀: (311),ct為當前測試幀的倒譜矢量, p為調節(jié)參數(shù)。 倒譜距離設信號s(n) ,其倒譜變換為c(n)。 基于倒譜特征的語音端點檢測 倒譜特征在語音識別系統(tǒng)中,不管是語音識別還是語音檢測,倒譜這個特征參數(shù)要比短時能量和過零率含有更高的信息量,也更容易與噪聲信號區(qū)分開來,因此有許多端點檢測的方法都是基于倒譜特征來進行的。如圖所示:圖35 高信噪比能零率的語音端點檢測圖36 低信噪比能零率的語音端點檢測因為是在比較安靜的環(huán)境的情況下錄得語音,所以信噪比比較高。文中加Hmmaing窗,通過特性為()的濾波器預加重。兩個語音字之間發(fā)音是有一定的時間間隔,因此也需設定最短靜音,如果處于靜音段,而其長度小于最短靜音,則認為語音還沒結束,繼續(xù)語音段的檢測。我們所設置的最短語音和最短靜音就是為了防止一些突發(fā)性的噪聲。從步驟上來看,可以把一個語音信號分成四個階段,靜音、開始過渡結束四個階段。如果低于這個門限,則語音信號有可能進入語音結束,再往后搜索,如果繼續(xù)降低且低于較低的門限,則語音信號進入無聲階段。(2)由特征參數(shù)值,先選一個比較低一點的門限,進行最先的預判,如果低于這個門限肯定不是語音信號。通常每一個參數(shù)設兩個門限?;诙虝r能量和短時過零率相結合語音端點檢測方法,充分利用能量和過零率的優(yōu)點,使用過零率區(qū)分清音和靜音。當發(fā)清音時,多數(shù)能量出現(xiàn)在較高頻率上,而高頻就意味著高的平均過零率。由語音信號的波峰波谷之間的變化,然后對其進行歸一化處理,波峰波谷之間的變化轉為穿過橫軸的次數(shù),也是穿過零軸的次數(shù),稱為短時過零率。短時能量函數(shù)可用來區(qū)分清音段和濁音段。語音信號的短時能量可用以下幾種算法得到: (34) (35) (36)在計算機上實現(xiàn)仿真時,幅度表現(xiàn)為波形的高度,高能量的信號波峰高,而低能量的信號波峰比較低,進行端點檢測時,設置門限則根據(jù)波峰的高度來設置。明智的解決辦法就是每次取一段數(shù)據(jù),進行分析,然后再取下一段數(shù)據(jù),再進行分析,這樣通過語音信號與窗函數(shù)相乘等出一個類似窗的函數(shù)值,在此幀的前面幀和后面的幀都為零值,這樣是語音信號保持了短時性。令,則有: (32)式中,h(n)為窗函數(shù),其有一定的長度。語音信號不是穩(wěn)定的,所以要經過分幀。由于清音能量比較小,會常常把其與無聲混淆。流程圖如圖32所示: 噪聲估計信噪比估計端點檢測短時能量和過零率熵譜算法倒譜算法 高信噪比 低信噪比圖32 算法研究流程圖 基于短時能量和短時過零率的語音端點檢測傳統(tǒng)常用的短時能量和過零率相結合的算法通常利用用短時能量來檢測濁音、短時過零率來檢測清音,或者兩者相配合以便實現(xiàn)語音信號信噪比較大情況下的端點檢測。譜熵的大小取決的是功率譜的方差不是其大小,如果譜的分布保持不變,信號幅值的大小不會影響歸一化譜概率密度函數(shù),因而譜熵對于噪聲有一定的魯棒性。此外,基于自適應門限的方法也歸入這一類;(2)變換域參數(shù)方法 包括基于頻域參數(shù)、時頻域參數(shù)及小波域參數(shù)的方法。以上特征分別是從語音端點檢測的自適應性、準確性、穩(wěn)定性、和運算量上對算法提出要求。設定一定的門限后,當超過設定值,而且超過最小語音段的幾幀也可以超過設定值,則會被認為是語音信號。人的語音又可以分為清音和濁音兩類,其在能量上就可以分出來,而清音和濁音在短時過零率上可以分別出來。語音是人體所發(fā)出的聲音,其物理原理是源于聲帶的振動。端點判決就是根據(jù)噪聲和語音特征參數(shù)的不同,設置一定的門限,再設置一些相應的最短語音段以方便檢測。得到一個語音信號,先對其進行預處理,使低頻和高頻在信噪比參數(shù)上表現(xiàn)的平滑,易于檢測。在語音識別系統(tǒng)中,正確的檢測出語音端點,不僅能夠快速且準確的進行語音識別,而且能夠減小計算量,排除無聲段干擾,實驗發(fā)現(xiàn),不管在什么環(huán)境或者什么樣信噪比的環(huán)境下,語音端點檢測的錯誤將導致語音識別的錯誤。語音信號為時域信號,分幀則有助于計算語音信號的各個參數(shù)特征,可以對語音信號進行平滑處理,是進行語音端點檢測必不可少的步驟。它們的定義如下: 矩形窗: (210)漢明窗: (211)漢寧窗: (212)式中N為窗長,窗函數(shù)的選取(形狀和長度)對于短時分析參數(shù)的特性影響很大,為此應該選擇合適的窗口,使其短時參數(shù)能更好地反映語音信號的特性變化。分幀一般采用交疊分段的方法,這就是為了使幀與幀之間能夠很好的平滑過渡,使其保持連續(xù)性。通常將語音信號劃分為許多短時的語音時段,每個短時的語音段稱為一個幀。如果采用小的窗長,則計算量增加,語音識別的速度可定會降低。目的是提升高頻部分,使信號變得平坦、平滑,使之不僅在低頻而且在高頻的整個頻帶中,:采樣量化預加重加窗分幀參數(shù)提取語音信號 語音信號的預處理預加重是在語音信號數(shù)字量化之后,用具有6dB/倍頻程的提升高頻特性的預加重數(shù)字濾波器來實現(xiàn),它通常是一階的數(shù)字濾波器: (28)式中的取值一般取1左右。這就造成消息信號高頻端的信噪比可能降到不能容許的程度。線性預測的原理與語音信號數(shù)字模型相關。設是取有限個值的隨機變量則取的概率函數(shù)通常表示為: (26)則的熵為: (27) 線性預測法 線性預測分析的基本原理如下:語音信號分幀采樣后,各個語音樣點之間存在著聯(lián)系,可以用前幾幀的采樣點來預測當前幀或者后幾幀的樣點值,即可以用先前的幀的參數(shù)值通過線性組合來近擬后面的幀的采樣值。由于語音信號可以視為聲門激勵信號和聲道沖擊響應進行的卷積,隨后可以對語音信號進行解卷。對加窗分幀后的語音信號,進行傅里葉變換后再逆傅里葉變換,可以相應的得到頻譜、功率譜、倒譜距離、熵譜等特征。這種分析方法的特點有:(1)表示語音信號比較直觀、物理意義明確;(2)實現(xiàn)起來比較簡單、運算量少;(3)可得到語音的一些重要參數(shù);(4)采用示波器通用設備進行觀測等。 時域分析從一般的語音信號處理仿真來看,橫坐標都是為時間,所以說,語音信號是時域信號,經常處理的語音信號也是基于時域來分析的,這種方法一般就是利用仿真的波形來處理。還有一類是無聲,而無聲是處于波谷。語音信號還有一個比較簡單的分類,是基于人類發(fā)音的音素所分類的。因為語音信號只有在短時內才能保持它的穩(wěn)定和平滑。我們可以對語音通過帶通濾波器來得到我們所需要的頻譜,就可以得到相應頻譜所對的語音。對這種信號進行Matlab進行編程,對于不同信噪比的聲音片段,最后用前后的噪聲信號進行對比以得出結論。這兩大問題將是以后研究的主要對象[18]。我們常常尋求
點擊復制文檔內容
研究報告相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1