freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音端點(diǎn)檢測算法的研究及matla程序仿真與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)(參考版)

2025-06-25 08:21本頁面
  

【正文】 endend % count = countsilence/2。 end end case 3, status=0。 count = 0。 elseif count minlen % 語音長度太短,認(rèn)為是噪聲 status = 0。 else % 語音將結(jié)束 silence = silence+1。 if length(x1)~=length(x2) x2(end+1)=x1(end)+countsilence/21。 else % 靜音狀態(tài) status = 0。 elseif amp(n) amp2 | ... % 可能處于語音段 zcr(n) zcr2 status = 1。 silence = 0。 switch status case {0,1} % 0 = 靜音, 1 = 可能開始 if amp(n) amp1 % 確信進(jìn)入語音段 x1(end+1) = max(ncount1,1)。x2 = []。amp2 = min(amp2, max(amp)/8)。%計(jì)算短時(shí)能量amp = sum(abs(enframe(filter([1 ], 1, x), FrameLen, FrameInc)), 2)。diffs = (tmp1 tmp2)。%分幀處理,tmp1和tmp2為分幀后形成的二維數(shù)組tmp2 = enframe(x(2:end) , FrameLen, FrameInc)。silence = 0。 % 15*10ms = 150msstatus = 0。maxsilence = 8。zcr1 = 10。%指定幀移amp1 = 10。plot(x)%常數(shù)設(shè)置FrameLen = 240。 x = double(x)。 %nois=*rand(len,1)。)。 close all x=wavread(39。本次畢業(yè)設(shè)計(jì)自始至終是在他們的指導(dǎo)和幫助下完成的,在此,再一次向他們致以深深的敬意和感謝!再次衷心感謝所有關(guān)心和幫助我的老師和同學(xué)和朋友們致以最誠摯的謝意!附錄程序%過零率和短時(shí)能量clear all。畢業(yè)設(shè)計(jì)能順利完成離不開老師的幫助的。在畢業(yè)設(shè)計(jì)過程中,使我學(xué)到很多新的知識,同時(shí)也加深了以前所學(xué)的知識,讓我理解和學(xué)習(xí)了語音端點(diǎn)檢測這項(xiàng)語音信號處理技術(shù),積累了寶貴的經(jīng)驗(yàn)。35參考文獻(xiàn) 參考文獻(xiàn)1 劉波,李文忠,曾涯.:電子工業(yè)出版社,20062 :人民郵電出版社,20033 :清華大學(xué)出版社,2008 4 Abdallah I , Montresor S , Baudry M. Robust SpeechPnon speech Detection in Adverse Conditions Usingan Entropy Based :International Conference on Digital Signal Processing ,1997:757 760.5 L. R. Rabiner, B. H. Juang. Fundamentals of speech recognition. Murray Hill, New Jersey ,USA ,1993:6336446 Rabiner .,Sambur algorithm for determining the endpoints of isolated .,1975,pp:297315.7 嚴(yán)劍峰, 2005,(11):37448 ,(28):45479 :北京郵電大學(xué),200810 劉榮,,(19):576411 .河北大學(xué),2010:404512 陳斐利,2006,(9):495313 汪石,農(nóng)許鋼,張愛雪,,(2):1113 14 2005,(10):283015 于迎霞,,(5):24725016 .湖南師范大學(xué),2006,(3):10410617 何強(qiáng) :清華大學(xué)出版社,200237致謝 致 謝在此感謝老師在本次畢業(yè)設(shè)計(jì)中耐心的指導(dǎo),從畢業(yè)設(shè)計(jì)的選題,到基于MATLAB語音端點(diǎn)檢測算法的確定,以及在設(shè)計(jì)研究實(shí)驗(yàn)過程中及其論文的撰寫,每一步都傾注著導(dǎo)師的心血。語音產(chǎn)業(yè)需要更加開放的環(huán)境,使有興趣和實(shí)力的企業(yè)都能加入到這方面的研究和開發(fā)中,逐步改變。(4)根據(jù)同一語音信號分別在不同的噪聲比環(huán)境下進(jìn)行了仿真實(shí)驗(yàn)比較,評述了每一種端點(diǎn)檢測算法的優(yōu)點(diǎn)和缺點(diǎn)。(2)首先進(jìn)行了傳統(tǒng)的基于短時(shí)能量和過零率的語音端點(diǎn)算法研究,在高、低兩種噪聲比進(jìn)行了實(shí)驗(yàn)仿真。語音信號有不同的特征參數(shù),根據(jù)不同的特征參數(shù)會(huì)有不同的語音端點(diǎn)檢測算法,一般是根據(jù)時(shí)域和頻域兩種來進(jìn)行檢測。隨后的仿真實(shí)驗(yàn)驗(yàn)證了在嘈雜的環(huán)境下,基于熵譜的算法能夠很好的進(jìn)行端點(diǎn)檢測。根據(jù)信息論的方法,產(chǎn)生了基于譜熵的語音端點(diǎn)檢測。信號倒譜的一種定義是信號的能量譜密度函數(shù)s(ω)的對數(shù)的傅里葉反變換,或者可以將信s(n)的倒譜c(n)看成是logS(ω)的傅里葉級數(shù)展開,倒譜能很好表示語音的特征,因此在大多數(shù)語音識別系統(tǒng)中選擇倒譜系數(shù)作為輸入特征矢量。在時(shí)域參數(shù)采用了基于短時(shí)能量和過零率相結(jié)合的方法,經(jīng)過matlab實(shí)驗(yàn)仿真,驗(yàn)證了能零率相結(jié)合的方法在安靜環(huán)境下即在信噪比比較高的環(huán)境下能夠很好的檢測出語音端點(diǎn)。又根據(jù)三種端點(diǎn)檢測算法的matlab 仿真過程,得出三種算法的優(yōu)缺點(diǎn),其如表31所示:表31 語音端點(diǎn)檢測算法比較算法類別優(yōu)點(diǎn)缺點(diǎn)測評基于能零率算法(1)原理簡單(2)運(yùn)算量小,便于實(shí)時(shí)實(shí)現(xiàn)(1)近適應(yīng)于平穩(wěn)噪聲的檢測,對于不同噪聲的魯棒性差(2)只能檢測高信噪比的語音一般基于倒譜特征算法(1)原理簡單(2)特征參數(shù)受語音信號時(shí)域、頻域參數(shù)變化影響小,魯棒性較好(1)當(dāng)噪聲與語音信號的相應(yīng)特征參數(shù)差別不大時(shí),方法失效(2)對于清音的檢測效果一般一般基于譜熵特征算法(1)大多數(shù)算法運(yùn)算量較小,便于實(shí)時(shí)實(shí)現(xiàn)(2)能夠?qū)崿F(xiàn)低信噪比平穩(wěn)噪聲環(huán)境下帶噪語音信號的檢測(1)當(dāng)噪聲與語音先好的時(shí)域或頻域分布類似時(shí)。而基于譜熵的端點(diǎn)檢測則能夠非常清晰的檢測出語音端點(diǎn)。e)f)圖312 高低信噪比基于不同算法的語音端點(diǎn)檢測仿真在低信噪比下,基于能零比雖能夠稍微顯示噪聲信號與語音信號的不同,但在過零率和短時(shí)能量則顯示比較平緩,不能清晰的進(jìn)行端點(diǎn)檢測。然后對這三種算法進(jìn)行比較,即對各算法進(jìn)行語音端點(diǎn)檢測時(shí)采用同一段原始語音信號,然后在原始語音信號中加入噪聲,比較各算法在低信噪比和高信噪比條件下端點(diǎn)檢測結(jié)果進(jìn)行比較。 算法比較在語音識別系統(tǒng)中產(chǎn)生錯(cuò)誤識別的原因之一是端點(diǎn)檢測有誤差,在高信噪比情況下,正確地確定語音的端點(diǎn)并不困難。下面是通過matlab進(jìn)行的實(shí)驗(yàn)仿真。對于頻帶寬度受限的情況而言,例如語音信號的頻率主要集中在300Hz~3400Hz,所以在此范圍內(nèi),則認(rèn)為語音信號的隨機(jī)事件比較多,平均信息量大,熵值大,在背景噪聲在此頻率范圍受限的情況下,則熵值較小。計(jì)算每一幀的譜熵值采用以下公式進(jìn)行計(jì)算的: (328)是第幀的譜熵,計(jì)算是基于譜的能量變化而不是譜的能量,所以在不同水平噪聲環(huán)境下譜熵參數(shù)具有一定的穩(wěn)健性,但每一譜點(diǎn)的幅值易受噪聲的污染進(jìn)而影響端點(diǎn)檢測的穩(wěn)健性。(5)設(shè)置判決門限。(3)計(jì)算出每一幀中每個(gè)樣本點(diǎn)的概率密度函數(shù)。該算法最簡單的實(shí)現(xiàn)原理框圖如下圖39所示:預(yù)加重分幀加窗求功率譜概率密度求語音信號譜熵值圖39 譜熵語音端點(diǎn)檢測實(shí)現(xiàn)原理框圖其大概檢測思路如下:(1)首先對語音信號進(jìn)行分幀加窗、取FFT變換的點(diǎn)數(shù)。然后計(jì)算每個(gè)頻譜分量在每幀總能量中所占的比例,將其作為信號能量集中在某頻率點(diǎn)的概率,其概率密度函數(shù)定義為: (325)式中是的能量,是相應(yīng)的概率密度,N是FTF中頻率成分的所有點(diǎn)數(shù)。另外,由于每個(gè)頻率分量在求其概率密度函數(shù)的時(shí)侯都經(jīng)過了歸一化處理,所以從這一方面也證明了語音信號的譜熵只會(huì)與語音分布有關(guān),而不會(huì)與幅度大小有關(guān)。(3)在某種程度上講,譜熵對噪聲具有一定的穩(wěn)健性,在相同的語音信號當(dāng)信噪比降低時(shí),語音信號的譜熵值的形狀大體保持不變,這說明譜熵是一個(gè)比較穩(wěn)健性的特征參數(shù)。 (2)理論上,如果譜的分布保持不變,語音信號幅值的大小不會(huì)影響歸一化。通過熵的參數(shù)的引進(jìn),在高信噪比的環(huán)境下的語音端點(diǎn)檢測的技術(shù)得到了突飛猛進(jìn)。若其發(fā)生的概率越大,其包含的信息量就越大。 基于譜熵的語音端點(diǎn)檢測 譜熵特征所謂熵就是表示信息的有序程度。如圖37所示:圖37 安靜環(huán)境下倒譜特征端點(diǎn)檢測我們對語音信號加長度為語音長度的一序列參數(shù)來模擬噪聲,以降低信噪比來進(jìn)行仿真,如圖38:圖38 加噪后的倒譜端點(diǎn)檢測從圖37中看出,在安靜環(huán)境倒譜語音端點(diǎn)檢測效果不是太好,但仍能語音段的倒譜特征與噪聲段的倒譜特征有明顯的不同。下面通過matlab進(jìn)行不同信噪比的仿真。如果在進(jìn)入語音段后,持續(xù)的時(shí)間小于最短語音,則被認(rèn)為是噪聲,當(dāng)結(jié)束后,持續(xù)的時(shí)間小于最短靜音,則被認(rèn)為是語音還沒結(jié)束,則繼續(xù)語音信號的檢測 基于倒譜特征的語音端點(diǎn)檢測試驗(yàn)分析倒譜能很好表示語音的特征,因此在大多數(shù)語音識別系統(tǒng)中選擇倒譜系數(shù)作為輸入特征矢量,在噪聲環(huán)境下短時(shí)能量與其它特征參數(shù)都不能很好地區(qū)分語音段與非語音段,因此采用倒譜系數(shù)來作為端點(diǎn)檢測的參數(shù)。在靜音時(shí),超過門限,則進(jìn)入語音段,低于門限,進(jìn)入結(jié)束。從步驟上來看,可以把一個(gè)語音信號分成四個(gè)階段,靜音、開始過渡結(jié)束四個(gè)階段。低們限被超過未必就是語音信號的開始,有可能是時(shí)間很短的噪聲引起的。其中T2為比較低的門限,其數(shù)值比較小,對信號的變化比較敏感,很容易就會(huì)超過。在進(jìn)行端點(diǎn)檢測之前,先對語音信號進(jìn)行預(yù)處理即對其分幀加窗,在本文中幀長為240,幀移為80,漢明窗。如果當(dāng)前幀的值大于,則記錄該幀位置為start,然后繼續(xù)計(jì)算后面各幀的值,若在該幀之后若干幀以內(nèi),有連續(xù)三幀的值都大于,則認(rèn)為start為語音的起點(diǎn),否則繼續(xù)搜索。我們也根據(jù)當(dāng)前噪聲比的噪聲的倒譜距離來設(shè)定兩個(gè)門限,一個(gè)較高的和一個(gè)較低的門限G1和G2: (324)式中為噪聲倒譜距離估值,分別為兩個(gè)門限的乘系數(shù),且,以保證,這里取=,=。(3)逐幀計(jì)算值:對每一幀先計(jì)算出它的倒譜系數(shù),由它的倒譜系數(shù)和估計(jì)的噪聲倒譜系數(shù)計(jì)算當(dāng)前幀的倒譜距離。我們常常選取最開始的10幀信號作為參考。然后對其加窗分幀,窗函數(shù)用的是漢明窗,一幀的是240個(gè)采樣點(diǎn),80點(diǎn)的幀移,也就是三分之一的幀移。當(dāng)抽樣頻率分別為10kHz~8kHz時(shí),a 、,這樣可以近似于美爾尺度。由其原理得出計(jì)算公式,如下: (321) (322) (k1) (323)式中表示倒譜系數(shù),表示美爾倒譜系數(shù),n為迭代次數(shù),k為倒譜階數(shù),一般n=k?,F(xiàn)在也有人提出了加權(quán)譜熵計(jì)算,并進(jìn)行端點(diǎn)檢測,但都是以線性預(yù)測為基礎(chǔ)的。LPC倒譜是由線性預(yù)測法而發(fā)展過來的。線性預(yù)測分析推定的聲道模型系統(tǒng)函數(shù)為: (314)其沖擊響應(yīng)h(n),設(shè)表示h(n)的倒譜,則有: (315)將式(314)代入并將其兩邊對數(shù)求導(dǎo)數(shù),有: (316)令上式左右兩邊的常數(shù)項(xiàng)和各次冪的系數(shù)分別相等,從而可由求出 (317) (318) (319) (320)由上面公式求得的倒譜為LPC倒譜。 LPC倒譜 LPC系數(shù)推測和估計(jì)語音信號的倒譜,這也是語音信號短時(shí)倒譜分析中一種比較特殊的處理方法。這組預(yù)測系數(shù)就反應(yīng)了語音信號與噪聲不同的參數(shù)特征。語音信號分幀采樣后,各個(gè)語音樣點(diǎn)之間存在著聯(lián)系,可以用前幾幀的采樣點(diǎn)來預(yù)測當(dāng)前幀或者后幾幀的樣點(diǎn)值,即可以用先前的幀的參數(shù)值通過線性組合來近擬后面的幀的采樣值。我們可以根據(jù)人耳聽覺特性將線性預(yù)測推出的倒譜系數(shù)按照符合人聽覺特性的美爾(MEL)尺度進(jìn)行非線性變換,從而求出LPC美爾倒譜系數(shù)。 LPC倒譜特征 本文選用LPC倒譜特征,其基本的原理是由線性預(yù)測系數(shù)而推出的倒譜系數(shù),線性預(yù)測系數(shù)有較快的計(jì)算速度,沒有傅里葉變換中的復(fù)雜卷積,使其保持較高的檢測速度。類似于基于能量的端點(diǎn)檢測過程,利用倒譜距離軌跡可檢測語音的端點(diǎn)。首先,假定前幾幀信號是背景噪聲,計(jì)算這些幀的倒譜系數(shù)矢
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1