freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語音端點(diǎn)檢測算法的研究及matla程序仿真與實(shí)現(xiàn)畢業(yè)設(shè)計(jì)-資料下載頁

2025-08-18 21:28本頁面

【導(dǎo)讀】此在語音識(shí)別、語音增強(qiáng)、語音編碼、回聲抵消等系統(tǒng)中得到廣泛應(yīng)用。另一類方法是基于模式識(shí)別的方法,需要估計(jì)語音信號(hào)和噪聲信。號(hào)的模型參數(shù)來進(jìn)行檢測。由于基于模式識(shí)別的方法自身復(fù)雜度高,運(yùn)算量。本文首先對(duì)語音信號(hào)進(jìn)行簡單的時(shí)域分析,其次利用短時(shí)能量和過零率。并對(duì)各算法檢測結(jié)果進(jìn)行分析和比較。其次再對(duì)語音信號(hào)加噪,對(duì)不同信噪。師的指導(dǎo)下進(jìn)行的研究工作及取得的成果。盡我所知,除文中特別加。而使用過的材料。對(duì)本研究提供過幫助和做出過貢獻(xiàn)的個(gè)人或集體,均已在文中作了明確的說明并表示了謝意。

  

【正文】 出語音信號(hào)的過零率,在語音信號(hào)中清音段的過零率情況,圖中幅度變化反映了過零率次數(shù)的高低。 基于短時(shí)能量和短時(shí)過零率相結(jié)合語音端點(diǎn)檢測方法,充分利用能量和過零率的優(yōu)點(diǎn),使用過零率區(qū)分清音和靜音。在區(qū)分濁音和清音時(shí), 由于兩者在短時(shí)能量的區(qū)別,所以根據(jù)短時(shí)能量分辨出清音和濁音,而在區(qū)分清音和無聲片段時(shí),則由短時(shí)過零率來區(qū)分。但隨著噪聲的增加,過零率占有稍微好點(diǎn)的優(yōu)勢,等加到一定的程度后,這兩種方法都將失去檢測的效果。 基于短時(shí)能量和短時(shí)過零率的雙門限端點(diǎn)檢測 這種方法是基于短時(shí)能量和短時(shí)過零率相結(jié)合的方法,既能分辨出清音燕山大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 18 和濁音,也能分辨出清音和靜音。通常每一個(gè)參數(shù)設(shè)兩個(gè)門限。首先設(shè)一個(gè)比較低的門限,當(dāng)所測得的參數(shù)值大于這個(gè)門限,說明信號(hào)可能進(jìn)入語音階段,再設(shè)一個(gè)稍微高一點(diǎn)的門限,當(dāng)超過這個(gè)參數(shù)值的時(shí)候,說明 信號(hào)進(jìn)入語音段。隨后的幾幀一直大于這個(gè)值,而這幾幀大于最小語音值,則一定進(jìn)入語音階段。 由上述描述,可得其簡單步驟如下: (1)首先要計(jì)算每一幀的短時(shí)能量和短時(shí)過零率,然后又由每一幀的這兩個(gè)參數(shù)值得出特征參數(shù),即能零比。 (2)由特征參數(shù)值,先選一個(gè)比較低一點(diǎn)的門限,進(jìn)行最先的預(yù)判,如果低于這個(gè)門限肯定不是語音信號(hào)。再就是設(shè)置另一個(gè)高一點(diǎn)的門限,如果低于這個(gè)門限,則有可能不是語音信號(hào)。 (3)當(dāng)進(jìn)入語音階段時(shí),就開始判決語音信號(hào)的終止點(diǎn)。先是比較高一點(diǎn)的門限判決。如果低于這個(gè)門限,則語音信號(hào)有可能進(jìn)入語音結(jié) 束,再往后搜索,如果繼續(xù)降低且低于較低的門限,則語音信號(hào)進(jìn)入無聲階段。 (4)檢測的高低門限要通過多次實(shí)驗(yàn)并且根據(jù)當(dāng)時(shí)的信噪比環(huán)境而確定的。語音的開始和結(jié)束由于時(shí)間上的差異,信噪比也會(huì)有差異,這樣決定著門限選擇的復(fù)雜性。檢測過程中也要設(shè)置最低語音段和對(duì)短靜音段,這更有效的提高了語音端點(diǎn)檢測的準(zhǔn)確度。 從步驟上來看,可以把一個(gè)語音信號(hào)分成四個(gè)階段,靜音、開始過渡結(jié)束四個(gè)階段。在程序編寫過程中,常設(shè)置一個(gè)量來辨別當(dāng)前的狀態(tài),以決定下一個(gè)是什么階段。在靜音時(shí),超過門限,則進(jìn)入語音段,低于門限,進(jìn)入結(jié)束。整個(gè)過程都 是以門限值為基礎(chǔ),最短語音和最短靜音為輔來進(jìn)行和提高語音端點(diǎn)檢測。 我們所設(shè)置的最短語音和最短靜音就是為了防止一些突發(fā)性的噪聲。我們說的話語有一定的幅度,短時(shí)能量就是根據(jù)語音信號(hào)的幅度檢測出語音端點(diǎn)的,而一些比較大的噪聲或者碰撞聲音也好導(dǎo)致短時(shí)能量或過零率的數(shù)值接近語音信號(hào)的數(shù)值,但是這種信號(hào)持續(xù)的時(shí)間比較短,在時(shí)域上表示出很短的又很高的一段語音。因此可以根據(jù)突發(fā)噪聲短時(shí)間性質(zhì),對(duì)語音長度設(shè)置一定的門限。當(dāng)超過較高門限后,信號(hào)進(jìn)入語音階段,但如果語音階段持第 3章 語音端點(diǎn)檢測算法研究 19 續(xù)時(shí)間小于設(shè)定的時(shí)間長度,則被認(rèn)為是突發(fā)性噪聲,所有 值歸零,并重新開始進(jìn)行語音檢測。兩個(gè)語音字之間發(fā)音是有一定的時(shí)間間隔,因此也需設(shè)定最短靜音,如果處于靜音段,而其長度小于最短靜音,則認(rèn)為語音還沒結(jié)束,繼續(xù)語音段的檢測。 雙門限語音端點(diǎn)檢測實(shí)驗(yàn) 雙門限語音端點(diǎn)檢測是在 MATLAB 軟件環(huán)境下進(jìn)行仿真實(shí)驗(yàn)。文中語音信號(hào)樣本是自己采用麥克風(fēng)錄得語音“啊”,以 wav 格式存儲(chǔ)為較純凈的語音樣本。在語音端點(diǎn)檢測之前首先要對(duì)被測的語音信號(hào)進(jìn)行預(yù)處理等,包括分幀加窗等。文中加 Hmmaing 窗,通過特性為 ( 1?? )的濾波器預(yù)加重。對(duì)其他參數(shù)進(jìn)行設(shè)置,如設(shè)置語音幀長度,幀移長度, FFT 取,門限閥值 設(shè) 置等。首先先在比較安靜的環(huán)境下進(jìn)行錄音,以模擬高信噪比的環(huán)境。隨后根據(jù)語音的長度,加一序列與語音長度相等的隨機(jī)幅度序列,以提高噪聲信號(hào)的短時(shí)能量和過零率,比較逼真的仿真噪聲環(huán)境下的基于短時(shí)能量和過零率的語音端點(diǎn)檢測。如圖所示: 圖 35 高信噪比能零率的語音端點(diǎn)檢測 燕山大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 20 圖 36 低信噪比能零率的語音端點(diǎn)檢測 因?yàn)槭窃诒容^安靜的環(huán)境的情況下錄得語音,所以信噪比比較高。從 圖 35中可以看出,在高信噪比的情況下,采用 短時(shí)能量和過零率相結(jié)合的語音端點(diǎn)算法能夠清晰的檢測出語音字的端點(diǎn)。圖 36是對(duì)語音進(jìn)行加噪,即通過 matlab加 1序列的白噪聲。如果降低語音信號(hào)的信噪比,再通過短時(shí)能量和過零率的方法檢測,不能夠檢測語音端點(diǎn)。 基于倒譜特征的語音端點(diǎn)檢測 倒譜特征 在語音識(shí)別系統(tǒng)中,不管是語音識(shí)別還是語音檢測,倒譜這個(gè)特征參數(shù)要比短時(shí)能量和過零率含有更高的信息量,也更容易與噪聲信號(hào)區(qū)分開來,因此有許多端點(diǎn)檢測的方法都是基于倒譜特征來進(jìn)行的。實(shí)驗(yàn)證明,倒譜特征能更好的表現(xiàn)語音信號(hào)的特征。噪聲環(huán)境下,短時(shí) 能量和短時(shí)過零率顯得無能為力,而倒譜則能夠忽略噪聲大小的影響而直接從本質(zhì)上把語音信號(hào)和噪聲信號(hào)給區(qū)分開來。本文這節(jié)也將倒譜特征參數(shù)用于在噪聲環(huán)境下的語音端點(diǎn)檢測。 倒譜距離 設(shè)信號(hào) s(n) ,其倒譜變換為 c(n)。信號(hào)倒譜的一種定義是信號(hào)的能量譜密第 3章 語音端點(diǎn)檢測算法研究 21 度函數(shù) s(ω) 的對(duì)數(shù)的傅里葉反變換 ,或者可以將信號(hào) s(n) 的倒譜 c(n) 看成是logS(ω) 的傅里葉級(jí)數(shù)展開 ,即: ????? ?? n jnencS ?? )()(lo g ??? ?? ??? dS )(lo g21)0(c (39) 式中 , c(n)為倒譜系數(shù) ,且 c(n)=c(n)是實(shí)數(shù) 對(duì)于一對(duì)譜密度函數(shù) S(w)與 S′(w),利用 Parseval定理 ,用譜的倒譜距離表示對(duì)數(shù)譜的均方距離為 : ?? ??????? ?????? n nn ccdSS 2cep2 )()(l o g)(l o g21d ?? ???? (310) 式中, 與 c′n分別表示譜密度 S(w)和 S′(w)的倒譜系數(shù),對(duì)數(shù)譜的均方距離表示兩個(gè)信號(hào)譜的差別,故可用來作為一個(gè)判決參數(shù)。實(shí)際上,由于 c0包含信號(hào)能量信息 ,基于能量的端點(diǎn)檢測可以看作倒譜距離的一個(gè)特例。 倒譜距離的測量法步驟類似于基于能量的端點(diǎn)檢測,但將倒譜距離代替短時(shí)能量來作為門限。首先,假定前幾幀信號(hào)是背景噪聲,計(jì)算這些幀的倒譜系數(shù)矢量 ,利用前幾幀倒譜矢量的平均值可估計(jì)背景噪聲的倒譜矢量,噪聲倒譜矢量的近似值可按規(guī)則 311進(jìn)行更新 ,即當(dāng)前幀被認(rèn)為是非語音幀: tcpcp )1(c ??? (311) 式中 .c為噪聲倒譜矢量的近似值 ,ct為當(dāng)前測試幀的倒譜矢量 , p為調(diào)節(jié)參數(shù)。 下式計(jì)算倒譜距離 21200 )(2)(3 4 2 ????????? pn nncepcccc (312) 式中 c′n為對(duì)應(yīng)于 c的噪聲倒譜系數(shù) ,計(jì)算所有測試幀與背景噪聲之間的倒譜距離可得到倒譜距離軌跡。類似于基于能量的端點(diǎn)檢測過程 ,利用倒譜距離軌跡可檢測語音的端點(diǎn)。 我們處理信號(hào)是用的倒譜特征是復(fù)倒譜特征,其是由語音信號(hào)先經(jīng)過傅里葉變化,然后求其復(fù)對(duì)數(shù)進(jìn)行逆傅立葉變換便就可以得到信 號(hào)復(fù)倒譜,我們稱之為 FFT復(fù)倒譜。 燕山大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 22 LPC倒譜特征 本文選用 LPC倒譜特征,其基本的原理是由線性預(yù)測系數(shù)而推出的倒譜系數(shù),線性預(yù)測系數(shù)有較快的計(jì)算速度,沒有傅里葉變換中的復(fù)雜卷積,使其保持較高的檢測速度。 LPC倒譜特征與 FFT復(fù)倒譜特征相比,前者求出的頻譜包絡(luò)能更好地重現(xiàn)譜的峰值,而且運(yùn)算量僅是后者的一半,在實(shí)時(shí)語音識(shí)別中采用 LPC倒譜作為特征向量較好。我們可以根據(jù)人耳聽覺特性將線性預(yù)測推出的倒譜系數(shù)按照符合人聽覺特性的美爾 (MEL)尺度進(jìn)行非線性變換,從而求出 LPC美爾倒譜系數(shù)。 線性預(yù)測系數(shù) LPC LPC 為用線性預(yù)測法分析語音時(shí)得到的有關(guān)語音相鄰樣值間某些相關(guān)特性的參數(shù)組。 語音信號(hào)分幀采樣后,各個(gè)語音樣點(diǎn)之間存在著聯(lián)系,可以用前幾幀的采樣點(diǎn)來預(yù)測當(dāng)前幀或者后幾幀的樣點(diǎn)值,即可以用先前的幀的參數(shù)值通過線性組合來近擬后面的幀的采樣值。這樣通過抽樣和線性組合得到的采樣值只有唯一的組合系數(shù)。這組預(yù)測系數(shù)就反應(yīng)了語音信號(hào)與噪聲不同的參數(shù)特征。計(jì)算時(shí) 可以選用 Durbin 算法、格型算法、協(xié)方差等算法進(jìn)行求解。 LPC 倒譜 LPC 系數(shù)推測和估計(jì)語音信號(hào)的倒譜,這 也是語音信號(hào)短時(shí)倒譜分析中一種比較特殊的處理方法。 線性預(yù)測分析推定的聲道模型系統(tǒng)函數(shù)為語音信號(hào)的倒譜指的是信號(hào)能量譜密度函數(shù) )(?S 的對(duì)數(shù)的傅立葉變換用測量倒譜距離的方法來判斷每一幀信號(hào)是語音信號(hào)還是噪聲信號(hào),根據(jù)每一幀信號(hào)與噪聲的倒譜距離的軌跡就可以進(jìn)行語音端點(diǎn)檢測。 線性預(yù)測分析推定的聲道模型系統(tǒng)函數(shù)為: )1/(1)( 1?? ??? pk kk ZaZH (314) 其沖擊響應(yīng) h(n), 設(shè) )(?nh 表示 h(n)的倒譜,則有: nn ZnhZI n HZH?????? )(?)()(?1 (315) 將式 (314)代入并將其兩邊對(duì)數(shù)求導(dǎo)數(shù),有: 1111 )(?)1( ????????? ??? ??? kpkk knnpkkk ZkaZnhnZa (316) 第 3章 語音端點(diǎn)檢測算法研究 23 令上式左右兩邊的常數(shù)項(xiàng)和各次冪的系數(shù)分別相等,從而可由 ka 求出 )(?nh 0)0(? ?h (317) 1)1(? ah ? (318) )(?)/1()(? 11 knhankanh knkn ???? ??? )1( pn?? (319) )(?)/1()(? 11 knhanknh knk ??? ??? pn? (320) 由上面公式求得的倒譜為 LPC 倒譜。其中 p 為 LPC 階數(shù)。 LPC 倒譜是由線性預(yù)測法而發(fā)展過來的。用前幾幀的信號(hào)模擬后幾幀的信號(hào),大大縮短了計(jì)算量,且能夠表現(xiàn)出語音信號(hào)在頻譜上的特性,遠(yuǎn)遠(yuǎn)優(yōu)于用傅里葉變換而求得的倒譜,在實(shí)際上擁有了很好的應(yīng)用?,F(xiàn)在也有人提出了加權(quán)譜熵計(jì)算,并進(jìn)行端點(diǎn)檢測,但都是以線性預(yù)測為基礎(chǔ)的。 LPC 美爾倒譜系數(shù) 所謂的 LPC 美爾倒譜系數(shù)就是對(duì)原來的 LPC 倒譜系數(shù)按照美爾尺度進(jìn)行非線性變換而得出的倒譜系數(shù),進(jìn)一步提高了低信噪比環(huán)境中的語音端點(diǎn)檢測。由其原理得出 計(jì)算公式,如下: )1()( 00 ???? nMCaCnMC n (321) )1()1()1()( 1021 ??????? nMCanMCanMC (322) ))()1(()1()( 11 nMCnMCanMCnMC kkkk ?? ????? (k1) (323) 式中 nC 表示倒譜系數(shù), kMC 表示美爾倒譜系數(shù), n 為迭代次數(shù), k 為倒譜階數(shù), 一般 n=k。迭代時(shí) n 從大到 0 取值,最后求得的美爾倒譜系數(shù)放在)0(0MC , )0(1MC , )0(orderMC 里。當(dāng)抽樣頻率分別為 10kHz~8kHz 時(shí), a 取、 ,這樣可以近似于美爾尺度。 倒譜距離的檢測算法流程 在倒譜距離檢測的算法中,首先需計(jì)算出的每一幀的 LPC 系數(shù)、噪聲倒譜系數(shù)估計(jì)值等,然后由每幀信號(hào)的倒譜系數(shù)和噪聲倒譜系數(shù)估計(jì)值通過公式 ( 314) 計(jì)算出倒譜值,然后才能對(duì)語音信號(hào) 進(jìn)行端點(diǎn)檢測,其檢測算燕山大學(xué)本科生畢業(yè)設(shè)計(jì)(論文) 24 法思路如下: (1)預(yù)處理:本文采用的是 8kHz 的語音信號(hào),先兌取進(jìn)行預(yù)處理,是高頻和低頻的信噪比保持平滑。然后對(duì)其加窗分幀,窗函數(shù)用的是漢明窗,一幀的是 240 個(gè)采樣點(diǎn), 80 點(diǎn)的幀移,也就是三分之一的幀移。 (2)估計(jì)噪聲倒譜系數(shù)和倒譜距離 :在進(jìn)行語音端點(diǎn)檢測之前,需對(duì)當(dāng)前環(huán)境下的噪聲比進(jìn)行估計(jì),以便設(shè)置門限。我們常常選取最開始的 10 幀信號(hào)作為參考。這 10 幀的前五幀作為估計(jì)當(dāng)前噪聲的倒譜系數(shù)的參考,而后幾幀則作為估計(jì)當(dāng)前噪聲的倒譜距離的參考。 (3)逐幀計(jì)算 cepd 值:對(duì)每一幀先計(jì)算出它的倒譜系數(shù),由它的倒譜系數(shù)和估計(jì)的噪聲倒譜系數(shù)計(jì)算當(dāng)前幀的倒譜距離。 (4)如上節(jié)設(shè)置短時(shí)能量和短時(shí)過零率的門限來確定倒譜距離判決門限。我們也根據(jù)當(dāng)前噪聲比的噪聲的倒譜距離來設(shè)定兩個(gè)門限,一個(gè)較高的和一個(gè)較低的門限 G1 和 G2: icepsili kdG ?? 2,1?i (324) 式中 cepsild 為噪聲倒譜距離估值
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1