【正文】
pDx2zVkumamp。qYpEh5pDx2zVkumamp。 qYpEh5pDx2zVkum amp。 MuWFA5ux^Gj qv^$UE9wEwZQcUE%amp。MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK!zn%Mz849Gx^Gj qv^$U*3t nGK8! z89Am YWpazadNuKNamp。MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK!zn%MadNuKNamp。 ksv*adNuKNamp。 ksv*3tnGK8! z89Am YWpazadNuKNamp。 gTXRm 6X4NGpP$vSTTamp。 ksv*3t nGK8!z89Am YWpazadNuKNamp。 gTXRm 6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。 ksv*3t nGK8! z89Am YWpazadNuGK8!z89Am YWpazadNuKNamp。 MuWFA5uxY7JnD6YWRrWwc^vR9CpbK! zn% Mz849Gx^Gjqv^$UE9wEwZQcUE% amp。 MuWFA5uxY7JnD6YWRrWwc^vR9CpbK! zn% Mz849Gx^Gjqv^$UE9wEwZQcUE% amp。MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK! zn%Mz84! z89Am v^$UE9wEwZQcUE%amp。 qYpEh5pDx2zVkumamp。 MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK! zn%Mz849Gx^Gj qv^$UE9wEwZQcUE%amp。 qYpEh5pDx2zVkumamp。qYpEh5pDx2zVkumamp。 gTXRm6X4NGpP$vSTTamp。 gTXRm6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。ksv*3t nGK8!z89Am YWpazadNuKNamp。 gTXRm6X4NGpP$vSTTamp。 ksv*3tnGK8! z89Am YWpazadNuKNamp。 MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK! zn% Mz849Gx^Gj qvadNuKNamp。MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK! zn%Mz849Gx^Gj qv^$UE9wEwZQcUE%amp。 MuWFA5ux^Gj qv^$UE9wEwZQcUE%amp。 MuWFA5uxY7JnD6YWRrWwc^vR9CpbK! zn% Mz849Gx^Gjqv^$UE9wEwZQcUE% amp。 MuWFA5uxY7JnD6YWRrWwc^vR9amp。 qYpEh5pDx2zVkumamp。 gTXRm6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。gTXRm 6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。 gTXRm6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。gTXRm 6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。 QA9wkxFyeQ^! djsXuyUP2kNXpRWXm Aamp。qYpEh5pDx2zVkumamp。 qYpEh5pDx2zVkumamp。 QA9wkxFyeQ^! dj sXuyUP2kNXpRWXm Aamp。 qYpEh5pDx2zVkumamp。 qYpEh5pDx2zVkumamp。 qYpEh5pDx2zVkum amp。 qYpEh5pDx2zVkumamp。 在完成 論文 的過(guò)程中 導(dǎo)師 耐心的指導(dǎo)和 嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度,精湛的學(xué)術(shù)造詣和誨人不倦的精神給我留下了非常深刻的印象,使我 受益匪淺 ,為我今后的學(xué)習(xí)和工作樹(shù)立了楷模。 4 分析總結(jié) 語(yǔ)音信號(hào)端點(diǎn)檢測(cè)是語(yǔ)音信號(hào)處理中非常重要的一項(xiàng)預(yù)處理技術(shù),因此是語(yǔ)音信號(hào)處理中不可缺少的一步。接下來(lái)進(jìn)行第二級(jí)判 20 斷 , 由于語(yǔ)音的起點(diǎn)很可能是能量很弱的清音 , 此時(shí)還采用短時(shí)能量來(lái)區(qū)分清音和無(wú)聲顯然已不合適 , 應(yīng)采用過(guò)零率。而如果在過(guò)渡段中兩個(gè)參 數(shù)中的任一個(gè)超過(guò)了高門(mén)限,就可以確信進(jìn)入語(yǔ)音段了。 其端點(diǎn)檢測(cè)的流程如下所述:開(kāi)始進(jìn)行端點(diǎn)檢測(cè)之前,首先為短時(shí)能量和過(guò)過(guò)零率分別確定兩個(gè)門(mén)限 amp amp zcr zcr2, 其中 amp zcr2 分別為短時(shí)能量和過(guò)零率比較低的門(mén)限,其數(shù)值比較小,對(duì)信號(hào)的變化比較敏感,很容易就會(huì)超過(guò)。 該算法的原理簡(jiǎn)述如下 : 對(duì)上 述兩種特征作一個(gè)統(tǒng)計(jì)估計(jì),得到兩個(gè)門(mén)限值,利用短時(shí)能量檢測(cè)濁音,短時(shí)過(guò)零率檢測(cè)清音,兩者配合從而確定語(yǔ)音的端點(diǎn)。另外,利用短時(shí)過(guò)零率還可以從背景噪聲中找出語(yǔ)音 信號(hào),判斷寂靜無(wú)聲段和有聲段的起點(diǎn)和終點(diǎn)的位置。 本文在 MATLAB 軟件 中實(shí)現(xiàn)求語(yǔ)音短時(shí)過(guò)零率的關(guān)鍵代碼為 %計(jì)算過(guò)零率 tmp1=enframe(x(l:length(x)l), FrameLen, Framelne)。而對(duì)于離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱為過(guò)零。 語(yǔ)音信號(hào)的短時(shí)能量可用以下幾種算法得到: 1 ()NnniE x i??? ( 34) 21 ()NniiE x i??? ( 35) 21 log ( )NniiE x i??? ( 36) 它們分別為絕對(duì)值的累加、平方累加和平方的對(duì)數(shù)的累加 [12] [13],本文采用的是絕對(duì)值的累加進(jìn)行計(jì)算的, 本文在 MATLAB 軟件 中實(shí)現(xiàn)求語(yǔ)音短時(shí) 能量 的關(guān)鍵代碼為 %計(jì)算短時(shí)能量 amp = sum(abs(enframe(filter([1 ], 1, x), FrameLen, FrameInc)), 2)。上式表明,經(jīng)過(guò)窗口加權(quán)的短時(shí)能量相當(dāng)于將“語(yǔ)音平方”信號(hào)通過(guò)一個(gè)線性濾波器的輸出,這個(gè)濾波器的取樣響應(yīng)為 )(nh 。 短時(shí)平均能量 語(yǔ)音和噪聲的主要區(qū)別在它們的能量上,所以能量是經(jīng)常使用的音頻特征參數(shù),是對(duì)語(yǔ)音信號(hào)最直觀的表示。 ( 4)端點(diǎn)檢測(cè):確定門(mén)限后就可以進(jìn)行端點(diǎn)檢測(cè),根據(jù)門(mén)限值來(lái)區(qū)分有語(yǔ)音段和噪聲段,得出檢測(cè)結(jié)果。通常不同的系統(tǒng)需要不同的算法以滿足在精度、復(fù)雜度、魯棒性、敏感性和響應(yīng)時(shí)間等方面的需求。 ( 1) 短時(shí)頻譜和短時(shí)功率譜 設(shè)信號(hào) )(mxn 經(jīng)過(guò)傅里葉變換后在頻域記為 )( jwn eX ,則 )( jwn eX 與 )(mxn 的關(guān)系見(jiàn)公式 26。語(yǔ)音信 號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)平均幅度、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)等,這些是語(yǔ)音信號(hào)中一組最基本的短時(shí)參數(shù),在各種語(yǔ)音信號(hào)數(shù)字處理技術(shù)中都有重要應(yīng)用。 表 21 1s長(zhǎng)的各種窗的主瓣寬度和旁瓣高度 矩形 漢明 漢寧 主瓣寬度 旁瓣寬度 13dB 43dB 32dB 從表中可知:矩形窗的主瓣寬度最小,但其旁瓣高度最高;漢明窗的主瓣最寬,而旁瓣高度最低。將語(yǔ)音信號(hào)劃分為許多短時(shí)的語(yǔ)音段,每個(gè)短時(shí)的語(yǔ)音段稱為一個(gè)分析幀。目的是提升高頻部分,使信號(hào)變得平坦,保持在低頻到高頻的整個(gè)頻帶中,能用同樣的信噪比求頻譜,而且預(yù)加重零點(diǎn)與輻射零點(diǎn)將抵消聲門(mén)波的影響,使語(yǔ)音信號(hào)中只包含聲道部分,以便于頻譜分析或聲道參數(shù)分析。研究表明,在5ms40ms 的范圍內(nèi),語(yǔ)音信號(hào)的頻譜特性和一些物理特征參數(shù)基本保持不變。 現(xiàn)有的算法存在的主要問(wèn)題有兩點(diǎn) : 6 一、在具有較強(qiáng)噪聲的環(huán)境下,語(yǔ)音端點(diǎn)檢測(cè)往往存在著大量的誤判,不利于后續(xù)的處理過(guò)程 ; 二、在高噪聲的環(huán)境下不能有效的檢測(cè)出語(yǔ)音信號(hào)段,造成了有效信息的丟失。 ( 4) 應(yīng)該盡可能避免在檢測(cè)中丟失鼻韻和弱摩擦音等與噪聲特性相似、短時(shí)參數(shù)較少的語(yǔ)音。那時(shí)的算法名稱叫VAD(Voice Aotivity Detection),指的是將語(yǔ)音段和無(wú)語(yǔ)音段分開(kāi)的處理過(guò)程。 另外在通信系統(tǒng)中,典型的會(huì)話信道大約有 40%的時(shí)間真正用于傳輸語(yǔ)音,其余60%的時(shí)間傳輸?shù)亩际庆o默和背景噪聲。 語(yǔ)音端點(diǎn)檢測(cè)的準(zhǔn)確性對(duì)于語(yǔ)音識(shí)別系統(tǒng)的性能有著較大的影響。語(yǔ)音信號(hào)處理與信息科學(xué)中最活躍的前沿科學(xué)密切聯(lián)系,并且共同發(fā)展。 隨著現(xiàn)代科學(xué)的蓬勃發(fā)展,人類社會(huì)越來(lái)越顯示出信息社會(huì)的特點(diǎn),猶如衣、食、住、行對(duì)于人類是必要的一樣,通信和信息交換也成為了人類社會(huì)存在的必要條件,不但在人與人之間,而且在人與機(jī)器之間每時(shí)每刻都需要進(jìn)行大量的信息交換。 有效的端點(diǎn)檢測(cè)不僅可以減少數(shù)據(jù)的存和處理時(shí)間,而且能排除無(wú)聲段的噪聲干擾。語(yǔ)音信號(hào)的好壞、語(yǔ)音識(shí)別率的高低,都取決于語(yǔ)音信號(hào)處理的好壞。 關(guān)鍵詞: 語(yǔ)音信號(hào)處理;語(yǔ)音端點(diǎn)檢測(cè);雙門(mén)限;短時(shí)能量;短時(shí)過(guò)零率 Voice signal endpoint detection based on MATLAB Abstract: Endpoint detection is a voice signal from the accurate speech signal to the identify start and the end points, the purpose is to enable to separated the effective voice signals and unuseful noise. So, in the speech recognition system, speech enhancement, speech coding, echo cancellation and other systems are widely used. In Current the endpoint detection can be roughly divided into two categories, one is based on the threshold method, another method is based on the method of pattern recognition , the main in this paper is based on the method of threshold method. The Endpoint detection is take a very important position in the speech recognition, it directly affects the performance of the system. In this article first domain analysis in simple speech signal time, than dual threshold algorithm, cepstrum algorithm, spectral entropy algorithm for endpoint detection, and these types of endpoint detection algorithms, and experimental analysis points and analysis the advantages and disadvantages of this method. Key word: Signal processing。本文首先對(duì)語(yǔ)音信號(hào)進(jìn)行簡(jiǎn)單的時(shí)域和頻域 分析 及預(yù)處理 ,其次利用 基于短時(shí)能量和短時(shí)過(guò)零率的 雙門(mén)限算法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),并對(duì)這幾種用這種算法進(jìn)行端點(diǎn)檢測(cè),進(jìn)行實(shí)驗(yàn)分析,分析此方法的優(yōu)缺點(diǎn)。語(yǔ)音信號(hào)處理包括語(yǔ)音通信、語(yǔ) 音增強(qiáng)、語(yǔ)音合成、語(yǔ)音識(shí)別和說(shuō)話人識(shí)別等方面。因此,端點(diǎn)檢測(cè)的效率、質(zhì)量在語(yǔ)音處理系統(tǒng)中顯得至關(guān)重要,廣泛開(kāi)展端點(diǎn)檢測(cè)實(shí)現(xiàn)手段方面的研究,有一定的現(xiàn)實(shí)意義 [2]。 研究背景及意義 3 語(yǔ)音 [4]是語(yǔ)言的聲學(xué)表現(xiàn)形式 , 語(yǔ)言是人類特有的功能,聲音是人類常用的 信息交 語(yǔ)言學(xué)、聲學(xué)、生理學(xué)、心 理學(xué)和數(shù)學(xué)等諸多領(lǐng)域的內(nèi)容。多媒體技術(shù)的發(fā)展,使語(yǔ)音技術(shù)逐漸在越來(lái)越多的場(chǎng)合中推廣使用,語(yǔ)音信號(hào)處理技術(shù)發(fā)展迅速,其研究成果具有重要的學(xué)術(shù)及應(yīng)用價(jià)值,涉及一系列前沿課題。 有效的端點(diǎn)檢測(cè)技術(shù)不僅能減少系統(tǒng)的處理時(shí)間、提高系統(tǒng)的處理實(shí)時(shí)性,而且能排除無(wú)聲段的噪聲干擾,從而使后續(xù)工作的性能得以較大提高。因此,從混有不同噪聲的信號(hào)中準(zhǔn)確提取純凈的語(yǔ)音信號(hào)就成了語(yǔ)音識(shí)別系統(tǒng)中的一個(gè)重要的環(huán)節(jié)。當(dāng)時(shí)是在一個(gè)實(shí)時(shí)語(yǔ)音翻譯系統(tǒng)中,為了解決語(yǔ)音段和無(wú)語(yǔ)音段的檢測(cè)問(wèn)題而提出來(lái)的。 ( 3) 對(duì)于爆破音的寂靜段,應(yīng)將其納入語(yǔ)音的范圍而不是無(wú)聲段。而音節(jié)的起點(diǎn) — 聲母大多都是清聲母,還有送氣與不送氣的塞音和塞差音,當(dāng)背景噪聲較大時(shí),清音電平與噪聲電平相差無(wú)幾,將它們與環(huán)境噪聲分辨是比較困難的 ,這也是雙門(mén)限法的不足之處 。但是,從另一方面來(lái)看,由于語(yǔ)音的形成過(guò)程與發(fā)音器官的運(yùn)動(dòng)密切相關(guān),這種物理運(yùn)動(dòng)比起聲音振動(dòng)速度來(lái)講要緩慢得多,因此,語(yǔ)音信號(hào)常常可假定為短時(shí)平穩(wěn)的。由于語(yǔ)音信號(hào)的平均功率受聲門(mén)激勵(lì)和口鼻輻射影響,高頻端大約在 800Hz 以上按 6dB/倍頻程跌落,即 6dB/oct(2 倍頻 )或20dB/dec(10 倍頻 ),所以求語(yǔ)音信號(hào)頻譜時(shí),頻率越高相應(yīng)的成分越小,高頻 部分的頻譜比低頻部分的難求,為此要在預(yù)處理中進(jìn)行預(yù)加重處理。 在進(jìn)行了預(yù)加重后,接下來(lái)就要對(duì)語(yǔ)音信號(hào)進(jìn)行加窗分幀處理。以上這些窗函數(shù)的幅度頻率響應(yīng)都具有低通特性,它們 的主瓣寬度和旁瓣高度如表 9 21 所示。時(shí)域分析通常用于最基本的參數(shù)分析以及用于語(yǔ)音的分割、預(yù)處理等。由于語(yǔ)音信號(hào)的特性是隨著時(shí)間緩慢變化,