【正文】
pDx2zVkumamp。qYpEh5pDx2zVkumamp。 qYpEh5pDx2zVkum amp。 MuWFA5ux^Gj qv^$UE9wEwZQcUE%amp。MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK!zn%Mz849Gx^Gj qv^$U*3t nGK8! z89Am YWpazadNuKNamp。MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK!zn%MadNuKNamp。 ksv*adNuKNamp。 ksv*3tnGK8! z89Am YWpazadNuKNamp。 gTXRm 6X4NGpP$vSTTamp。 ksv*3t nGK8!z89Am YWpazadNuKNamp。 gTXRm 6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。 ksv*3t nGK8! z89Am YWpazadNuGK8!z89Am YWpazadNuKNamp。 MuWFA5uxY7JnD6YWRrWwc^vR9CpbK! zn% Mz849Gx^Gjqv^$UE9wEwZQcUE% amp。 MuWFA5uxY7JnD6YWRrWwc^vR9CpbK! zn% Mz849Gx^Gjqv^$UE9wEwZQcUE% amp。MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK! zn%Mz84! z89Am v^$UE9wEwZQcUE%amp。 qYpEh5pDx2zVkumamp。 MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK! zn%Mz849Gx^Gj qv^$UE9wEwZQcUE%amp。 qYpEh5pDx2zVkumamp。qYpEh5pDx2zVkumamp。 gTXRm6X4NGpP$vSTTamp。 gTXRm6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。ksv*3t nGK8!z89Am YWpazadNuKNamp。 gTXRm6X4NGpP$vSTTamp。 ksv*3tnGK8! z89Am YWpazadNuKNamp。 MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK! zn% Mz849Gx^Gj qvadNuKNamp。MuWFA5uxY7JnD6YWRr Wwc^vR9CpbK! zn%Mz849Gx^Gj qv^$UE9wEwZQcUE%amp。 MuWFA5ux^Gj qv^$UE9wEwZQcUE%amp。 MuWFA5uxY7JnD6YWRrWwc^vR9CpbK! zn% Mz849Gx^Gjqv^$UE9wEwZQcUE% amp。 MuWFA5uxY7JnD6YWRrWwc^vR9amp。 qYpEh5pDx2zVkumamp。 gTXRm6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。gTXRm 6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。 gTXRm6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。gTXRm 6X4NGpP$vSTTamp。 gTXRm 6X4NGpP$vSTTamp。 QA9wkxFyeQ^! djsXuyUP2kNXpRWXm Aamp。qYpEh5pDx2zVkumamp。 qYpEh5pDx2zVkumamp。 QA9wkxFyeQ^! dj sXuyUP2kNXpRWXm Aamp。 qYpEh5pDx2zVkumamp。 qYpEh5pDx2zVkumamp。 qYpEh5pDx2zVkum amp。 qYpEh5pDx2zVkumamp。 在完成 論文 的過程中 導(dǎo)師 耐心的指導(dǎo)和 嚴(yán)謹(jǐn)?shù)闹螌W(xué)態(tài)度,精湛的學(xué)術(shù)造詣和誨人不倦的精神給我留下了非常深刻的印象,使我 受益匪淺 ,為我今后的學(xué)習(xí)和工作樹立了楷模。 4 分析總結(jié) 語音信號端點檢測是語音信號處理中非常重要的一項預(yù)處理技術(shù),因此是語音信號處理中不可缺少的一步。接下來進(jìn)行第二級判 20 斷 , 由于語音的起點很可能是能量很弱的清音 , 此時還采用短時能量來區(qū)分清音和無聲顯然已不合適 , 應(yīng)采用過零率。而如果在過渡段中兩個參 數(shù)中的任一個超過了高門限,就可以確信進(jìn)入語音段了。 其端點檢測的流程如下所述:開始進(jìn)行端點檢測之前,首先為短時能量和過過零率分別確定兩個門限 amp amp zcr zcr2, 其中 amp zcr2 分別為短時能量和過零率比較低的門限,其數(shù)值比較小,對信號的變化比較敏感,很容易就會超過。 該算法的原理簡述如下 : 對上 述兩種特征作一個統(tǒng)計估計,得到兩個門限值,利用短時能量檢測濁音,短時過零率檢測清音,兩者配合從而確定語音的端點。另外,利用短時過零率還可以從背景噪聲中找出語音 信號,判斷寂靜無聲段和有聲段的起點和終點的位置。 本文在 MATLAB 軟件 中實現(xiàn)求語音短時過零率的關(guān)鍵代碼為 %計算過零率 tmp1=enframe(x(l:length(x)l), FrameLen, Framelne)。而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。 語音信號的短時能量可用以下幾種算法得到: 1 ()NnniE x i??? ( 34) 21 ()NniiE x i??? ( 35) 21 log ( )NniiE x i??? ( 36) 它們分別為絕對值的累加、平方累加和平方的對數(shù)的累加 [12] [13],本文采用的是絕對值的累加進(jìn)行計算的, 本文在 MATLAB 軟件 中實現(xiàn)求語音短時 能量 的關(guān)鍵代碼為 %計算短時能量 amp = sum(abs(enframe(filter([1 ], 1, x), FrameLen, FrameInc)), 2)。上式表明,經(jīng)過窗口加權(quán)的短時能量相當(dāng)于將“語音平方”信號通過一個線性濾波器的輸出,這個濾波器的取樣響應(yīng)為 )(nh 。 短時平均能量 語音和噪聲的主要區(qū)別在它們的能量上,所以能量是經(jīng)常使用的音頻特征參數(shù),是對語音信號最直觀的表示。 ( 4)端點檢測:確定門限后就可以進(jìn)行端點檢測,根據(jù)門限值來區(qū)分有語音段和噪聲段,得出檢測結(jié)果。通常不同的系統(tǒng)需要不同的算法以滿足在精度、復(fù)雜度、魯棒性、敏感性和響應(yīng)時間等方面的需求。 ( 1) 短時頻譜和短時功率譜 設(shè)信號 )(mxn 經(jīng)過傅里葉變換后在頻域記為 )( jwn eX ,則 )( jwn eX 與 )(mxn 的關(guān)系見公式 26。語音信 號的時域參數(shù)有短時能量、短時平均幅度、短時過零率、短時自相關(guān)函數(shù)等,這些是語音信號中一組最基本的短時參數(shù),在各種語音信號數(shù)字處理技術(shù)中都有重要應(yīng)用。 表 21 1s長的各種窗的主瓣寬度和旁瓣高度 矩形 漢明 漢寧 主瓣寬度 旁瓣寬度 13dB 43dB 32dB 從表中可知:矩形窗的主瓣寬度最小,但其旁瓣高度最高;漢明窗的主瓣最寬,而旁瓣高度最低。將語音信號劃分為許多短時的語音段,每個短時的語音段稱為一個分析幀。目的是提升高頻部分,使信號變得平坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比求頻譜,而且預(yù)加重零點與輻射零點將抵消聲門波的影響,使語音信號中只包含聲道部分,以便于頻譜分析或聲道參數(shù)分析。研究表明,在5ms40ms 的范圍內(nèi),語音信號的頻譜特性和一些物理特征參數(shù)基本保持不變。 現(xiàn)有的算法存在的主要問題有兩點 : 6 一、在具有較強(qiáng)噪聲的環(huán)境下,語音端點檢測往往存在著大量的誤判,不利于后續(xù)的處理過程 ; 二、在高噪聲的環(huán)境下不能有效的檢測出語音信號段,造成了有效信息的丟失。 ( 4) 應(yīng)該盡可能避免在檢測中丟失鼻韻和弱摩擦音等與噪聲特性相似、短時參數(shù)較少的語音。那時的算法名稱叫VAD(Voice Aotivity Detection),指的是將語音段和無語音段分開的處理過程。 另外在通信系統(tǒng)中,典型的會話信道大約有 40%的時間真正用于傳輸語音,其余60%的時間傳輸?shù)亩际庆o默和背景噪聲。 語音端點檢測的準(zhǔn)確性對于語音識別系統(tǒng)的性能有著較大的影響。語音信號處理與信息科學(xué)中最活躍的前沿科學(xué)密切聯(lián)系,并且共同發(fā)展。 隨著現(xiàn)代科學(xué)的蓬勃發(fā)展,人類社會越來越顯示出信息社會的特點,猶如衣、食、住、行對于人類是必要的一樣,通信和信息交換也成為了人類社會存在的必要條件,不但在人與人之間,而且在人與機(jī)器之間每時每刻都需要進(jìn)行大量的信息交換。 有效的端點檢測不僅可以減少數(shù)據(jù)的存和處理時間,而且能排除無聲段的噪聲干擾。語音信號的好壞、語音識別率的高低,都取決于語音信號處理的好壞。 關(guān)鍵詞: 語音信號處理;語音端點檢測;雙門限;短時能量;短時過零率 Voice signal endpoint detection based on MATLAB Abstract: Endpoint detection is a voice signal from the accurate speech signal to the identify start and the end points, the purpose is to enable to separated the effective voice signals and unuseful noise. So, in the speech recognition system, speech enhancement, speech coding, echo cancellation and other systems are widely used. In Current the endpoint detection can be roughly divided into two categories, one is based on the threshold method, another method is based on the method of pattern recognition , the main in this paper is based on the method of threshold method. The Endpoint detection is take a very important position in the speech recognition, it directly affects the performance of the system. In this article first domain analysis in simple speech signal time, than dual threshold algorithm, cepstrum algorithm, spectral entropy algorithm for endpoint detection, and these types of endpoint detection algorithms, and experimental analysis points and analysis the advantages and disadvantages of this method. Key word: Signal processing。本文首先對語音信號進(jìn)行簡單的時域和頻域 分析 及預(yù)處理 ,其次利用 基于短時能量和短時過零率的 雙門限算法進(jìn)行語音端點檢測,并對這幾種用這種算法進(jìn)行端點檢測,進(jìn)行實驗分析,分析此方法的優(yōu)缺點。語音信號處理包括語音通信、語 音增強(qiáng)、語音合成、語音識別和說話人識別等方面。因此,端點檢測的效率、質(zhì)量在語音處理系統(tǒng)中顯得至關(guān)重要,廣泛開展端點檢測實現(xiàn)手段方面的研究,有一定的現(xiàn)實意義 [2]。 研究背景及意義 3 語音 [4]是語言的聲學(xué)表現(xiàn)形式 , 語言是人類特有的功能,聲音是人類常用的 信息交 語言學(xué)、聲學(xué)、生理學(xué)、心 理學(xué)和數(shù)學(xué)等諸多領(lǐng)域的內(nèi)容。多媒體技術(shù)的發(fā)展,使語音技術(shù)逐漸在越來越多的場合中推廣使用,語音信號處理技術(shù)發(fā)展迅速,其研究成果具有重要的學(xué)術(shù)及應(yīng)用價值,涉及一系列前沿課題。 有效的端點檢測技術(shù)不僅能減少系統(tǒng)的處理時間、提高系統(tǒng)的處理實時性,而且能排除無聲段的噪聲干擾,從而使后續(xù)工作的性能得以較大提高。因此,從混有不同噪聲的信號中準(zhǔn)確提取純凈的語音信號就成了語音識別系統(tǒng)中的一個重要的環(huán)節(jié)。當(dāng)時是在一個實時語音翻譯系統(tǒng)中,為了解決語音段和無語音段的檢測問題而提出來的。 ( 3) 對于爆破音的寂靜段,應(yīng)將其納入語音的范圍而不是無聲段。而音節(jié)的起點 — 聲母大多都是清聲母,還有送氣與不送氣的塞音和塞差音,當(dāng)背景噪聲較大時,清音電平與噪聲電平相差無幾,將它們與環(huán)境噪聲分辨是比較困難的 ,這也是雙門限法的不足之處 。但是,從另一方面來看,由于語音的形成過程與發(fā)音器官的運(yùn)動密切相關(guān),這種物理運(yùn)動比起聲音振動速度來講要緩慢得多,因此,語音信號常??杉俣槎虝r平穩(wěn)的。由于語音信號的平均功率受聲門激勵和口鼻輻射影響,高頻端大約在 800Hz 以上按 6dB/倍頻程跌落,即 6dB/oct(2 倍頻 )或20dB/dec(10 倍頻 ),所以求語音信號頻譜時,頻率越高相應(yīng)的成分越小,高頻 部分的頻譜比低頻部分的難求,為此要在預(yù)處理中進(jìn)行預(yù)加重處理。 在進(jìn)行了預(yù)加重后,接下來就要對語音信號進(jìn)行加窗分幀處理。以上這些窗函數(shù)的幅度頻率響應(yīng)都具有低通特性,它們 的主瓣寬度和旁瓣高度如表 9 21 所示。時域分析通常用于最基本的參數(shù)分析以及用于語音的分割、預(yù)處理等。由于語音信號的特性是隨著時間緩慢變化,