freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音信號的端點檢測畢業(yè)論文-在線瀏覽

2025-05-01 09:55本頁面
  

【正文】 計算量和縮短處理時間 ,而且能排除無聲段的噪聲干 5 擾、提高語音識別的正確率 ,因此它廣泛應用于 語音識別、語音增強、語音編碼、回聲抵消等系統(tǒng)中 。當時是在一個實時語音翻譯系統(tǒng)中,為了解決語音段和無語音段的檢測問題而提出來的。傳統(tǒng)的語音端點檢測算法都是針對實驗室安 靜環(huán)境,直到近年來,噪聲環(huán)境下的語音端點檢測才開始研究。各有不同的延時、敏感度和運算量,這在實驗室環(huán)境下己經(jīng)得到了很好的效果。 一般來說,理想的語音端點檢測算法應當能夠滿足以下幾點 : ( 1) 門限值應該可以對背景噪聲的變化有一定的適應性。 ( 3) 對于爆破音的寂靜段,應將其納入語音的范圍而不是無聲段。 ( 5) 應該避免使用過零率作為判決標準而帶來的負面影響。在所有這些特征中,魯棒性是最難達到的。 傳統(tǒng)算法中大都根據(jù)語音信號的時域特征,如基于能量和短時過零率等 ,在較強噪聲環(huán)境下,人類語言中的清音和摩擦音往往和背景噪聲混合在一起,無法準確的分辨出語音和噪聲的端點,容易發(fā)生漏檢和虛檢的情況。而音節(jié)的起點 — 聲母大多都是清聲母,還有送氣與不送氣的塞音和塞差音,當背景噪聲較大時,清音電平與噪聲電平相差無幾,將它們與環(huán)境噪聲分辨是比較困難的 ,這也是雙門限法的不足之處 。 以上兩個問題也得到了廣大研究者的重視,進幾年來,研究者們經(jīng)過了不懈的努力,提出了各種區(qū)別語音和噪聲的特征參數(shù),用來提高算法的抗噪聲性能,或是將幾種特征組合成一個新的特征參數(shù)來進行端點檢測,而對語音端點的判決也由原來的單一門限發(fā)展到多門限以至于自適應門限,使得算法精度不斷得到提高。 2 語音信號處理 語音信號特點 語音信號是隨時間變化的一維信號,由一連串的音組成,各個音的排列有一定的規(guī)則。語音信號本身的冗余度是較大的,少數(shù)輔音清晰度下降并不明顯影響語句的可懂度,比如通常的模擬電話帶寬只有 3KHz~4KHz。但是,從另一方面來看,由于語音的形成過程與發(fā)音器官的運動密切相關(guān),這種物理運動比起聲音振動速度來講要緩慢得多,因此,語音信號常??杉俣槎虝r平穩(wěn)的。這樣,我們就可以將平穩(wěn)過程的處理方法和理論引入到語音信號的短時處理中。 語音信號預處理 為了消除因為人類發(fā)聲器官本身和因一些采集語音信號的設備等所引起的混疊、高次諧波失真現(xiàn)象,在對語音信號進行分析和 處理之前,必須對其進行預處理。 預加重 在進行語音信號數(shù)字處理時,為了獲取一段語音信號的時域波形,首先要將語音 7 信號轉(zhuǎn)換成電信號,再用 A/D 轉(zhuǎn)換器將其變換為離散的數(shù)字化采樣信號。由于語音信號的平均功率受聲門激勵和口鼻輻射影響,高頻端大約在 800Hz 以上按 6dB/倍頻程跌落,即 6dB/oct(2 倍頻 )或20dB/dec(10 倍頻 ),所以求語音信號頻譜時,頻率越高相應的成分越小,高頻 部分的頻譜比低頻部分的難求,為此要在預處理中進行預加重處理。圖 表明了語音預處理的過程 圖 語音信號的預處理 預加重一般是在語音信號數(shù)字化之后,用具有 6dB/倍頻程的提升高頻特性的預加重數(shù)字濾波器來實現(xiàn),它一般是一階的數(shù)字濾波器 : 11)( ??? zzH ? ( 21) 式中 ? 的取值接近于 1。 加窗分幀 語音端點檢測首先要進行分幀處理,然后依次判斷每一幀是否為語音的端點。如果采用較小的窗長 ,則計算量增加 , 語音識別的速度會降低。 在進行了預加重后,接下來就要對語音信號進行加窗分幀處理。幀和幀之間既可以連續(xù),也可以重疊。 采樣 量化 預加重 加窗分幀 算法處理 語音 8 圖 幀長和幀移 如圖 所示 分幀一般采用交疊分段的方法,這是為了使幀與幀之間能平滑過渡,保持其連續(xù)性。分幀是用可移動的有限窗口長度進行加權(quán)實現(xiàn)的,即用窗函數(shù) )(n? [7]乘以語音信號 s(n), 從而形成加窗的語音信號 : )()()( nnSnS ?? ?? ( 22) 由于窗函數(shù)一般取為 S(n)中間大兩頭小的光滑函數(shù),這樣的沖激響應所對應的濾波器具有低通特性,其帶寬和頻率取決于窗函數(shù)的選取。以上這些窗函數(shù)的幅度頻率響應都具有低通特性,它們 的主瓣寬度和旁瓣高度如表 9 21 所示。矩形窗的旁瓣太高,會產(chǎn)生嚴重的泄漏現(xiàn)象 (Gibbs),所以只有在某些特殊場合中采用。 語音信號分析 語音信號處理包括語音識別、語音合成、語音編碼、說話人識別等方面,但是其前提和基礎是對語音信號進行分析。而且,語音識別率的高低,語音合成的音質(zhì)好壞,都取決于對語音信號分析的準確性和精度 。時域分析通常用于最基本的參數(shù)分析以及用于語音的分割、預處理等。 進行語音信號分析時,最先接觸到且最直觀的就是它的時域波形。這種分析方法的特點是 (1)表示語音信號比較直觀、物理意義明確; (2)實現(xiàn)起來比較簡單、運算量少; (3)可得到語音的一些重要參數(shù); (4)可采用示波器等通用設備進行觀測。 頻域分析 語音信號頻域分析,主要是對一些頻域的參數(shù)進行分析,常用的一些頻域參數(shù)有頻譜、功率譜、倒譜等等,最常用的頻域分析方法有傅立葉變換法、線性預測法等。由于語音信號的特性是隨著時間緩慢變化,所以采用短時傅里葉變換,相應的求得特征為短時頻域特征,這里的窗 函數(shù)都使用漢明窗。 jw mNm njwn emxeX ????? )()(10 ( 26) 語音的頻譜為 )( jwn eX 的幅度,則有 )()( jwnjwn eXep ? ( 27) 語音的短時功率譜的是幅度的平方,所以短時功率譜的計算方法為 2)()( jwnjwn eXeG ? ( 28) 線性預測法 線性預測分析的基本思想是:由于語音樣點之間存在相關(guān)性,所以可以用過去的樣點值來預測現(xiàn)在或未來的樣點值,即一個語音的抽樣能夠用過去若干個語音抽樣或它們的線性組合來逼近。而這 組預測系數(shù)就反映了語音信號的特征,可以作為語音信號特征參數(shù)用與語音識別、語音合成等。線性預測的基本原理和語音信號數(shù)字模型密切相關(guān)。從那以后, 11 各種各樣的語音端點檢測算法在許多語音指令識別 、自動語音識別、說話人認證、遠程通訊和語音編碼等方面被提出來。這些方法包括基于能量、過零率、頻譜分析、倒譜分析等算法 。 基于特征的 語音端點檢測的算法步驟 大致 如下 : ( 1)預處理:包括濾波,預加重,分幀,加窗等,這里要考慮濾波器參數(shù)的選擇, 分幀時幀長長度的選擇,加窗窗函數(shù)的選擇。特征提取目的是將輸入信號轉(zhuǎn)化為特征參數(shù),然后利用特征參數(shù)進行語音段與無聲段的區(qū)分。 ( 3)確定門限:語音段最開始的幾幀一般為無聲段,根據(jù)無聲段的特征值大小確定門限值,一般選擇較大和較小兩個門限值 Tmax 和 Tmin,且 Tmin Tmax, Tmin很容易被超過,數(shù)值較小,對信號變化很敏感, Tmax 數(shù)值較大,語音信號要一定的強度才能超過。 語音端點檢測流程圖 語音端點檢測流程圖如圖 所示: 12 圖 語音端點檢測流程圖 基于短時能量和短時過零率的語音端點檢測 語音和噪聲的區(qū)別可以體現(xiàn)在它們的能量上,對于一列疊加有噪聲干擾的語音信號而言,其語音段的能量是噪聲段能量疊加語音聲波能量之和。如果環(huán) 境噪聲和系統(tǒng)輸入噪聲比較小,以致于能夠保證系統(tǒng)的輸入信噪比很高時 (即使最低電平語音的能量也比噪聲能量要高 ), 那么只需要計算輸入開始 信號特征 D 無聲段 DTmin 過渡段,記錄起點 c 加1 5 幀內(nèi)有一幀 Tmax 語音段 s++ DTmax c 加 1 Dmins cminc 記錄終點 返回 Y回 N回 N回 Y回 Y回 N回 Y Y回 N回 N回 13 信號的短時平均能量或短時平均幅度就能夠把語音段和背景噪聲區(qū)分開來。如當語音段的開始和結(jié)束都是弱摩擦音、爆破音或語音段末尾是鼻音時,這些音的短時能量一般很小,往往與背景噪聲處于相同的電平。而采用短時能量和短時過零率相結(jié)合可以很好的克服檢測時可能漏掉的起始和末尾這些音素,從而更好的檢測出語音的端點。語音信號一般可分為無聲段 (靜音段 )、清音段和濁音段。 所謂短時能量 [9] [10],就是先對語音信號進行分幀處理,然后對每一幀分別求其能量。 14 圖 短時能量在清音無聲和濁音三種情況下條件概率密度函數(shù)示意圖 從圖 中可以看出,在三種情況中,濁音的 短時能量最大,清音的短時能量次之,無聲的短時能量最小。 令 )()( 2 nnh ?? ,則有 : ????? ??? mn mnhmxE )()(2 ( 32) 式中, )(nh 為可移動的有限長度的窗 函數(shù),用來實現(xiàn)分幀處理 ,是低通濾波器的單位沖激響應。 短時能量函數(shù)可用來區(qū)分清音段和濁音段 。對于高信噪比的語音信號,無語音信號的噪聲能量 nE 很小, 而 nE語音信號的能量顯著增大到某一數(shù)值,由此可以區(qū)分語音信號的起始點和結(jié)束點。在實際應用中往往很難 15 保證有很高的信噪比,而且在某些特殊情況下,如當語音段的開始和結(jié)束都是弱摩擦音、爆破音或語音段末尾是鼻音時,這些音的短時能量一般很小,往 往與背景噪聲處于相同的電平。因此, Rbainezr 提出了在短時能量的基礎上結(jié)合短時平均過零率的雙門限端點檢測算法。 通過 MATLAB 仿真得出 其短時能量值幅度 如圖 所示: 圖 短時能量波形圖 16 從圖中可以看出“端點檢測”語音信號中語音部分的能量是最高的,而語音部分又分成靜音段、清音段、濁音段。 nE 值大的對應于濁音段,而 nE 值小的對應于清音段。 短時過零率 短時過零率表示一幀語 音信號波形穿過橫軸 (零電平 )的次數(shù) [14]。對于連續(xù)語音信號,過零即意味著時域波形通過時間軸 。過零率就是樣本改變符號的次數(shù)。 第二,用于判別清音和濁音、有話和無話。而發(fā)清音時,多數(shù)能量出現(xiàn)在較高頻率上。當然,這種高低僅是相對而言的,并沒有精確的數(shù)值關(guān)系。 tmp2=enframe(x(2:length(x)), FrameLen, Framelne)。 diffs=(tmp1tmp2)。 和短時能量一樣,短時過零率也是隨機參數(shù),對應于無聲段、清音段以及濁音段,它們分別具有的短時過零率概率函數(shù)如圖 所示 。短時過零 率可以區(qū)別語音是清音還是濁音,它還可以從背景噪聲中找出語音信號,如下圖 所示: 圖 語音信號短時過零率波形圖 18 從圖 中可以看出“端點檢測”語音信號的過零率,在語音信號中清音段的過零率情況,圖中幅度變化反映了過零率次數(shù)的高低。在背景噪聲較小時用短時平均能量識別較為有效,而在背景噪聲較大時用短時平均過零率識別較為有效。這種方法在高信噪比時,能有效的檢測出語音信號的端點,但是隨著信噪比的下降,檢測的準確率下降,特別是在噪聲很大時,完全不能檢測出語音端點。在 基于短時能量和過零率的雙門限端點檢測算法中首先為短時能量和過零率分別確定兩個門限,一個為較低的門限,對信號的變化比較敏感,另一個是較高的門限。 本文采用短時能量和短時過零率相結(jié)合的方法, 利用短時能量和短時過零率兩個門限來確定語音信號的起點和終點, 目的是從采集到的語音信號中分離出真正的語音信號作為系統(tǒng)處理的對象。由于采集的聲音信號中最初的短時段多為無聲或背景噪聲,這樣就可以利用已知為“靜態(tài)”的最初幾幀 (一般取 10 幀 )信號計算其過零率閥值 zcr 及高、低能量閥值 amp2(低能量閥 )和 amp1 (高能量閥 )。 本文在計算短時能量之前,先經(jīng)過一個濾波器,高通濾波器,此為預加重濾波器,目的在于濾除低頻干擾 ,尤其是 50Hz 或 60Hz 的工頻干擾,將對于語言識別更為有 19 用的高頻部分的頻率進行提升,在計算短時能量之前應用該濾波器,還可以起到消除直 流 漂移 、抑 制隨 機 噪聲 和提 升清 音部 分能 量 的效 果。文中能量門限調(diào) 整代碼為: amp1=min(amp1,max(amp)/4)。 根據(jù)語音信號的實際情況對門限值進行調(diào)整,以便更好的對語音端點進行檢測。另外 amp zcr1 是比較高的門限, 數(shù)值比較大,信號必須達到一定的強度,該門限才可能被超過。高門限被超過則可以基本確信是由于語音信號引起的。程序中使用一個變量 status 來表示當前所處的狀態(tài)。在過渡段中,由于參數(shù)的數(shù)值比較小,不能確信是否處于真正的語音段,因此只要個參數(shù)的數(shù)值都回落到低門限以下,就可以確信進入語音段落。 一些突發(fā)性的噪聲也可以引起短時能量或過零率的數(shù)值很高,但是往往不能維持足夠的長的時間,如門窗的開關(guān)、物體的碰撞等引起的噪聲。當前狀態(tài)處于語音時,如果兩個參數(shù)的值下降低到低門限以下,而且總的記時長度小于最短時間門限,則認為這是一段噪音,繼續(xù)掃描以后的語音數(shù)據(jù),否則就標記好結(jié)束端點,并返回。該方法需做出兩級判斷 : 首先利用濁音的短時能量最大的特點 , 由 能量定位語音的大致位置。再根據(jù)背景噪聲的平均能量設定一個比 TH 稍低的門限 T L , 如果信號的能量大于 TL ,則所對應的端點 C、 D 之間仍是語音信號 , 至此完成了第一級判斷。根據(jù)短時過零率設定一個新的較低門限 T , 求越過 該門的過零率 ,
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1