freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音信號的端點(diǎn)檢測畢業(yè)論文(編輯修改稿)

2025-01-08 15:11 本頁面
 

【文章內(nèi)容簡介】 語音能量自身的實(shí)際變化規(guī)律,通常將窗寬選為 10ms~20ms。 采樣 量化 預(yù)加重 加窗分幀 算法處理 語音 8 圖 幀長和幀移 如圖 所示 分幀一般采用交疊分段的方法,這是為了使幀與幀之間能平滑過渡,保持其連續(xù)性。前一幀和后一幀的交疊部分稱為幀移,幀移與幀長的比值一般取 為0~ 之間。分幀是用可移動的有限窗口長度進(jìn)行加權(quán)實(shí)現(xiàn)的,即用窗函數(shù) )(n? [7]乘以語音信號 s(n), 從而形成加窗的語音信號 : )()()( nnSnS ?? ?? ( 22) 由于窗函數(shù)一般取為 S(n)中間大兩頭小的光滑函數(shù),這樣的沖激響應(yīng)所對應(yīng)的濾波器具有低通特性,其帶寬和頻率取決于窗函數(shù)的選取。用得最多的三種窗函數(shù)是矩形窗、漢明窗 (Hamming)和漢寧窗 (Hanning),它們的定義如下 : 矩形窗 : ??? ???? 其他 ,0 10 ,1)( Nnn? ( 23) 漢明窗: 0 . 5 4 0 . 4 6 c o s ( 2 /( 1 ) ) , 0 1() 0, n N n Nn ?? ? ? ? ? ??? ?? 其 他 ( 24) 漢寧窗: ? ???? ????? 其他,0 10,)/2c os ()( NnNnn ?? ( 25) 式中 N 為窗長,窗函數(shù) )(n? 的選取 (形狀和長度 )對于短時(shí)分析參數(shù)的特性影響很大,為此應(yīng)該選擇合適的窗口,使其短時(shí)參數(shù)能更好地反映語音信號的特性變化。以上這些窗函數(shù)的幅度頻率響應(yīng)都具有低通特性,它們 的主瓣寬度和旁瓣高度如表 9 21 所示。 表 21 1s長的各種窗的主瓣寬度和旁瓣高度 矩形 漢明 漢寧 主瓣寬度 旁瓣寬度 13dB 43dB 32dB 從表中可知:矩形窗的主瓣寬度最小,但其旁瓣高度最高;漢明窗的主瓣最寬,而旁瓣高度最低。矩形窗的旁瓣太高,會產(chǎn)生嚴(yán)重的泄漏現(xiàn)象 (Gibbs),所以只有在某些特殊場合中采用。漢明窗旁瓣最低,可以有效地克服泄漏現(xiàn)象,具有更平滑的低通特性,因此,一般在語音信號預(yù)處理中,都選用漢明窗來進(jìn)行語音分幀處理。 語音信號分析 語音信號處理包括語音識別、語音合成、語音編碼、說話人識別等方面,但是其前提和基礎(chǔ)是對語音信號進(jìn)行分析。只有將語音信號分析成表示其本質(zhì)特性的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語音通信,以及建立用于識別的模板或知識庫。而且,語音識別率的高低,語音合成的音質(zhì)好壞,都取決于對語音信號分析的準(zhǔn)確性和精度 。 短時(shí)時(shí)域分析 語音信號本身就是時(shí)域信號,因此,時(shí)域分析方法是應(yīng)用最為廣泛的一種方法,這種方法直接利用語音信號的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析以及用于語音的分割、預(yù)處理等。語音信 號的時(shí)域參數(shù)有短時(shí)能量、短時(shí)平均幅度、短時(shí)過零率、短時(shí)自相關(guān)函數(shù)等,這些是語音信號中一組最基本的短時(shí)參數(shù),在各種語音信號數(shù)字處理技術(shù)中都有重要應(yīng)用。 進(jìn)行語音信號分析時(shí),最先接觸到且最直觀的就是它的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析,語音的分割、預(yù)處理和大分類。這種分析方法的特點(diǎn)是 (1)表示語音信號比較直觀、物理意義明確; (2)實(shí)現(xiàn)起來比較簡單、運(yùn)算量少; (3)可得到語音的一些重要參數(shù); (4)可采用示波器等通用設(shè)備進(jìn)行觀測。取樣之后要對信號進(jìn)行量化,而量化過程不可避免地會產(chǎn)生量化誤差,即量化后的信號 值與原信號之間的差值。 頻域分析 語音信號頻域分析,主要是對一些頻域的參數(shù)進(jìn)行分析,常用的一些頻域參數(shù)有頻譜、功率譜、倒譜等等,最常用的頻域分析方法有傅立葉變換法、線性預(yù)測法等。 10 傅立葉變換法 [8] 傅里葉頻譜變換是語音信號頻域分析中廣泛使用的方法, 是分析線性系統(tǒng)和平穩(wěn)信號穩(wěn)態(tài)特性強(qiáng)有力的手段, 對分幀加窗后的語音信號,進(jìn)行傅里葉變換和逆傅里葉變換,可以相應(yīng)的得到頻譜,功率譜,倒譜距離,嫡等特征。由于語音信號的特性是隨著時(shí)間緩慢變化,所以采用短時(shí)傅里葉變換,相應(yīng)的求得特征為短時(shí)頻域特征,這里的窗 函數(shù)都使用漢明窗。 ( 1) 短時(shí)頻譜和短時(shí)功率譜 設(shè)信號 )(mxn 經(jīng)過傅里葉變換后在頻域記為 )( jwn eX ,則 )( jwn eX 與 )(mxn 的關(guān)系見公式 26。 jw mNm njwn emxeX ????? )()(10 ( 26) 語音的頻譜為 )( jwn eX 的幅度,則有 )()( jwnjwn eXep ? ( 27) 語音的短時(shí)功率譜的是幅度的平方,所以短時(shí)功率譜的計(jì)算方法為 2)()( jwnjwn eXeG ? ( 28) 線性預(yù)測法 線性預(yù)測分析的基本思想是:由于語音樣點(diǎn)之間存在相關(guān)性,所以可以用過去的樣點(diǎn)值來預(yù)測現(xiàn)在或未來的樣點(diǎn)值,即一個(gè)語音的抽樣能夠用過去若干個(gè)語音抽樣或它們的線性組合來逼近。通過使實(shí)際語音抽樣和線性預(yù)測抽樣之間的誤差在某個(gè)準(zhǔn)則下達(dá)到最小值來決定唯一的一組預(yù)測系數(shù)。而這 組預(yù)測系數(shù)就反映了語音信號的特征,可以作為語音信號特征參數(shù)用與語音識別、語音合成等。 將線性預(yù)測應(yīng)用與語音信號處理,不僅是因?yàn)樗念A(yù)測功能,而且更重要的是因?yàn)樗芴峁┮粋€(gè)非常好的聲道模型及模型參數(shù)估計(jì)方法。線性預(yù)測的基本原理和語音信號數(shù)字模型密切相關(guān)。 3 語音端點(diǎn)檢測算法原理及實(shí)驗(yàn)仿真分析 語音端點(diǎn)檢測算法原理 端點(diǎn)檢測最早的應(yīng)用是在貝爾實(shí)驗(yàn)室開發(fā)的電話傳輸和轉(zhuǎn)換系統(tǒng)中,用于通信信道的時(shí)間分配,通過語音檢測實(shí)現(xiàn)在空閑的信道中插入其他人的話音信息。從那以后, 11 各種各樣的語音端點(diǎn)檢測算法在許多語音指令識別 、自動語音識別、說話人認(rèn)證、遠(yuǎn)程通訊和語音編碼等方面被提出來。通常不同的系統(tǒng)需要不同的算法以滿足在精度、復(fù)雜度、魯棒性、敏感性和響應(yīng)時(shí)間等方面的需求。這些方法包括基于能量、過零率、頻譜分析、倒譜分析等算法 。本文采用 基于 短時(shí)能量和短時(shí)過零率結(jié)合的雙門限 法,該方法根據(jù)語音信號和噪聲信號的不同特征,提取每一段語音信號的特征,然后把這些特征值與設(shè)定的閾值進(jìn)行比較,從而達(dá)到語音端點(diǎn)檢測的目的 。 基于特征的 語音端點(diǎn)檢測的算法步驟 大致 如下 : ( 1)預(yù)處理:包括濾波,預(yù)加重,分幀,加窗等,這里要考慮濾波器參數(shù)的選擇,分幀時(shí)幀長長度的選擇,加窗窗函數(shù)的選擇。 ( 2)特征提?。涸跁r(shí)域或者頻域提取能反映語音本質(zhì)特征的聲學(xué)參數(shù),如短時(shí)能量,短時(shí)過零率等。特征提取目的是將輸入信號轉(zhuǎn)化為特征參數(shù),然后利用特征參數(shù)進(jìn)行語音段與無聲段的區(qū)分。特征提取是語音端點(diǎn)檢測的關(guān)鍵問題,特征參數(shù)選擇的好壞直接影響到語音端點(diǎn)檢測的準(zhǔn)確率的高低。 ( 3)確定門限:語音段最開始的幾幀一般為無聲段,根據(jù)無聲段的特征值大小確定門限值,一般選擇較大和較小兩個(gè)門限值 Tmax 和 Tmin,且 Tmin Tmax, Tmin很容易被超過,數(shù)值較小,對信號變化很敏感, Tmax 數(shù)值較大,語音信號要一定的強(qiáng)度才能超過。 ( 4)端點(diǎn)檢測:確定門限后就可以進(jìn)行端點(diǎn)檢測,根據(jù)門限值來區(qū)分有語音段和噪聲段,得出檢測結(jié)果。 語音端點(diǎn)檢測流程圖 語音端點(diǎn)檢測流程圖如圖 所示: 12 圖 語音端點(diǎn)檢測流程圖 基于短時(shí)能量和短時(shí)過零率的語音端點(diǎn)檢測 語音和噪聲的區(qū)別可以體現(xiàn)在它們的能量上,對于一列疊加有噪聲干擾的語音信號而言,其語音段的能量是 噪聲段能量疊加語音聲波能量之和。因此,語音段能量要大于噪聲段的能量。如果環(huán)境噪聲和系統(tǒng)輸入噪聲比較小,以致于能夠保證系統(tǒng)的輸入信噪比很高時(shí) (即使最低電平語音的能量也比噪聲能量要高 ), 那么只需要計(jì)算輸入開始 信號特征 D 無聲段 DTmin 過渡段,記錄起點(diǎn) c 加1 5 幀內(nèi)有一幀 Tmax 語音段 s++ DTmax c 加 1 Dmins cminc 記錄終點(diǎn) 返回 Y回 N回 N回 Y回 Y回 N回 Y Y回 N回 N回 13 信號的短時(shí)平均能量或短時(shí)平均幅度就能夠把語音段和背景噪聲區(qū)分開來。 如圖 就是在比較純凈的內(nèi)容為“端點(diǎn)檢測” 的原始語音信號用傳統(tǒng)的短時(shí)能量和過零率的語音端點(diǎn)檢測,圖中可以很直觀的觀察到語音的短時(shí)能量的大小和其過零率的高低,如圖 所示: 圖 語音信號原始波形圖和其短時(shí)能量和過零率波形圖 短時(shí)能量函數(shù)可用來區(qū)分清音段和濁音段, nE 值大的對應(yīng)于濁音段,而 nE 值小的對應(yīng)于清音段。如當(dāng)語音段的開始和結(jié)束都是弱摩擦音、爆破音或語音段末尾是鼻音時(shí),這些音 的短時(shí)能量一般很小,往往與背景噪聲處于相同的電平。在這些情況下,
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1