freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)畢業(yè)論文(編輯修改稿)

2025-01-08 15:11 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 語(yǔ)音能量自身的實(shí)際變化規(guī)律,通常將窗寬選為 10ms~20ms。 采樣 量化 預(yù)加重 加窗分幀 算法處理 語(yǔ)音 8 圖 幀長(zhǎng)和幀移 如圖 所示 分幀一般采用交疊分段的方法,這是為了使幀與幀之間能平滑過(guò)渡,保持其連續(xù)性。前一幀和后一幀的交疊部分稱(chēng)為幀移,幀移與幀長(zhǎng)的比值一般取 為0~ 之間。分幀是用可移動(dòng)的有限窗口長(zhǎng)度進(jìn)行加權(quán)實(shí)現(xiàn)的,即用窗函數(shù) )(n? [7]乘以語(yǔ)音信號(hào) s(n), 從而形成加窗的語(yǔ)音信號(hào) : )()()( nnSnS ?? ?? ( 22) 由于窗函數(shù)一般取為 S(n)中間大兩頭小的光滑函數(shù),這樣的沖激響應(yīng)所對(duì)應(yīng)的濾波器具有低通特性,其帶寬和頻率取決于窗函數(shù)的選取。用得最多的三種窗函數(shù)是矩形窗、漢明窗 (Hamming)和漢寧窗 (Hanning),它們的定義如下 : 矩形窗 : ??? ???? 其他 ,0 10 ,1)( Nnn? ( 23) 漢明窗: 0 . 5 4 0 . 4 6 c o s ( 2 /( 1 ) ) , 0 1() 0, n N n Nn ?? ? ? ? ? ??? ?? 其 他 ( 24) 漢寧窗: ? ???? ????? 其他,0 10,)/2c os ()( NnNnn ?? ( 25) 式中 N 為窗長(zhǎng),窗函數(shù) )(n? 的選取 (形狀和長(zhǎng)度 )對(duì)于短時(shí)分析參數(shù)的特性影響很大,為此應(yīng)該選擇合適的窗口,使其短時(shí)參數(shù)能更好地反映語(yǔ)音信號(hào)的特性變化。以上這些窗函數(shù)的幅度頻率響應(yīng)都具有低通特性,它們 的主瓣寬度和旁瓣高度如表 9 21 所示。 表 21 1s長(zhǎng)的各種窗的主瓣寬度和旁瓣高度 矩形 漢明 漢寧 主瓣寬度 旁瓣寬度 13dB 43dB 32dB 從表中可知:矩形窗的主瓣寬度最小,但其旁瓣高度最高;漢明窗的主瓣最寬,而旁瓣高度最低。矩形窗的旁瓣太高,會(huì)產(chǎn)生嚴(yán)重的泄漏現(xiàn)象 (Gibbs),所以只有在某些特殊場(chǎng)合中采用。漢明窗旁瓣最低,可以有效地克服泄漏現(xiàn)象,具有更平滑的低通特性,因此,一般在語(yǔ)音信號(hào)預(yù)處理中,都選用漢明窗來(lái)進(jìn)行語(yǔ)音分幀處理。 語(yǔ)音信號(hào)分析 語(yǔ)音信號(hào)處理包括語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音編碼、說(shuō)話人識(shí)別等方面,但是其前提和基礎(chǔ)是對(duì)語(yǔ)音信號(hào)進(jìn)行分析。只有將語(yǔ)音信號(hào)分析成表示其本質(zhì)特性的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語(yǔ)音通信,以及建立用于識(shí)別的模板或知識(shí)庫(kù)。而且,語(yǔ)音識(shí)別率的高低,語(yǔ)音合成的音質(zhì)好壞,都取決于對(duì)語(yǔ)音信號(hào)分析的準(zhǔn)確性和精度 。 短時(shí)時(shí)域分析 語(yǔ)音信號(hào)本身就是時(shí)域信號(hào),因此,時(shí)域分析方法是應(yīng)用最為廣泛的一種方法,這種方法直接利用語(yǔ)音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析以及用于語(yǔ)音的分割、預(yù)處理等。語(yǔ)音信 號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)平均幅度、短時(shí)過(guò)零率、短時(shí)自相關(guān)函數(shù)等,這些是語(yǔ)音信號(hào)中一組最基本的短時(shí)參數(shù),在各種語(yǔ)音信號(hào)數(shù)字處理技術(shù)中都有重要應(yīng)用。 進(jìn)行語(yǔ)音信號(hào)分析時(shí),最先接觸到且最直觀的就是它的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析,語(yǔ)音的分割、預(yù)處理和大分類(lèi)。這種分析方法的特點(diǎn)是 (1)表示語(yǔ)音信號(hào)比較直觀、物理意義明確; (2)實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單、運(yùn)算量少; (3)可得到語(yǔ)音的一些重要參數(shù); (4)可采用示波器等通用設(shè)備進(jìn)行觀測(cè)。取樣之后要對(duì)信號(hào)進(jìn)行量化,而量化過(guò)程不可避免地會(huì)產(chǎn)生量化誤差,即量化后的信號(hào) 值與原信號(hào)之間的差值。 頻域分析 語(yǔ)音信號(hào)頻域分析,主要是對(duì)一些頻域的參數(shù)進(jìn)行分析,常用的一些頻域參數(shù)有頻譜、功率譜、倒譜等等,最常用的頻域分析方法有傅立葉變換法、線性預(yù)測(cè)法等。 10 傅立葉變換法 [8] 傅里葉頻譜變換是語(yǔ)音信號(hào)頻域分析中廣泛使用的方法, 是分析線性系統(tǒng)和平穩(wěn)信號(hào)穩(wěn)態(tài)特性強(qiáng)有力的手段, 對(duì)分幀加窗后的語(yǔ)音信號(hào),進(jìn)行傅里葉變換和逆傅里葉變換,可以相應(yīng)的得到頻譜,功率譜,倒譜距離,嫡等特征。由于語(yǔ)音信號(hào)的特性是隨著時(shí)間緩慢變化,所以采用短時(shí)傅里葉變換,相應(yīng)的求得特征為短時(shí)頻域特征,這里的窗 函數(shù)都使用漢明窗。 ( 1) 短時(shí)頻譜和短時(shí)功率譜 設(shè)信號(hào) )(mxn 經(jīng)過(guò)傅里葉變換后在頻域記為 )( jwn eX ,則 )( jwn eX 與 )(mxn 的關(guān)系見(jiàn)公式 26。 jw mNm njwn emxeX ????? )()(10 ( 26) 語(yǔ)音的頻譜為 )( jwn eX 的幅度,則有 )()( jwnjwn eXep ? ( 27) 語(yǔ)音的短時(shí)功率譜的是幅度的平方,所以短時(shí)功率譜的計(jì)算方法為 2)()( jwnjwn eXeG ? ( 28) 線性預(yù)測(cè)法 線性預(yù)測(cè)分析的基本思想是:由于語(yǔ)音樣點(diǎn)之間存在相關(guān)性,所以可以用過(guò)去的樣點(diǎn)值來(lái)預(yù)測(cè)現(xiàn)在或未來(lái)的樣點(diǎn)值,即一個(gè)語(yǔ)音的抽樣能夠用過(guò)去若干個(gè)語(yǔ)音抽樣或它們的線性組合來(lái)逼近。通過(guò)使實(shí)際語(yǔ)音抽樣和線性預(yù)測(cè)抽樣之間的誤差在某個(gè)準(zhǔn)則下達(dá)到最小值來(lái)決定唯一的一組預(yù)測(cè)系數(shù)。而這 組預(yù)測(cè)系數(shù)就反映了語(yǔ)音信號(hào)的特征,可以作為語(yǔ)音信號(hào)特征參數(shù)用與語(yǔ)音識(shí)別、語(yǔ)音合成等。 將線性預(yù)測(cè)應(yīng)用與語(yǔ)音信號(hào)處理,不僅是因?yàn)樗念A(yù)測(cè)功能,而且更重要的是因?yàn)樗芴峁┮粋€(gè)非常好的聲道模型及模型參數(shù)估計(jì)方法。線性預(yù)測(cè)的基本原理和語(yǔ)音信號(hào)數(shù)字模型密切相關(guān)。 3 語(yǔ)音端點(diǎn)檢測(cè)算法原理及實(shí)驗(yàn)仿真分析 語(yǔ)音端點(diǎn)檢測(cè)算法原理 端點(diǎn)檢測(cè)最早的應(yīng)用是在貝爾實(shí)驗(yàn)室開(kāi)發(fā)的電話傳輸和轉(zhuǎn)換系統(tǒng)中,用于通信信道的時(shí)間分配,通過(guò)語(yǔ)音檢測(cè)實(shí)現(xiàn)在空閑的信道中插入其他人的話音信息。從那以后, 11 各種各樣的語(yǔ)音端點(diǎn)檢測(cè)算法在許多語(yǔ)音指令識(shí)別 、自動(dòng)語(yǔ)音識(shí)別、說(shuō)話人認(rèn)證、遠(yuǎn)程通訊和語(yǔ)音編碼等方面被提出來(lái)。通常不同的系統(tǒng)需要不同的算法以滿足在精度、復(fù)雜度、魯棒性、敏感性和響應(yīng)時(shí)間等方面的需求。這些方法包括基于能量、過(guò)零率、頻譜分析、倒譜分析等算法 。本文采用 基于 短時(shí)能量和短時(shí)過(guò)零率結(jié)合的雙門(mén)限 法,該方法根據(jù)語(yǔ)音信號(hào)和噪聲信號(hào)的不同特征,提取每一段語(yǔ)音信號(hào)的特征,然后把這些特征值與設(shè)定的閾值進(jìn)行比較,從而達(dá)到語(yǔ)音端點(diǎn)檢測(cè)的目的 。 基于特征的 語(yǔ)音端點(diǎn)檢測(cè)的算法步驟 大致 如下 : ( 1)預(yù)處理:包括濾波,預(yù)加重,分幀,加窗等,這里要考慮濾波器參數(shù)的選擇,分幀時(shí)幀長(zhǎng)長(zhǎng)度的選擇,加窗窗函數(shù)的選擇。 ( 2)特征提?。涸跁r(shí)域或者頻域提取能反映語(yǔ)音本質(zhì)特征的聲學(xué)參數(shù),如短時(shí)能量,短時(shí)過(guò)零率等。特征提取目的是將輸入信號(hào)轉(zhuǎn)化為特征參數(shù),然后利用特征參數(shù)進(jìn)行語(yǔ)音段與無(wú)聲段的區(qū)分。特征提取是語(yǔ)音端點(diǎn)檢測(cè)的關(guān)鍵問(wèn)題,特征參數(shù)選擇的好壞直接影響到語(yǔ)音端點(diǎn)檢測(cè)的準(zhǔn)確率的高低。 ( 3)確定門(mén)限:語(yǔ)音段最開(kāi)始的幾幀一般為無(wú)聲段,根據(jù)無(wú)聲段的特征值大小確定門(mén)限值,一般選擇較大和較小兩個(gè)門(mén)限值 Tmax 和 Tmin,且 Tmin Tmax, Tmin很容易被超過(guò),數(shù)值較小,對(duì)信號(hào)變化很敏感, Tmax 數(shù)值較大,語(yǔ)音信號(hào)要一定的強(qiáng)度才能超過(guò)。 ( 4)端點(diǎn)檢測(cè):確定門(mén)限后就可以進(jìn)行端點(diǎn)檢測(cè),根據(jù)門(mén)限值來(lái)區(qū)分有語(yǔ)音段和噪聲段,得出檢測(cè)結(jié)果。 語(yǔ)音端點(diǎn)檢測(cè)流程圖 語(yǔ)音端點(diǎn)檢測(cè)流程圖如圖 所示: 12 圖 語(yǔ)音端點(diǎn)檢測(cè)流程圖 基于短時(shí)能量和短時(shí)過(guò)零率的語(yǔ)音端點(diǎn)檢測(cè) 語(yǔ)音和噪聲的區(qū)別可以體現(xiàn)在它們的能量上,對(duì)于一列疊加有噪聲干擾的語(yǔ)音信號(hào)而言,其語(yǔ)音段的能量是 噪聲段能量疊加語(yǔ)音聲波能量之和。因此,語(yǔ)音段能量要大于噪聲段的能量。如果環(huán)境噪聲和系統(tǒng)輸入噪聲比較小,以致于能夠保證系統(tǒng)的輸入信噪比很高時(shí) (即使最低電平語(yǔ)音的能量也比噪聲能量要高 ), 那么只需要計(jì)算輸入開(kāi)始 信號(hào)特征 D 無(wú)聲段 DTmin 過(guò)渡段,記錄起點(diǎn) c 加1 5 幀內(nèi)有一幀 Tmax 語(yǔ)音段 s++ DTmax c 加 1 Dmins cminc 記錄終點(diǎn) 返回 Y回 N回 N回 Y回 Y回 N回 Y Y回 N回 N回 13 信號(hào)的短時(shí)平均能量或短時(shí)平均幅度就能夠把語(yǔ)音段和背景噪聲區(qū)分開(kāi)來(lái)。 如圖 就是在比較純凈的內(nèi)容為“端點(diǎn)檢測(cè)” 的原始語(yǔ)音信號(hào)用傳統(tǒng)的短時(shí)能量和過(guò)零率的語(yǔ)音端點(diǎn)檢測(cè),圖中可以很直觀的觀察到語(yǔ)音的短時(shí)能量的大小和其過(guò)零率的高低,如圖 所示: 圖 語(yǔ)音信號(hào)原始波形圖和其短時(shí)能量和過(guò)零率波形圖 短時(shí)能量函數(shù)可用來(lái)區(qū)分清音段和濁音段, nE 值大的對(duì)應(yīng)于濁音段,而 nE 值小的對(duì)應(yīng)于清音段。如當(dāng)語(yǔ)音段的開(kāi)始和結(jié)束都是弱摩擦音、爆破音或語(yǔ)音段末尾是鼻音時(shí),這些音 的短時(shí)能量一般很小,往往與背景噪聲處于相同的電平。在這些情況下,
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1