freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)畢業(yè)論文(編輯修改稿)

2025-04-03 09:55 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 些音素,從而更好的檢測(cè)出語(yǔ)音的端點(diǎn)。 短時(shí)平均能量 語(yǔ)音和噪聲的主要區(qū)別在它們的能量上,所以能量是經(jīng)常使用的音頻特征參數(shù),是對(duì)語(yǔ)音信號(hào)最直觀的表示。語(yǔ)音信號(hào)一般可分為無(wú)聲段 (靜音段 )、清音段和濁音段。由于語(yǔ)音是不穩(wěn)定的,所以我們采用“短時(shí)能量” 。 所謂短時(shí)能量 [9] [10],就是先對(duì)語(yǔ)音信號(hào)進(jìn)行分幀處理,然后對(duì)每一幀分別求其能量。短時(shí)能量是隨機(jī)參數(shù),在無(wú)聲段,清音段和濁音段,它們分別具有不同的概率密度函數(shù),圖 給出了短時(shí)能量在清音、無(wú)聲和濁音三種情況下的條件概率密度函數(shù)。 14 圖 短時(shí)能量在清音無(wú)聲和濁音三種情況下條件概率密度函數(shù)示意圖 從圖 中可以看出,在三種情況中,濁音的 短時(shí)能量最大,清音的短時(shí)能量次之,無(wú)聲的短時(shí)能量最小。 n 時(shí)刻某語(yǔ)音信號(hào) {x(n)}的短時(shí)平均能量定義為 : ? ?2)()(????? ??? mn mnmxE ? ( 31) 式中, )(n? 為漢明窗。 令 )()( 2 nnh ?? ,則有 : ????? ??? mn mnhmxE )()(2 ( 32) 式中, )(nh 為可移動(dòng)的有限長(zhǎng)度的窗 函數(shù),用來(lái)實(shí)現(xiàn)分幀處理 ,是低通濾波器的單位沖激響應(yīng)。上式表明,經(jīng)過(guò)窗口加權(quán)的短時(shí)能量相當(dāng)于將“語(yǔ)音平方”信號(hào)通過(guò)一個(gè)線性濾波器的輸出,這個(gè)濾波器的取樣響應(yīng)為 )(nh 。 短時(shí)能量函數(shù)可用來(lái)區(qū)分清音段和濁音段 。 nE 值大的對(duì)應(yīng)于濁音段,而 nE 值小的對(duì) 應(yīng)于清音段。對(duì)于高信噪比的語(yǔ)音信號(hào),無(wú)語(yǔ)音信號(hào)的噪聲能量 nE 很小, 而 nE語(yǔ)音信號(hào)的能量顯著增大到某一數(shù)值,由此可以區(qū)分語(yǔ)音信號(hào)的起始點(diǎn)和結(jié)束點(diǎn)。 語(yǔ)音信號(hào)的短時(shí)平均幅度 [11]定義為 : ????? ??? mn mnmxM )()( ? ( 33) nE 和 nM 都反映語(yǔ)音信號(hào)的強(qiáng)度,但是其特性有所不同。在實(shí)際應(yīng)用中往往很難 15 保證有很高的信噪比,而且在某些特殊情況下,如當(dāng)語(yǔ)音段的開(kāi)始和結(jié)束都是弱摩擦音、爆破音或語(yǔ)音段末尾是鼻音時(shí),這些音的短時(shí)能量一般很小,往 往與背景噪聲處于相同的電平。在這些情況下,只依靠短時(shí)能量或短時(shí)平均幅度來(lái)檢測(cè)語(yǔ)音段的起止點(diǎn)常常會(huì)把語(yǔ)音信號(hào)起始和末尾的這些音素漏掉。因此, Rbainezr 提出了在短時(shí)能量的基礎(chǔ)上結(jié)合短時(shí)平均過(guò)零率的雙門限端點(diǎn)檢測(cè)算法。 語(yǔ)音信號(hào)的短時(shí)能量可用以下幾種算法得到: 1 ()NnniE x i??? ( 34) 21 ()NniiE x i??? ( 35) 21 log ( )NniiE x i??? ( 36) 它們分別為絕對(duì)值的累加、平方累加和平方的對(duì)數(shù)的累加 [12] [13],本文采用的是絕對(duì)值的累加進(jìn)行計(jì)算的, 本文在 MATLAB 軟件 中實(shí)現(xiàn)求語(yǔ)音短時(shí) 能量 的關(guān)鍵代碼為 %計(jì)算短時(shí)能量 amp = sum(abs(enframe(filter([1 ], 1, x), FrameLen, FrameInc)), 2)。 通過(guò) MATLAB 仿真得出 其短時(shí)能量值幅度 如圖 所示: 圖 短時(shí)能量波形圖 16 從圖中可以看出“端點(diǎn)檢測(cè)”語(yǔ)音信號(hào)中語(yǔ)音部分的能量是最高的,而語(yǔ)音部分又分成靜音段、清音段、濁音段。短時(shí)能量函數(shù)可用來(lái)區(qū)分清音段和濁音段。 nE 值大的對(duì)應(yīng)于濁音段,而 nE 值小的對(duì)應(yīng)于清音段。 對(duì)于高信噪比的語(yǔ)音信號(hào),無(wú)語(yǔ)音信號(hào)的噪聲能量很小,而有語(yǔ)音信號(hào)的能量 nE 顯著增大到某一數(shù)值,由此可以區(qū)分語(yǔ)音信號(hào)的起始點(diǎn)和結(jié)束點(diǎn)。 短時(shí)過(guò)零率 短時(shí)過(guò)零率表示一幀語(yǔ) 音信號(hào)波形穿過(guò)橫軸 (零電平 )的次數(shù) [14]。過(guò)零分析是語(yǔ)音時(shí)域分析中最簡(jiǎn)單的一種。對(duì)于連續(xù)語(yǔ)音信號(hào),過(guò)零即意味著時(shí)域波形通過(guò)時(shí)間軸 。而對(duì)于離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱為過(guò)零。過(guò)零率就是樣本改變符號(hào)的次數(shù)。定義語(yǔ)音信號(hào) )(mXn 的短時(shí)過(guò)零率 nZ 為 : ? ? ? ???? ???10 )1(s g n)(s g n21 Nm nnn mxmxZ ( 37) 其中, sgn 為符號(hào)函數(shù),即: ? ? ??? ?? ?? 0)(,1 0)(,1)(s g n nxnxnx ( 38) 過(guò)零率有三類重要應(yīng)用 : 第一,用于 粗略地描述信號(hào)的頻譜特性,就是用多帶濾波器將信號(hào)分為若干個(gè)通道, 對(duì)各通道進(jìn)行短時(shí)平均過(guò)零率和短時(shí)能量的計(jì)算,即可粗略地估計(jì)頻譜特性。 第二,用于判別清音和濁音、有話和無(wú)話。 第三,區(qū)分清音和濁音,對(duì)語(yǔ)音信號(hào)進(jìn)行分析,發(fā)現(xiàn)發(fā)濁音時(shí),盡管聲道有若干個(gè)共振峰,但由于聲門波引起譜的高頻跌落,所以其語(yǔ)音能量約集中在 3kHz 以下。而發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻率上。高頻就意味著高的平均過(guò)零率,低頻就意味著低的平均過(guò)零率,所以可以認(rèn)為濁音時(shí)具有較低的過(guò)零率,而清音時(shí)具有較高的過(guò)零率。當(dāng)然,這種高低僅是相對(duì)而言的,并沒(méi)有精確的數(shù)值關(guān)系。 本文在 MATLAB 軟件 中實(shí)現(xiàn)求語(yǔ)音短時(shí)過(guò)零率的關(guān)鍵代碼為 %計(jì)算過(guò)零率 tmp1=enframe(x(l:length(x)l), FrameLen, Framelne)。 tmp2=enframe(x(2:length(x)), FrameLen, Framelne)。 signs=(tmp1.*tmp2)0。 diffs=(tmp1tmp2)。 17 zcr=sum(signs.*diffs, 2)。 和短時(shí)能量一樣,短時(shí)過(guò)零率也是隨機(jī)參數(shù),對(duì)應(yīng)于無(wú)聲段、清音段以及濁音段,它們分別具有的短時(shí)過(guò)零率概率函數(shù)如圖 所示 。 圖 短時(shí)過(guò) 零率在清音無(wú)聲和濁音三種情況下條件概率密度函數(shù)示意圖 對(duì)于短時(shí)過(guò)零率,由于清音的多數(shù)能量出現(xiàn)在較高的頻率上,因此清音的過(guò)零率較高,而濁音語(yǔ)音具有高頻跌落的頻譜,所以濁音的過(guò)零率低,噪聲的過(guò)零率大小處于清音和濁音之間。短時(shí)過(guò)零 率可以區(qū)別語(yǔ)音是清音還是濁音,它還可以從背景噪聲中找出語(yǔ)音信號(hào),如下圖 所示: 圖 語(yǔ)音信號(hào)短時(shí)過(guò)零率波形圖 18 從圖 中可以看出“端點(diǎn)檢測(cè)”語(yǔ)音信號(hào)的過(guò)零率,在語(yǔ)音信號(hào)中清音段的過(guò)零率情況,圖中幅度變化反映了過(guò)零率次數(shù)的高低。另外,利用短時(shí)過(guò)零率還可以從背景噪聲中找出語(yǔ)音 信號(hào),判斷寂靜無(wú)聲段和有聲段的起點(diǎn)和終點(diǎn)的位置。在背景噪聲較小時(shí)用短時(shí)平均能量識(shí)別較為有效,而在背景噪聲較大時(shí)用短時(shí)平均過(guò)零率識(shí)別較為有效。 基于短時(shí)能量和短時(shí)過(guò)零率的雙門限語(yǔ)音端點(diǎn)檢測(cè)方法充分利用能量和過(guò)零率的優(yōu)點(diǎn),使用過(guò)零率檢測(cè)清音,用短時(shí)能量檢測(cè)濁音,兩者配合來(lái)進(jìn)行語(yǔ)音端點(diǎn)檢測(cè)。這種方法在高信噪比時(shí),能有效的檢測(cè)出語(yǔ)音信號(hào)的端點(diǎn),但是隨著信噪比的下降,檢測(cè)的準(zhǔn)確率下降,特別是在噪聲很大時(shí),完全不能檢測(cè)出語(yǔ)音端點(diǎn)。 基于短時(shí)能量和短時(shí)過(guò)零率的雙門限端點(diǎn)檢測(cè)原理 雙門限法是利用短時(shí)能量和過(guò)零率的 乘積進(jìn)行檢測(cè)的 。在 基于短時(shí)能量和過(guò)零率的雙門限端點(diǎn)檢測(cè)算法中首先為短時(shí)能量和過(guò)零率分別確定兩個(gè)門限,一個(gè)為較低的門限,對(duì)信號(hào)的變化比較敏感,另一個(gè)是較高的門限。當(dāng)?shù)烷T限被超過(guò)時(shí),很有可能是由于很小的噪聲所引起的,未必是語(yǔ)音的開(kāi)始,當(dāng)高門限被超過(guò)并且在接下來(lái)的時(shí)間段內(nèi)一直超過(guò)低門限時(shí),則意味著語(yǔ)音信號(hào)的開(kāi)始。 本文采用短時(shí)能量和短時(shí)過(guò)零率相結(jié)合的方法, 利用短時(shí)能量和短時(shí)過(guò)零率兩個(gè)門限來(lái)確定語(yǔ)音信號(hào)的起點(diǎn)和終點(diǎn), 目的是從采集到的語(yǔ)音信號(hào)中分離出真正的語(yǔ)音信號(hào)作為系統(tǒng)處理的對(duì)象。 該算法的原理簡(jiǎn)述如下 : 對(duì)上 述兩種特征作一個(gè)統(tǒng)計(jì)估計(jì),得到兩個(gè)門限值,利用短時(shí)能量檢測(cè)濁音,短時(shí)過(guò)零率檢測(cè)清音,兩者配合從而確定語(yǔ)音的端點(diǎn)。由于采集的聲音信號(hào)中最初的短時(shí)段多為無(wú)聲或背景噪聲,這樣就可以利用已知為“靜態(tài)”的最初幾幀 (一般取 10 幀 )信號(hào)計(jì)算其過(guò)零率閥值 zcr 及高、低能量閥值 amp2(低能量閥 )和 amp1 (高能量閥 )。過(guò)零率公式 [ 15]: ??? ??? 11 )1()()( Nn ii nxnxizc r ( 39) 計(jì)算 amp2 和 amp1 時(shí),首先計(jì)算最初 10 幀信號(hào)中每幀的短時(shí)平均能量或平均幅度 E ,最大值記為 max,最小值記為 min。 本文在計(jì)算短時(shí)能量之前,先經(jīng)過(guò)一個(gè)濾波器,高通濾波器,此為預(yù)加重濾波器,目的在于濾除低頻干擾 ,尤其是 50Hz 或 60Hz 的工頻干擾,將對(duì)于語(yǔ)言識(shí)別更為有 19 用的高頻部分的頻率進(jìn)行提升,在計(jì)算短時(shí)能量之前應(yīng)用該濾波器,還可以起到消除直 流 漂移 、抑 制隨 機(jī) 噪聲 和提 升清 音部 分能 量 的效 果。 其關(guān) 鍵代 碼 為amp=sum(abs(enframe(filter([],1,x),FrameLen,FrameInc)),2)。文中能量門限調(diào) 整代碼為: amp1=min(amp1,max(amp)/4)。 amp2=min(amp2,max(amp)/8)。 根據(jù)語(yǔ)音信號(hào)的實(shí)際情況對(duì)門限值進(jìn)行調(diào)整,以便更好的對(duì)語(yǔ)音端點(diǎn)進(jìn)行檢測(cè)。 其端點(diǎn)檢測(cè)的流程如下所述:開(kāi)始進(jìn)行端點(diǎn)檢測(cè)之前,首先為短時(shí)能量和過(guò)過(guò)零率分別確定兩個(gè)門限 amp amp zcr zcr2, 其中 amp zcr2 分別為短時(shí)能量和過(guò)零率比較低的門限,其數(shù)值比較小,對(duì)信號(hào)的變化比較敏感,很容易就會(huì)超過(guò)。另外 amp zcr1 是比較高的門限, 數(shù)值比較大,信號(hào)必須達(dá)到一定的強(qiáng)度,該門限才可能被超過(guò)。低 門 限被超過(guò)未必就是語(yǔ)音信號(hào)的開(kāi)始,有可能是時(shí)間很短的噪聲引起的。高門限被超過(guò)則可以基本確信是由于語(yǔ)音信號(hào)引起的。 整個(gè)語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)可以分為四段:靜音、過(guò)度段、語(yǔ)音段、結(jié)束。程序中使用一個(gè)變量 status 來(lái)表示當(dāng)前所處的狀態(tài)。在靜音段,如果能量或過(guò)零率超越了低門限,就應(yīng)該開(kāi)始標(biāo)記起始點(diǎn),進(jìn)入過(guò)渡段。在過(guò)渡段中,由于參數(shù)的數(shù)值比較小,不能確信是否處于真正的語(yǔ)音段,因此只要個(gè)參數(shù)的數(shù)值都回落到低門限以下,就可以確信進(jìn)入語(yǔ)音段落。而如果在過(guò)渡段中兩個(gè)參 數(shù)中的任一個(gè)超過(guò)了高門限,就可以確信進(jìn)入語(yǔ)音段了。 一些突發(fā)性的噪聲也可以引起短時(shí)能量或過(guò)零率的數(shù)值很高,但是往往不能維持足夠的長(zhǎng)的時(shí)間,如門窗的開(kāi)關(guān)、物體的碰撞等引起的噪聲。這些都可以通過(guò)設(shè)定最短時(shí)間門限來(lái)判別。當(dāng)前狀態(tài)處于語(yǔ)音時(shí),如果兩個(gè)參數(shù)的值下降低到低門限以下,而且總的記時(shí)長(zhǎng)度小于最短時(shí)間門限,則認(rèn)為這是一段噪音,繼續(xù)掃描以后的語(yǔ)音數(shù)據(jù),否則就標(biāo)記好結(jié)束端點(diǎn),并返回。 現(xiàn)以孤立 “檢” 字的發(fā)音為例 , 說(shuō)明雙門限檢測(cè)法的原理 , 如圖 1 所示。該方法需做出兩級(jí)判斷 : 首先利用濁音的短時(shí)能量最大的特點(diǎn) , 由 能量定位語(yǔ)音的大致位置。根據(jù)語(yǔ)音短時(shí)能量設(shè)定一個(gè)較高的門限 T H , 若信號(hào)的能量大于 T H , 則可確定2 個(gè)端點(diǎn) A 、 B, 并可認(rèn)為這 2個(gè)端點(diǎn)之間是語(yǔ)音信號(hào) , 這樣相當(dāng)于完成初判。再根據(jù)背景噪聲的平均能量設(shè)定一個(gè)比 TH 稍低的門限 T L , 如果信號(hào)的能量大于 TL ,則所對(duì)應(yīng)的端點(diǎn) C、 D 之間仍是語(yǔ)音信號(hào) , 至此完成了第一級(jí)判斷。接下來(lái)進(jìn)行第二級(jí)判 20 斷 , 由于語(yǔ)音的起點(diǎn)很可能是能量很弱的清音 , 此時(shí)還采用短時(shí)能量來(lái)區(qū)分清音和無(wú)聲顯然已不合適 , 應(yīng)采用過(guò)零率。根據(jù)短時(shí)過(guò)零率設(shè)定一個(gè)新的較低門限 T , 求越過(guò) 該門的過(guò)零率 , 從 C、 D 兩點(diǎn)分別向前、向后搜索 ,找到短時(shí)平均過(guò)零率與門限 T 的2個(gè)交點(diǎn) E 、 F, 這 2個(gè)點(diǎn)就是語(yǔ)音的真正起點(diǎn)和終點(diǎn) [16] 。 圖 雙門限檢測(cè)法原理示意圖 雙門限語(yǔ)音端點(diǎn)檢測(cè)實(shí)驗(yàn) 仿真及 分析 實(shí)驗(yàn)環(huán)境及參數(shù)設(shè)置 雙門限語(yǔ)音端點(diǎn)檢測(cè)是在 MATLAB 軟件環(huán)境下進(jìn)行仿真實(shí)驗(yàn)。文中語(yǔ)音信號(hào)樣本是在實(shí)驗(yàn)室安靜環(huán)境下采用麥克風(fēng)進(jìn)行錄音,以 wav 格式存儲(chǔ)為較純凈的語(yǔ)音樣本。在語(yǔ)音端點(diǎn)檢測(cè)之前首先要對(duì)被測(cè)的語(yǔ)音信號(hào)進(jìn)行預(yù)處理等,包括分幀加窗等。文中加 Hmmaing 窗,通過(guò)特性為 ( 1?? )的濾波器預(yù)加重。對(duì)其他參數(shù)進(jìn)行設(shè)置,如設(shè)置語(yǔ)音幀長(zhǎng)度,幀移長(zhǎng)度, FFT 取 512,門限閥值 設(shè) 置等。 實(shí)驗(yàn)分析 基于短時(shí)能量和短時(shí)過(guò)零率的雙門限語(yǔ)音端點(diǎn)檢測(cè)算法是結(jié)合短時(shí)能量和過(guò)零率 各自優(yōu)點(diǎn)來(lái) 進(jìn)行檢測(cè), 根據(jù)上述方法進(jìn)行實(shí)驗(yàn)仿真,程序代碼在附錄中給出,其仿真結(jié)果如下 : 21 1 2 3 4 5 6 7 8 9x 1 04101Speech1 2 3 4 5 6 7 8x 1 04010Energy1 2 3 4 5 6 7 8x 1 040100ZCR 圖 上述實(shí)驗(yàn)結(jié)果較好地展示了雙門限檢測(cè)法的工作原理 : 首先利用短時(shí)平均能量門限值 ( 先高后低 ) 定位語(yǔ)音端點(diǎn)的大致位置 [17] [18], 之后再利用短時(shí)過(guò)零 率門限尋找端點(diǎn)的精確位置 , 從中可看出實(shí)驗(yàn)效果還是基本讓人滿意的。 4 分析總結(jié) 語(yǔ)音信號(hào)端點(diǎn)檢測(cè)是語(yǔ)音信號(hào)處理中非常重要的一項(xiàng)預(yù)處理技術(shù),因此是語(yǔ)音信號(hào)處理中不可缺少的一步。本文主要圍繞端點(diǎn)檢測(cè)方法進(jìn)行研究, 詳細(xì)闡述短時(shí)能量和短時(shí)過(guò)零率結(jié)合
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1