freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

語(yǔ)音識(shí)別輸入系統(tǒng)設(shè)計(jì)-閱讀頁(yè)

2025-05-27 21:03本頁(yè)面
  

【正文】 器還可起到消除直流漂移、抑制隨機(jī)噪聲和提升清音部分能量的效果。 程序示例如下: i=wavread(39。)。 subplot(1,2,1),plot(i),title(39。)。預(yù)加重后的波形圖 39。 結(jié)果如下: 0 0 . 5 1 1 . 5 2x 1 04 0 . 1 5 0 . 1 0 . 0 500 . 0 50 . 10 . 1 50 . 2預(yù)加重前的波形圖0 0 . 5 1 1 . 5 2x 1 04 0 . 3 0 . 2 0 . 100 . 10 . 20 . 30 . 4預(yù)加重后的波形圖 圖 23 預(yù)加重對(duì)比圖 由 圖 23 可見(jiàn),信號(hào)的頻譜明顯的變的更加平坦。 信號(hào)截短以后產(chǎn)生的能量泄漏現(xiàn)象是必然的,因?yàn)榇昂瘮?shù) w(t)是一個(gè)頻帶無(wú)限的函數(shù),所以即使原信號(hào) x(t)是限帶寬信號(hào),而在截短以后也必然成為無(wú)限帶寬的函數(shù),即信號(hào)在頻域的能量與 分布被擴(kuò)展了。 泄漏與窗函數(shù)頻譜的兩側(cè)旁瓣有關(guān),如果兩側(cè)瓣的高度趨于零,而使能量相對(duì)集中在主瓣,就可以較為接近于真實(shí)的頻譜,為此,在時(shí)間域中可采用不同的窗函數(shù)來(lái)截短信號(hào)。用的最多的三種為矩形窗、漢明窗 (Hamming)和漢寧窗 (Hanning)。 畢業(yè)設(shè)計(jì)(論文)報(bào)告紙 共 50 頁(yè) 第 13 頁(yè) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 裝 ┊ ┊ ┊ ┊ ┊ 訂 ┊ ┊ ┊ ┊ ┊ 線 ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 窗函數(shù)的選擇 對(duì)于窗函數(shù)的選擇,應(yīng)考慮被分析信號(hào)的性質(zhì)與處理要求。 窗口的選擇非常重要,不同的窗口將使能量的平均結(jié)果不同。因此,在語(yǔ)音的時(shí)域處理方法中,一般選擇矩形窗,而在語(yǔ)音的頻域處理方法中,一般選擇漢明窗或漢寧窗。本系統(tǒng)中的端點(diǎn)檢測(cè)采用時(shí)域方法故加矩形窗,計(jì)算 MFCC系數(shù)時(shí)加漢明窗。語(yǔ)音端點(diǎn)檢測(cè)是指用計(jì)算機(jī)數(shù)字處 理技術(shù)從包含語(yǔ)音的一段信號(hào)中找出字、詞的起始點(diǎn)及結(jié)束點(diǎn),從而只存儲(chǔ)和處理有效語(yǔ)音信號(hào)。語(yǔ)音端點(diǎn)檢測(cè)是語(yǔ)音分析、合成和識(shí)別中的一個(gè)重要環(huán)節(jié),其算法的優(yōu)劣在某種程度上也直接決定了整個(gè)語(yǔ)音識(shí)別系統(tǒng)的優(yōu)劣。端點(diǎn)檢測(cè)最常見(jiàn)的方法是短時(shí)能量短時(shí)過(guò)零率雙門(mén)限端點(diǎn)檢測(cè),近年來(lái)在此基礎(chǔ)上發(fā)展出的動(dòng)態(tài)窗長(zhǎng)短時(shí)雙門(mén)限端點(diǎn)檢測(cè)方法也被廣泛使用。另一個(gè)是比較高的門(mén)限,信號(hào)必須達(dá)到一定的強(qiáng)度,該門(mén)限才可能被超過(guò)。整個(gè)語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)可以分為四段:靜音、過(guò)渡段、語(yǔ)音段、結(jié)束。在過(guò)渡段中,由于參數(shù)的數(shù)值比較小,不能確信是否處于真正的語(yǔ)音段,因此只要兩個(gè)參數(shù)的數(shù)值都回落到低門(mén)限以下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。當(dāng)前狀態(tài)處于語(yǔ)音段時(shí),如果兩個(gè)參數(shù)的數(shù)值降低到低門(mén)限以下,且總的記時(shí)長(zhǎng)度小于最短門(mén)限,則認(rèn)為這是一段噪音,繼續(xù)掃描以后的語(yǔ)音數(shù)據(jù),否則就標(biāo)記為結(jié)束端點(diǎn),并返回。針對(duì)上述現(xiàn)象,在端點(diǎn)檢測(cè)前,計(jì)算整個(gè)語(yǔ)音信號(hào)的短時(shí)能量,經(jīng)過(guò)統(tǒng)計(jì),正常語(yǔ)音信 號(hào)的短時(shí)能量都不超過(guò) 60,超過(guò) 60的幀被視為不正常幀,將該幀去掉,再進(jìn)行端點(diǎn)檢測(cè)。而漢語(yǔ)語(yǔ)音信號(hào)最強(qiáng)的部分為 面和中間的部分,在結(jié)尾部分往往只是信息弱時(shí)間長(zhǎng)的拖尾音,將過(guò)多的拖尾音取入識(shí)別匹配所用的特征序列對(duì)識(shí)別無(wú)甚貢獻(xiàn),甚至有害。因此,在結(jié)束點(diǎn)的檢測(cè)上,將對(duì)過(guò)零率的檢測(cè)忽略掉,高低能量門(mén)限合并為一個(gè)門(mén)限,該閾 值取為低門(mén)限的兩倍。 短時(shí)能量 語(yǔ)音信號(hào)的能量隨時(shí)間變化,清音和濁音之間的差別相當(dāng)顯著。定義短時(shí)能量如下: ?? ????? ??? ???? n Nnmmn mnwmxmnwmxE 1 22 )]()([)]()([ (31) 語(yǔ)音和噪聲的主要區(qū)別在它們的能量上。對(duì)第 n 幀語(yǔ)音信號(hào)的短時(shí)能量 En的定義為: ???? 10 2 )(Nm nn mxE (32) 也可解釋為對(duì)式( 31)的簡(jiǎn)化。因?yàn)樵谟?jì)算時(shí)使用的是信號(hào)的平方,故將 En 作為一個(gè)度量語(yǔ)音幅度值變化的函數(shù)有一個(gè)缺陷,即對(duì)高電平非常敏感。 短時(shí)能量函數(shù)的應(yīng)用: 1) 可用于區(qū)分清音段和濁音段。 2) 可用于區(qū)分清音變?yōu)闈嵋艋蛘邼嵋糇優(yōu)榍逡舻臅r(shí)間(根據(jù) nE 值變化的趨勢(shì))。無(wú)信號(hào)(或僅有噪聲能量時(shí)), nE 值很小,有語(yǔ)音信號(hào)時(shí),能量顯著增大。對(duì)于連續(xù)語(yǔ)音信號(hào),過(guò)零意味著時(shí)域波形通過(guò)時(shí)間軸;而對(duì)于離散信號(hào),如果相鄰的取樣值的改變符號(hào)則稱為過(guò)零。有語(yǔ)音的產(chǎn)生模型可知,發(fā)濁音時(shí),聲帶振動(dòng),盡管聲道有多個(gè)共振峰,但由 于聲門(mén)波引起了頻譜的高頻衰落,因此,濁音能量集中在 3kz 以下。高頻率代表著高過(guò)零率,低頻率代表著低過(guò)零率,那么過(guò)零率就與語(yǔ)音信號(hào)的清音和濁音段有著對(duì)應(yīng)的關(guān)系了。例如,清音的過(guò)零率高,濁音的過(guò)零率低,此外,清音和濁音的兩種過(guò)零分布都與高斯分布曲線較為吻合。語(yǔ)音處理領(lǐng)域中的一個(gè)基本問(wèn)題是,如何將一連串的語(yǔ)音信號(hào)進(jìn)行分割,以確定每個(gè)單詞的語(yǔ)音信號(hào),亦即找出每個(gè)單詞的起 始點(diǎn)和終止位置。 雙門(mén)限端點(diǎn)檢測(cè) 雙門(mén)限端點(diǎn)檢測(cè)顧名思義需要兩級(jí)檢測(cè),即短時(shí)能量檢測(cè)和短時(shí)過(guò)零率檢測(cè)。整個(gè)語(yǔ)音端點(diǎn)檢測(cè)分為四部分:靜音段、過(guò)度段、語(yǔ)音段、結(jié)束段。在過(guò)度段中,由于參數(shù)數(shù)值較小,還不能確定是否真的進(jìn)入語(yǔ)音段,只有兩個(gè)參數(shù)的其中一個(gè) 超越了高門(mén)限才被認(rèn)為是進(jìn)入語(yǔ)音段。此外,還有兩種可能會(huì)引起端點(diǎn)檢測(cè)的誤判:一是短時(shí)噪音引起的誤判,此時(shí)則需要引入最小語(yǔ)音長(zhǎng)度門(mén)限進(jìn)行噪聲判定,即 語(yǔ)音段時(shí)間小于一定數(shù)值則認(rèn)定為是噪聲,重新回到靜音段,本系統(tǒng)設(shè) 為 20ms;二是語(yǔ)音中字與字的時(shí)間空隙引起的誤判,此時(shí)需要設(shè)定最大靜音長(zhǎng)度門(mén)限來(lái)降低識(shí)別的錯(cuò)誤率,本系統(tǒng)所訓(xùn)練和識(shí)別的都為單字,故無(wú)需設(shè)置此門(mén)限。門(mén)限值的設(shè)置還沒(méi)有一個(gè)通用可靠的方法,需要根 據(jù)經(jīng)驗(yàn)和特定環(huán)境進(jìn)行調(diào)整。本系統(tǒng)中 EHigh, ELow, ZHigh, ZLow的取值分別為: EHigh=max([min(amp)*10,mean(amp)*,max(amp)*])。 ELow=min([min(amp)*10,mean(amp)*,max(amp)*])。 程序?qū)崿F(xiàn) 計(jì)算短時(shí)過(guò)零率 計(jì)算短時(shí)過(guò)零率的程序如下: FrameLen=240。 畢業(yè)設(shè)計(jì)(論文)報(bào)告紙 共 50 頁(yè) 第 17 頁(yè) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 裝 ┊ ┊ ┊ ┊ ┊ 訂 ┊ ┊ ┊ ┊ ┊ 線 ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ FrameTemp1=enframe(k(1:end1),FrameLen,FrameInc)。 signs=(FrameTemp1.*FrameTemp2)0。 zcr=sum(signs.*diffs,2)。顯示原始波形圖 ……39。 figure,subplot(3,1,1)。 axis([0,(length(k)1)/fs,min(k),max(k)])。(I) “”語(yǔ)音信號(hào)波形 39。 xlabel(39。)。Amplitude(normalized)39。 disp(39。) zcrInd=1:length(zcr)。 plot(zcrInd,zcr)。 title(39。)。Frame39。 ylabel(39。)。 計(jì)算短時(shí)能量 短時(shí)能量的計(jì)算程序如下: amp=sum(abs(enframe(filter([1 ], 1, k), FrameLen, FrameInc)), 2)。顯示短時(shí)能量 ……39。 subplot(3,1,3)。 axis([0,length(amp),0,max(amp)])。(III) 短時(shí)能量 39。 xlabel(39。)。Energy39。 此程序也以訓(xùn)練文件 “”為例進(jìn)行了短時(shí)能量的計(jì)算,并輸出波形圖使其能夠更好的觀察。 %最長(zhǎng)語(yǔ)音間隙時(shí)間 MinAudio=16。 %狀態(tài): 0靜音段 ,1過(guò)渡段 ,2語(yǔ)音段 ,3結(jié)束段 HoldTime=0。 %語(yǔ)音間隙時(shí)間 disp(39。)。 Status=2。 畢業(yè)設(shè)計(jì)(論文)報(bào)告紙 共 50 頁(yè) 第 19 頁(yè) ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ 裝 ┊ ┊ ┊ ┊ ┊ 訂 ┊ ┊ ┊ ┊ ┊ 線 ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ ┊ SilenceTime=0。 HoldTime=HoldTime+1。 HoldTime=0。 else SilenceTime=SilenceTime+1。 elseif (HoldTimeSilenceTime)MinAudio Status=0。 SilenceTime=0。 end end case 3, break。 end end HoldTime=HoldTimeSilenceTime。 disp(39。)。 plot(k)。 title(39。)。Sample39。 ylabel(39。)。color39。red39。 line([EndPoint*FrameInc,EndPoint*FrameInc],[min(k),max(k)],39。,39。)。 plot(zcr)。 title(39。)。Frame39。 ylabel(39。)。Color39。red39。 line([EndPoint,EndPoint],[0,max(zcr)],39。,39。)。 plot(amp)。 title(39。)。Frame39。 ylabel(39。)。Color39。red39。 line([EndPoint,EndPoint],[0,max(amp)],39。,39。)。 此程序中也實(shí)現(xiàn)了對(duì)端點(diǎn)檢測(cè)的波形描述,同樣是以 “”為例,在檢測(cè)出的端點(diǎn)處以紅線標(biāo)記 (垂直于圖的直線) ,如 圖 33所示,這樣可以更為方便的觀察每幀信號(hào)的起始點(diǎn)與終止點(diǎn)。語(yǔ)音信號(hào)中含有豐富的信息 。特征提取就是完成這項(xiàng)工作。 去除對(duì)語(yǔ)音識(shí)別無(wú)關(guān)緊要的冗余信息 , 獲得影響語(yǔ)音識(shí)別的重要信息。從信息論角度講,這是信息壓縮的過(guò)程。常用的語(yǔ)音特征包括基于發(fā)聲器官如聲門(mén)、聲
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1