freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

特定人孤立詞語音識別的研究畢業(yè)論文-wenkub.com

2025-06-19 16:00 本頁面
   

【正文】 if silence maxsilence % 靜音還不夠長,尚未結(jié)束 count = count + 1。 else % 靜音狀態(tài) status = 0。 silence = 0。 x2 = 0。temp=temp/10。for i=1:10。diffs = (tmp1 tmp2)。silence = 0。maxsilence = 8。amp1 = 10。Sons,1976.[10] 何強(qiáng),何英.MATLAB擴(kuò)展編程[M].第一版,北京:清華大學(xué)出版社.附錄A 部分程序%function [x1,x2] = vad(x)%幅度歸一化到[1,1]x = double(x)。 語音識別仿真下圖是數(shù)字1—6在MATLAB環(huán)境下的識別結(jié)果顯示圖16 數(shù)字1—6在MATLAB環(huán)境下的識別結(jié)果顯示結(jié) 論本文著重介紹的四個方面的知識:語音識別的發(fā)展歷史及前景、語音識別系統(tǒng)的基本理論、Dynamic Time Warping (DTW)算法和四狀態(tài)端點(diǎn)檢測法,仿真表明改進(jìn)型的DTW算法比傳統(tǒng)的DTW算法更精確,更快速;也表明四狀態(tài)的端點(diǎn)檢測法是基于動態(tài)噪聲設(shè)計(jì)的,有效好的抗噪能力。但是,改進(jìn)的DTW算法計(jì)算得到的距離明顯小于傳統(tǒng)的DTW算法。表1至表4中,行代表參考模板,列代表測試模板。 實(shí)驗(yàn)一是對單個字放、停、前、后、開、關(guān)的識別。語音端點(diǎn)檢測的好壞對系統(tǒng)的識別率有重要影響,基于動態(tài)噪聲的四狀態(tài)端點(diǎn)算法能夠比較好地檢測到語音的端點(diǎn),可以減少數(shù)據(jù)量、提高處理速度,也為后續(xù)的孤立詞識別奠定基礎(chǔ)。從圖上可以看出,能夠準(zhǔn)確檢測到孤立詞的語音端點(diǎn)。計(jì)算過零率和短時能量之前要對讀取的語音信號進(jìn)行歸一化處理。而如果在起始過渡狀態(tài)中兩個參數(shù)只要有一個超過了高門限,就可以確定進(jìn)入有效語音狀態(tài)。圖11 “停止”的短時能量和過零率 端點(diǎn)檢測算法子程序流程圖status=1status=3status=0,silence=0count=0status=2,計(jì)算單字的起始端點(diǎn)能量或過零率大于高門限輸入一幀語音計(jì)算短時能量和過零率status等于0或1silcent=0能量或過零率超過低門限status=0count=0count=count+1silence=silence+1計(jì)算X2status等于2Silence小于靜音時間門限count小于語音長度門限能量或過零率大于低門限返 回NNNNNNNYYYYYYY圖12 基于四狀態(tài)轉(zhuǎn)移的端點(diǎn)檢測流程圖上圖[7]是基于動態(tài)噪聲的四狀態(tài)端點(diǎn)檢測方法的子程序流程圖。 如果輸入信號中有50Hz工頻干擾或者A/D變換點(diǎn)的工作點(diǎn)偏移時,用第二章中定義的短時過零率來區(qū)分無聲和清音就不可靠。設(shè)定六個門限值:短時能量和過零率分別有兩個門限,一個高門限,一個低門限;最短語音時間門限,防止誤檢,排除突發(fā)性的噪聲;最大靜音門限,確定語音是否結(jié)束。把整個端點(diǎn)檢測過程總共分成4個狀態(tài):status0、statusstatus2和status3分別代表靜音狀態(tài)(含噪聲)、起始過渡狀態(tài)、語音狀態(tài)和結(jié)束狀態(tài)。圖9 預(yù)加重后的語音效果 改進(jìn)的端點(diǎn)檢測算法及仿真 改進(jìn)的端點(diǎn)檢測算法資料表明,語音識別錯誤的原因一半來自端點(diǎn)檢測。根據(jù)上式進(jìn)行預(yù)加重。由于語音識別系統(tǒng)牽涉的算法子程序比較多,為了方便驗(yàn)證。W i d t hNM圖7 對角線附近的帶狀區(qū)域圖在這個范圍之內(nèi)按動態(tài)規(guī)劃路徑計(jì)算累積匹配距離,可以進(jìn)一步減少存儲空間,減少計(jì)算量,提高識別速度。 ymin,ymax的計(jì)算如下式所示[3]Xa = Xb 時:12—12—x → 2 x x ≤ Xa2 x + (M – 2N ) → x + (M – N ) x > Xa12—當(dāng)Xa < Xb時比較分三段:12—12—12—12—12—x → 2 x x ≤ Xa x → x + (M – N ) Xa < x ≤ Xb2 x + (M – 2N ) → x + (M – N ) x > Xb12—當(dāng)Xa > Xb時:12—12—12—12—12—x → 2 x x ≤ Xb x → x + (M – N ) Xb < x ≤ Xa2 x + (M – 2N ) → x + (M – N ) x > Xa12— 沿X軸上每前進(jìn)一幀,雖然所要比較的Y軸上的幀數(shù)不同,但彎曲特性是一樣的,這樣, 路徑的累積距離都為: D(x,y) = d(x,y) + min[D(x1,y) , D(x1,y1) , D(x1,y2)] (26)由于X 軸上每前進(jìn)一幀,只需要用到前一列的積累距離,所以只需兩個矢量D 和d 分別保存前一列的累積距離和當(dāng)前列的累積距離,而不用保存整個矩陣。 另外,因?yàn)槊恳涣懈鞲顸c(diǎn)上的匹配計(jì)算只用到了前一列的3 個網(wǎng)格,所以沒有必要保存所有的幀匹配距離矩陣和累積距離矩陣。 改進(jìn)的DTW算法通常,規(guī)整函數(shù)被限制在一個平行四邊形的網(wǎng)格內(nèi),它的一條邊斜率為2,另一條邊斜率為1/ 2。求最佳路徑的問題即為:Σ D[n i,m i] = minN n i =1^m i =Φ(n i) ∈γΣ D[n i,m i] N n i =1m i =Φ(n i) ∈γΦ(●) (21)m i =Φ(n i) ^其中 為最佳路徑函數(shù)。如下圖所示:21 2 3 4 5 6 7 8 9 10 NM91345678圖5 DTW算法搜索路徑假設(shè)路徑通過的格點(diǎn)依次為(n1,m1),…,(ni,mi),…,(nN,mM),其中(n1,m1)=(1,1),(nN,mM)=(N,M)。 設(shè)測試模板T共有N幀,參考模板R共有M幀,將測試模板和參考模板的幀號分別在坐標(biāo)系的橫坐標(biāo)和縱坐標(biāo)上標(biāo)出,則各個幀號之間的關(guān)系可以形成一個網(wǎng)格,網(wǎng)格中的任何一個交叉點(diǎn)(n,m)表示測試模板的T(n)和參考模板的R(m)相交,并且該交叉點(diǎn)擁有幀失真為D[T(n),R(m)]。在用DTW算法進(jìn)行識別判決時,由于測試語音與參考模式語音長短不同,因此需要通過DTW動態(tài)計(jì)算兩個長度不同的模式之間的相似程度,或者叫做失真距離。這是一個將時間規(guī)整和距離測度有機(jī)結(jié)合在一起的非線性規(guī)整技術(shù),保證了待識別特征與模板特征之間最大的聲學(xué)相似特性和最小的時差失真。但是語音具有相當(dāng)大的隨機(jī)性,即使是同一個人在不同的時刻所講的同一句話、發(fā)同一個音,也不可能具有完全相同的時間長度。 在相同的參數(shù)維數(shù)下,Mel濾波器個數(shù)D對識別性能影響不大,這里取24,本文中,是將12階MFCC參數(shù)和它一階差分參數(shù)合并為一個矢量(24階),作為一幀語音信號的參數(shù),因?yàn)閯討B(tài)信息和靜態(tài)信息形成互補(bǔ),所以能很大程度上提高系統(tǒng)的識別性能。( 3 ) 計(jì)算其離散余弦變換。如圖3所示:m圖3 線性頻率上 fm 和 f 關(guān)系MFCC參數(shù)的計(jì)算是以“bark”為頻率基準(zhǔn)的,Mel頻率與線性頻率的轉(zhuǎn)換關(guān)系為:f mel = 2595 log10 (1+ )f700 (15)其中,線性頻率 f 的單位是 Hz [8]。 MFCC參數(shù)計(jì)算流程MFCC參數(shù)計(jì)算的要點(diǎn)是將線性功率譜S ( n)轉(zhuǎn)換成為mel頻率下的功率譜, 這需要在計(jì)算之前先在語音的頻譜范圍內(nèi)設(shè)置若干個帶通濾波器:Hm ( n) ,m = 0 … Y – 1,n = 0 … H /2 – 1Y為濾波器個數(shù),H為一幀語音信號的點(diǎn)數(shù)。實(shí)際上,人的聽覺系統(tǒng)是一個特殊的非線性系統(tǒng),它響應(yīng)不同頻率信號的靈敏度是不同的,基本上是一個對數(shù)的關(guān)系。語音特征參數(shù)提取是語音識別的關(guān)鍵問題,特征參數(shù)的好壞對于語音識別精度和識別時間有很大影響。定義Xn(m)的短時過零率Zn為:Zn = — Σ |sgn [Xn(m)]sgn[Xn(m1)]|N 1m=012 (14) 上式中,sgn[ ] 是符號函數(shù)。第n幀語音信號Xn(m)的短時能量En為:En = Σ |Xn(m)|N 1m=0 (13) 這里定義短時能量即短時幅值,它的主要作用:①區(qū)分濁音和清音,因?yàn)闈嵋舻亩虝r能量比清音大得多。 在實(shí)際應(yīng)用中,通常是利用過零率來檢測清音,用短時能量來檢測濁音,兩者配合實(shí)現(xiàn)可靠的端點(diǎn)檢測。分幀采用可移動的有限窗口進(jìn)行加權(quán)的方法實(shí)現(xiàn),即用窗函數(shù)ω(n)來乘X(n),從而形成加窗語音信號Xω(n)=X(n)* ω(n)。同時,還可以在一些先驗(yàn)知識的幫助下,提高識別的準(zhǔn)確率[3]。語音識別的過程可以被看作模式匹配的過程,模式匹配是指根據(jù)一定的準(zhǔn)則,使未知模式與模型庫中的某一個模型獲得最佳匹配的過程。第3章:針對本文采集的語音樣本,對預(yù)處理后的語音提出了基于動態(tài)噪聲有四狀態(tài)端點(diǎn)檢測法。本文主要是針對普通控制命令詞,小詞匯量的特定人孤立詞語音識別的研究。但語音識別技術(shù)要進(jìn)入成熟的商業(yè)運(yùn)用還有一段艱難的路程,還必須在很多方面取得突破性進(jìn)展。研究重點(diǎn)包括即興口語的識別和理解,自然口語對話,以及多語種的語音同聲翻譯[5]。80年代,的最大特點(diǎn)是從基于模板的方法向統(tǒng)計(jì)模型方法的轉(zhuǎn)變,特別是轉(zhuǎn)向研究隱馬爾柯夫模型HMM的理論、方法和實(shí)現(xiàn)問題。50年代,ATamp。 3.按識別的詞匯量可以分為小詞匯、中詞匯和大詞匯量語音識別。連續(xù)語音識別是指對說話人以日常自然的方式發(fā)音,通常特指用于語音錄入的聽寫機(jī)。語音識別系統(tǒng)從不同角度、不同的應(yīng)用范圍等都會有不同的分類。隨著計(jì)算機(jī)技術(shù)、模式識別和信號處理技術(shù)以及聲學(xué)技術(shù)等的發(fā)展,使得語音識別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。利用這些算法對孤立詞的端點(diǎn)檢測效果,實(shí)驗(yàn)結(jié)果表明,些算法具有抗噪聲能力。本文就是在這種情況下對特定人孤立詞語音識別系統(tǒng)做了一些探討。一般要根據(jù)實(shí)際情況選取。10論文篇幅10000字左右。5論文質(zhì)量35%文題相符較好地完成論文選題的目的要求。10綜合運(yùn)用知識能力能運(yùn)用所學(xué)專業(yè)知識闡述問題;能對查閱的資料進(jìn)行整理和運(yùn)用;能對其科學(xué)論點(diǎn)進(jìn)行論證。 評閱教師評定成績評審基元評審要素評審內(nèi)涵滿分評閱教師實(shí)評分選題質(zhì)量25%目的明確符合要求選題符合專業(yè)培養(yǎng)目標(biāo),體現(xiàn)學(xué)科、專業(yè)特點(diǎn)和教學(xué)計(jì)劃的基本要求,達(dá)到畢業(yè)論文(設(shè)計(jì))綜合訓(xùn)練的目的。15寫作規(guī)范符合學(xué)術(shù)論文的基本要求。5研究方法和手段的運(yùn)用能力能運(yùn)用本學(xué)科常規(guī)研究方法及相關(guān)研究手段(如計(jì)算機(jī)、實(shí)驗(yàn)儀器設(shè)備等)進(jìn)行實(shí)驗(yàn)、實(shí)踐并加工處理、總結(jié)信息。10選題恰當(dāng)題目規(guī)模適當(dāng),難易度適中;有一定的科學(xué)性。提出了基于動態(tài)噪聲的四狀態(tài)端點(diǎn)檢測算法,給出了詳細(xì)的算法流程圖以及具體參數(shù)的設(shè)置。學(xué) 生 簽 名: 200 年 月 日 指導(dǎo)教師簽名: 200 年 月 日指導(dǎo)內(nèi)容記錄(八)修改論文初稿,摘要的修改,章節(jié)的調(diào)節(jié),對仿真結(jié)果要分析,圖表的標(biāo)注和引用的參考文獻(xiàn)要規(guī)范。學(xué) 生 簽 名: 200 年 月 日 指導(dǎo)教師簽名: 200 年 月 日指導(dǎo)內(nèi)容記錄(四)語音樣本的采集,樣本語音庫和測試語音庫的建立。 簽名:
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1