freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語(yǔ)音識(shí)別dtw算法設(shè)計(jì)(編輯修改稿)

2024-07-15 17:13 本頁(yè)面
 

【文章內(nèi)容簡(jiǎn)介】 量之間的距離。距離函數(shù)取決于實(shí)際采用的距離度量,在DTW算法中通常采用歐氏距離。若N=M則可以直接計(jì)算,否則要考慮將T(n)和R(m)對(duì)齊。對(duì)齊可以采用線性擴(kuò)張的方法,如果NM可以將T線性映射為一個(gè)M幀的序列,再計(jì)算它與之間的距離。但是這樣的計(jì)算沒有考慮到語(yǔ)音中各個(gè)段在不同的情況下的持續(xù)時(shí)間會(huì)產(chǎn)生或長(zhǎng)或短的變化,因此識(shí)別效果不可能最佳。因而更多地是采用動(dòng)態(tài)規(guī)劃(DP)的方法。通常,規(guī)整函數(shù)被限制在一個(gè)平行四邊形的網(wǎng)格內(nèi),如圖61所示。它的一條邊斜率為2,另一條邊斜率為1/2。規(guī)整函數(shù)的起點(diǎn)是(1, 1),終點(diǎn)為(N,M)。DTW算法的目的是在此平行四邊形內(nèi)由起點(diǎn)到終點(diǎn)尋找一個(gè)規(guī)整函數(shù),使其具有最小的代價(jià)函數(shù),保證了測(cè)試模板與參考模板之間具有最大的聲學(xué)相似特性。圖61 DTW原理圖由于在模板匹配過(guò)程中限定了彎折的斜率,因此平行四邊形之外的格點(diǎn)對(duì)應(yīng)的幀匹配距離是不需要計(jì)算的。另外,因?yàn)槊恳涣懈鞲顸c(diǎn)上的匹配計(jì)算只用到了前一列的3個(gè)網(wǎng)格,所以沒有必要保存所有的幀匹配距離矩陣和累積距離矩陣。充分利用這兩個(gè)特點(diǎn)可以減少計(jì)算量和存儲(chǔ)空間的需求,形成一種高效的DTW算法,如圖所示。圖中,把實(shí)際的動(dòng)態(tài)彎折分為三段,(1,xa),(xa+1,xb),(xb+1,N),其中:xa= (2MN)/3,xb=2(2NM)/3xa和xb都取最相近的整數(shù),由此可得出對(duì)M和N長(zhǎng)度的限制條件:2MN≥3,2NM≥2當(dāng)不滿足以上條件時(shí),認(rèn)為兩者差別太大,則無(wú)法進(jìn)行動(dòng)態(tài)彎折匹配。在x軸上的每一幀不再需要與y軸上的每一幀進(jìn)行比較,而只是與y軸上[ymin,ymax]間的幀進(jìn)行比較,ymin和ymax的計(jì)算公式為:ymin=x/2,0≤x≤xb,2x+(M2N),xb x≤Nymax=2x,0≤x≤xa,x/2+(MN/2),xa x≤N如果出現(xiàn)xa xb的情況,則彎折匹配的三段為(1,xb),(xb+1,xa),(xa+1,N)。對(duì)于x軸上每前進(jìn)一幀,雖然所要比較的y軸上的幀數(shù)不同,但彎折特性是一樣的,累積距離的更新都是用下式實(shí)現(xiàn)的:D(x,y) = d(x,y)+min[D(x1,y),D(x1,y1),D(x1,y2)]通過(guò)DTW算法原理,得出DTW算法的流程如圖62所示信號(hào)輸入幀匹配距離矩陣?yán)鄯e距離矩陣動(dòng)態(tài)規(guī)劃信號(hào)輸出圖62 DTW算法流程首先申請(qǐng)兩個(gè)n*m的矩陣D和d,分別為累計(jì)距離和幀匹配距離。這里n和m為測(cè)試模板與參考模板的幀數(shù)。然后通過(guò)一個(gè)循環(huán)計(jì)算兩個(gè)模板的幀匹配距離矩陣d。接下來(lái)進(jìn)行動(dòng)態(tài)規(guī)劃,為每個(gè)格點(diǎn)(i,j)都計(jì)算其三個(gè)可能的前續(xù)格點(diǎn)的累積距離1D,2D和3D??紤]到邊界問(wèn)題,有些前續(xù)格點(diǎn)可能不存在,因此要加用一些判斷條件。最后利用最小值函數(shù)min,找到三個(gè)前續(xù)格點(diǎn)的累積距離的最小值作為累積距離,與當(dāng)前幀的匹配距離d(i,j)相加,作為當(dāng)前格點(diǎn)的累積距離。該計(jì)算過(guò)程一直達(dá)到格點(diǎn)(n,m),并將D(n,m)輸出,作為模板匹配的結(jié)果。通過(guò)點(diǎn)擊語(yǔ)音識(shí)別組件,MATLAB將會(huì)自動(dòng)讀取對(duì)應(yīng)文件夾中的wav格式的語(yǔ)音,然后進(jìn)行前期的端點(diǎn)檢測(cè)和預(yù)處理,通過(guò)計(jì)算非線性預(yù)測(cè)系數(shù)(MFCC),并保留為參考庫(kù)及測(cè)試庫(kù)。接著通過(guò)DTW算法進(jìn)行匹配并計(jì)算它們的dist距離。最終得出結(jié)果,其運(yùn)行結(jié)果窗口如圖63所示。 運(yùn)行結(jié)果窗口圖7 GUI界面的設(shè)計(jì)光標(biāo)、按鍵、窗口、菜單、圖標(biāo)、對(duì)話框和文本等各種圖形對(duì)象組成的用戶界面組成了圖形用戶界面(GUI)。它讓我們用戶自己定制MATLAB與用戶的交互方法,使命令窗口不是唯一與MATLAB的交互方式。其能夠使使用者的學(xué)習(xí)和使用更為方便、簡(jiǎn)單。用戶不需要了解應(yīng)用程序到底怎么樣執(zhí)行各種命令的,而只需要知道GUI的使用方法;用戶也不必要了解命令是怎么樣執(zhí)行的,用戶只需通過(guò)與界面交互就可以使指定行為可以正確執(zhí)行。單擊如圖71所示的紅色框,有三個(gè)設(shè)計(jì)模式,選擇一個(gè)GUI設(shè)計(jì)模板,選擇自己的存儲(chǔ)路徑,然后點(diǎn)擊OK按鈕后,MATLAB就會(huì)跳出如圖72所示GUI設(shè)計(jì)窗口,當(dāng)然選擇不同的GUI設(shè)計(jì)模式時(shí),在進(jìn)入GUI設(shè)計(jì)窗口后顯示的結(jié)果當(dāng)然也是不一樣的。圖71 GUI打開方式(1)組件面板在GUI界面中放置組件, GUI組件布置完成后,可以單擊菜單欄中最后一個(gè)三角形按鈕選項(xiàng)來(lái)觀察GUIDE的設(shè)計(jì)結(jié)果。這時(shí)會(huì)自動(dòng)生成一個(gè)FIG文件和一個(gè)M文件,F(xiàn)IG文件會(huì)提示保存路徑。雙擊界面區(qū)域內(nèi)的按鈕就會(huì)彈出屬性窗口,可以修改自己需要的屬性。(2)編程回調(diào)函數(shù)布置完GUI組件后,接下來(lái)最重要的一步就是編程每個(gè)按鈕的回調(diào)函數(shù),實(shí)現(xiàn)自己需要的功能,其編程過(guò)程為:① 選擇右鍵單擊按鈕,彈出窗口,選擇最后一項(xiàng)views callbacks;② 鼠標(biāo)放在views callbacks后就會(huì)彈出子選擇窗口,根據(jù)自己的按鈕屬性選擇相應(yīng)的函數(shù)回調(diào);③選擇完函數(shù)后,則會(huì)自動(dòng)跳到M文件中該按鈕所對(duì)應(yīng)的回調(diào)函數(shù),在該段函數(shù)中,可以編寫自己需要實(shí)現(xiàn)該按鈕的功能的代碼。待所有按鈕的功能的回調(diào)函數(shù)都編寫完畢后,點(diǎn)擊保存,然后點(diǎn)擊菜單欄中的三角形按鈕,則會(huì)彈出用戶開發(fā)界面,在該用戶開發(fā)界面中,用戶可以單擊按鈕以實(shí)現(xiàn)該按鈕所擁有的功能。在MATLAB窗口中選擇自己弄好的GUI的路徑,打開GUI。然后單擊菜單欄中的三角形按鈕則彈出如圖72 的用戶開發(fā)界面。在我的這次設(shè)計(jì)中,組建了三個(gè)模塊,即參考模塊、測(cè)試模塊、分析模塊,參考模塊和測(cè)試模塊均有相同的功能,即錄音、暫停、播放、保存及讀取,分析模塊包含語(yǔ)音識(shí)別和退出。用戶可以在點(diǎn)擊錄音后,錄制字、詞,錄制完畢后,可以點(diǎn)擊播放進(jìn)行回放自己所錄制的語(yǔ)音,通過(guò)保存(uiputfile函數(shù)),用戶就可以保存數(shù)個(gè)錄制的語(yǔ)音。通過(guò)讀取(uigetfile函數(shù)),用戶可以打開文件并讀取語(yǔ)音信號(hào)波形。圖72運(yùn)行界面錄制完成后,點(diǎn)擊分析模塊中的語(yǔ)音識(shí)別控件,系統(tǒng)就會(huì)將之前錄制好的參考模板庫(kù)與測(cè)試模板庫(kù)中的語(yǔ)音自動(dòng)進(jìn)行匹配。并將結(jié)果在MATLAB命令窗口中顯示出來(lái),可以看到,顯示結(jié)果如圖73。圖73運(yùn)行結(jié)果圖本設(shè)計(jì)采用端點(diǎn)檢測(cè)算法,再經(jīng)過(guò)特征提取,最后運(yùn)用DTW算法來(lái)實(shí)現(xiàn)語(yǔ)音的識(shí)別。采樣頻率為8kHz語(yǔ)音,語(yǔ)音幀長(zhǎng)20ms,一幀分為256點(diǎn),幀移為80,采用漢明窗的窗函數(shù)。錄制數(shù)字0~10的語(yǔ)音作為model(參考庫(kù)),test(測(cè)試庫(kù))中有若干個(gè)需要識(shí)別語(yǔ)音,0的序號(hào)設(shè)置為11,且1~10的數(shù)字文件名的命名都依次從1~10命名。試驗(yàn)數(shù)據(jù)如表11。由以上數(shù)據(jù)分析可知識(shí)別率為86%。數(shù)字123456789100010正確數(shù)8910710879981095錯(cuò)誤數(shù)2103023112015正確率80%90%100%70%100%80%70%90%90%80%100%86%表11 結(jié)果分析總結(jié)通過(guò)這次設(shè)計(jì),了解了語(yǔ)音識(shí)別的發(fā)展歷史以及在語(yǔ)音識(shí)別中每個(gè)算法的原理。在本設(shè)計(jì)中,通過(guò)MATLAB進(jìn)行錄制語(yǔ)音、播放語(yǔ)音、保存語(yǔ)音、讀取語(yǔ)音及打開語(yǔ)音,先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,其次進(jìn)行端點(diǎn)檢測(cè),提取特征參數(shù),然后建立一個(gè)參考庫(kù)及一個(gè)測(cè)試庫(kù)。最后通過(guò)DTW算法進(jìn)行匹配,最終將結(jié)果在MATLAB命令窗口顯示出來(lái)。在本次設(shè)計(jì)中遇到的難題有很多。比如:端點(diǎn)檢測(cè)算法的運(yùn)行DTW算法等等,最終通過(guò)論導(dǎo)師以及同學(xué)的解答,均解決了。在本次設(shè)計(jì)也存在著許多需要改進(jìn)的地方,比如:GUI界面功能比較單一,GUI界面美化不夠,算法不夠精準(zhǔn),有待進(jìn)行算法改進(jìn);本次設(shè)計(jì)只局限于孤立詞的識(shí)別,機(jī)器只能識(shí)別一個(gè)孤立的詞、音節(jié)等,而不能進(jìn)行少量詞匯的語(yǔ)音識(shí)別;DTW算法只針對(duì)于特定人語(yǔ)音識(shí)別。 致謝俗話說(shuō),“磨刀不誤砍柴工”,每當(dāng)我遇到不懂的問(wèn)題,我都將記錄在本子上,虛心請(qǐng)教指導(dǎo)老師,老師給我耐心地回答,從來(lái)都沒有因?yàn)槲业膯?wèn)題有些簡(jiǎn)單加以責(zé)備,選定題目設(shè)計(jì)到完成設(shè)計(jì),老師總是給我們細(xì)心引導(dǎo)和耐心講解。從選課題題目到設(shè)計(jì)的順利完成,陳杰老師都一直給予我耐心的指導(dǎo)。 第一,我要感謝我的良師益友陳潔老師是她精細(xì),苛刻,扎實(shí)細(xì)致的工作作風(fēng)一直在我實(shí)例給我起指明燈的作用;其次,還要感謝方剛同學(xué)對(duì)我的幫助,沒有他們的幫助和耐心解釋、鼓勵(lì),這次課程設(shè)計(jì)也不會(huì)完成的如此的順利。 參考文獻(xiàn)[1] [J].北京:電子工業(yè)出版社,[2]韋麗興,張淼,鐘映春,[J].[3][D].[4] 何強(qiáng),[M].北京:清華大學(xué)出版社,2002[5] 劉保柱,蘇彥華, (修訂版).北京:人民郵電出版社,[6][J].[7]胡金平,陳若珠,[J].[8]吳曉平,崔光照,[J].[9][D].[10]詹新明,黃南山,楊燦. 語(yǔ)音識(shí)別技術(shù)研究進(jìn)展[J]. 現(xiàn)代計(jì)算機(jī)(專業(yè)版).[11]沈宏余,李英. 語(yǔ)音端點(diǎn)檢測(cè)方法的研究[J]. [12]譚保華,熊健民,劉幺和. 語(yǔ)音識(shí)別技術(shù)概述[J]. [13] 趙力.語(yǔ)音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社.[14] 熊偉, :2010年第三期[15] 蔡妍. 語(yǔ)音信號(hào)端點(diǎn)檢測(cè)方法的研究[碩士學(xué)位論文][D]. 江南大學(xué), [16] 朱淑琴. 語(yǔ)音識(shí)別系統(tǒng)關(guān)鍵技術(shù)研究[碩士學(xué)位論文] [D]. 西安電子科技大學(xué), 2004[17] 劉金偉,黃樟欽,侯義斌 基于片上系統(tǒng)的孤立詞語(yǔ)音識(shí)別算法設(shè)計(jì)[J]計(jì)算機(jī)工程2007,3[18] 胡金平,陳若珠,:[19] 李景川,董慧穎. 一種改進(jìn)的基于短時(shí)能量的端點(diǎn)檢測(cè)算法[J]. 沈陽(yáng)理工大學(xué)學(xué)報(bào), [20] :西安電子科技大學(xué)出版社, [21] 熊偉, :2010年第三期[22] 吳亞棟. 語(yǔ)音識(shí)別基礎(chǔ)[R]. 上海交通大學(xué)計(jì)算機(jī)系, [23] [D].武漢:武漢理工大學(xué),2002 [24] 張雄偉,陳亮,[M].北京:機(jī)械工業(yè)版社,2003[25] 張志敏,郭英,王博.一種基于倒譜特征的語(yǔ)音端點(diǎn)檢測(cè)改進(jìn)算法[J].電聲技術(shù),[26]
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1