freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音識別dtw算法設(shè)計(編輯修改稿)

2024-07-15 17:13 本頁面
 

【文章內(nèi)容簡介】 量之間的距離。距離函數(shù)取決于實際采用的距離度量,在DTW算法中通常采用歐氏距離。若N=M則可以直接計算,否則要考慮將T(n)和R(m)對齊。對齊可以采用線性擴張的方法,如果NM可以將T線性映射為一個M幀的序列,再計算它與之間的距離。但是這樣的計算沒有考慮到語音中各個段在不同的情況下的持續(xù)時間會產(chǎn)生或長或短的變化,因此識別效果不可能最佳。因而更多地是采用動態(tài)規(guī)劃(DP)的方法。通常,規(guī)整函數(shù)被限制在一個平行四邊形的網(wǎng)格內(nèi),如圖61所示。它的一條邊斜率為2,另一條邊斜率為1/2。規(guī)整函數(shù)的起點是(1, 1),終點為(N,M)。DTW算法的目的是在此平行四邊形內(nèi)由起點到終點尋找一個規(guī)整函數(shù),使其具有最小的代價函數(shù),保證了測試模板與參考模板之間具有最大的聲學(xué)相似特性。圖61 DTW原理圖由于在模板匹配過程中限定了彎折的斜率,因此平行四邊形之外的格點對應(yīng)的幀匹配距離是不需要計算的。另外,因為每一列各格點上的匹配計算只用到了前一列的3個網(wǎng)格,所以沒有必要保存所有的幀匹配距離矩陣和累積距離矩陣。充分利用這兩個特點可以減少計算量和存儲空間的需求,形成一種高效的DTW算法,如圖所示。圖中,把實際的動態(tài)彎折分為三段,(1,xa),(xa+1,xb),(xb+1,N),其中:xa= (2MN)/3,xb=2(2NM)/3xa和xb都取最相近的整數(shù),由此可得出對M和N長度的限制條件:2MN≥3,2NM≥2當不滿足以上條件時,認為兩者差別太大,則無法進行動態(tài)彎折匹配。在x軸上的每一幀不再需要與y軸上的每一幀進行比較,而只是與y軸上[ymin,ymax]間的幀進行比較,ymin和ymax的計算公式為:ymin=x/2,0≤x≤xb,2x+(M2N),xb x≤Nymax=2x,0≤x≤xa,x/2+(MN/2),xa x≤N如果出現(xiàn)xa xb的情況,則彎折匹配的三段為(1,xb),(xb+1,xa),(xa+1,N)。對于x軸上每前進一幀,雖然所要比較的y軸上的幀數(shù)不同,但彎折特性是一樣的,累積距離的更新都是用下式實現(xiàn)的:D(x,y) = d(x,y)+min[D(x1,y),D(x1,y1),D(x1,y2)]通過DTW算法原理,得出DTW算法的流程如圖62所示信號輸入幀匹配距離矩陣累積距離矩陣動態(tài)規(guī)劃信號輸出圖62 DTW算法流程首先申請兩個n*m的矩陣D和d,分別為累計距離和幀匹配距離。這里n和m為測試模板與參考模板的幀數(shù)。然后通過一個循環(huán)計算兩個模板的幀匹配距離矩陣d。接下來進行動態(tài)規(guī)劃,為每個格點(i,j)都計算其三個可能的前續(xù)格點的累積距離1D,2D和3D??紤]到邊界問題,有些前續(xù)格點可能不存在,因此要加用一些判斷條件。最后利用最小值函數(shù)min,找到三個前續(xù)格點的累積距離的最小值作為累積距離,與當前幀的匹配距離d(i,j)相加,作為當前格點的累積距離。該計算過程一直達到格點(n,m),并將D(n,m)輸出,作為模板匹配的結(jié)果。通過點擊語音識別組件,MATLAB將會自動讀取對應(yīng)文件夾中的wav格式的語音,然后進行前期的端點檢測和預(yù)處理,通過計算非線性預(yù)測系數(shù)(MFCC),并保留為參考庫及測試庫。接著通過DTW算法進行匹配并計算它們的dist距離。最終得出結(jié)果,其運行結(jié)果窗口如圖63所示。 運行結(jié)果窗口圖7 GUI界面的設(shè)計光標、按鍵、窗口、菜單、圖標、對話框和文本等各種圖形對象組成的用戶界面組成了圖形用戶界面(GUI)。它讓我們用戶自己定制MATLAB與用戶的交互方法,使命令窗口不是唯一與MATLAB的交互方式。其能夠使使用者的學(xué)習(xí)和使用更為方便、簡單。用戶不需要了解應(yīng)用程序到底怎么樣執(zhí)行各種命令的,而只需要知道GUI的使用方法;用戶也不必要了解命令是怎么樣執(zhí)行的,用戶只需通過與界面交互就可以使指定行為可以正確執(zhí)行。單擊如圖71所示的紅色框,有三個設(shè)計模式,選擇一個GUI設(shè)計模板,選擇自己的存儲路徑,然后點擊OK按鈕后,MATLAB就會跳出如圖72所示GUI設(shè)計窗口,當然選擇不同的GUI設(shè)計模式時,在進入GUI設(shè)計窗口后顯示的結(jié)果當然也是不一樣的。圖71 GUI打開方式(1)組件面板在GUI界面中放置組件, GUI組件布置完成后,可以單擊菜單欄中最后一個三角形按鈕選項來觀察GUIDE的設(shè)計結(jié)果。這時會自動生成一個FIG文件和一個M文件,F(xiàn)IG文件會提示保存路徑。雙擊界面區(qū)域內(nèi)的按鈕就會彈出屬性窗口,可以修改自己需要的屬性。(2)編程回調(diào)函數(shù)布置完GUI組件后,接下來最重要的一步就是編程每個按鈕的回調(diào)函數(shù),實現(xiàn)自己需要的功能,其編程過程為:① 選擇右鍵單擊按鈕,彈出窗口,選擇最后一項views callbacks;② 鼠標放在views callbacks后就會彈出子選擇窗口,根據(jù)自己的按鈕屬性選擇相應(yīng)的函數(shù)回調(diào);③選擇完函數(shù)后,則會自動跳到M文件中該按鈕所對應(yīng)的回調(diào)函數(shù),在該段函數(shù)中,可以編寫自己需要實現(xiàn)該按鈕的功能的代碼。待所有按鈕的功能的回調(diào)函數(shù)都編寫完畢后,點擊保存,然后點擊菜單欄中的三角形按鈕,則會彈出用戶開發(fā)界面,在該用戶開發(fā)界面中,用戶可以單擊按鈕以實現(xiàn)該按鈕所擁有的功能。在MATLAB窗口中選擇自己弄好的GUI的路徑,打開GUI。然后單擊菜單欄中的三角形按鈕則彈出如圖72 的用戶開發(fā)界面。在我的這次設(shè)計中,組建了三個模塊,即參考模塊、測試模塊、分析模塊,參考模塊和測試模塊均有相同的功能,即錄音、暫停、播放、保存及讀取,分析模塊包含語音識別和退出。用戶可以在點擊錄音后,錄制字、詞,錄制完畢后,可以點擊播放進行回放自己所錄制的語音,通過保存(uiputfile函數(shù)),用戶就可以保存數(shù)個錄制的語音。通過讀?。╱igetfile函數(shù)),用戶可以打開文件并讀取語音信號波形。圖72運行界面錄制完成后,點擊分析模塊中的語音識別控件,系統(tǒng)就會將之前錄制好的參考模板庫與測試模板庫中的語音自動進行匹配。并將結(jié)果在MATLAB命令窗口中顯示出來,可以看到,顯示結(jié)果如圖73。圖73運行結(jié)果圖本設(shè)計采用端點檢測算法,再經(jīng)過特征提取,最后運用DTW算法來實現(xiàn)語音的識別。采樣頻率為8kHz語音,語音幀長20ms,一幀分為256點,幀移為80,采用漢明窗的窗函數(shù)。錄制數(shù)字0~10的語音作為model(參考庫),test(測試庫)中有若干個需要識別語音,0的序號設(shè)置為11,且1~10的數(shù)字文件名的命名都依次從1~10命名。試驗數(shù)據(jù)如表11。由以上數(shù)據(jù)分析可知識別率為86%。數(shù)字123456789100010正確數(shù)8910710879981095錯誤數(shù)2103023112015正確率80%90%100%70%100%80%70%90%90%80%100%86%表11 結(jié)果分析總結(jié)通過這次設(shè)計,了解了語音識別的發(fā)展歷史以及在語音識別中每個算法的原理。在本設(shè)計中,通過MATLAB進行錄制語音、播放語音、保存語音、讀取語音及打開語音,先對語音信號進行預(yù)處理,其次進行端點檢測,提取特征參數(shù),然后建立一個參考庫及一個測試庫。最后通過DTW算法進行匹配,最終將結(jié)果在MATLAB命令窗口顯示出來。在本次設(shè)計中遇到的難題有很多。比如:端點檢測算法的運行DTW算法等等,最終通過論導(dǎo)師以及同學(xué)的解答,均解決了。在本次設(shè)計也存在著許多需要改進的地方,比如:GUI界面功能比較單一,GUI界面美化不夠,算法不夠精準,有待進行算法改進;本次設(shè)計只局限于孤立詞的識別,機器只能識別一個孤立的詞、音節(jié)等,而不能進行少量詞匯的語音識別;DTW算法只針對于特定人語音識別。 致謝俗話說,“磨刀不誤砍柴工”,每當我遇到不懂的問題,我都將記錄在本子上,虛心請教指導(dǎo)老師,老師給我耐心地回答,從來都沒有因為我的問題有些簡單加以責(zé)備,選定題目設(shè)計到完成設(shè)計,老師總是給我們細心引導(dǎo)和耐心講解。從選課題題目到設(shè)計的順利完成,陳杰老師都一直給予我耐心的指導(dǎo)。 第一,我要感謝我的良師益友陳潔老師是她精細,苛刻,扎實細致的工作作風(fēng)一直在我實例給我起指明燈的作用;其次,還要感謝方剛同學(xué)對我的幫助,沒有他們的幫助和耐心解釋、鼓勵,這次課程設(shè)計也不會完成的如此的順利。 參考文獻[1] [J].北京:電子工業(yè)出版社,[2]韋麗興,張淼,鐘映春,[J].[3][D].[4] 何強,[M].北京:清華大學(xué)出版社,2002[5] 劉保柱,蘇彥華, (修訂版).北京:人民郵電出版社,[6][J].[7]胡金平,陳若珠,[J].[8]吳曉平,崔光照,[J].[9][D].[10]詹新明,黃南山,楊燦. 語音識別技術(shù)研究進展[J]. 現(xiàn)代計算機(專業(yè)版).[11]沈宏余,李英. 語音端點檢測方法的研究[J]. [12]譚保華,熊健民,劉幺和. 語音識別技術(shù)概述[J]. [13] 趙力.語音信號處理[M].北京:機械工業(yè)出版社.[14] 熊偉, :2010年第三期[15] 蔡妍. 語音信號端點檢測方法的研究[碩士學(xué)位論文][D]. 江南大學(xué), [16] 朱淑琴. 語音識別系統(tǒng)關(guān)鍵技術(shù)研究[碩士學(xué)位論文] [D]. 西安電子科技大學(xué), 2004[17] 劉金偉,黃樟欽,侯義斌 基于片上系統(tǒng)的孤立詞語音識別算法設(shè)計[J]計算機工程2007,3[18] 胡金平,陳若珠,:[19] 李景川,董慧穎. 一種改進的基于短時能量的端點檢測算法[J]. 沈陽理工大學(xué)學(xué)報, [20] :西安電子科技大學(xué)出版社, [21] 熊偉, :2010年第三期[22] 吳亞棟. 語音識別基礎(chǔ)[R]. 上海交通大學(xué)計算機系, [23] [D].武漢:武漢理工大學(xué),2002 [24] 張雄偉,陳亮,[M].北京:機械工業(yè)版社,2003[25] 張志敏,郭英,王博.一種基于倒譜特征的語音端點檢測改進算法[J].電聲技術(shù),[26]
點擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1