freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音識別dtw算法設(shè)計-全文預(yù)覽

2025-07-09 17:13 上一頁面

下一頁面
  

【正文】 e GUI allows only one% instance to run (singleton).%% See also: GUIDE, GUIDATA, GUIHANDLES% Copyright 20022003 The MathWorks, Inc.% Edit the above text to modify the response to help GUI% Last Modified by GUIDE 30Apr2015 22:25:50% Begin initialization code DO NOT EDITgui_Singleton = 1。Property39。 第一,我要感謝我的良師益友陳潔老師是她精細(xì),苛刻,扎實細(xì)致的工作作風(fēng)一直在我實例給我起指明燈的作用;其次,還要感謝方剛同學(xué)對我的幫助,沒有他們的幫助和耐心解釋、鼓勵,這次課程設(shè)計也不會完成的如此的順利。比如:端點檢測算法的運行DTW算法等等,最終通過論導(dǎo)師以及同學(xué)的解答,均解決了。數(shù)字123456789100010正確數(shù)8910710879981095錯誤數(shù)2103023112015正確率80%90%100%70%100%80%70%90%90%80%100%86%表11 結(jié)果分析總結(jié)通過這次設(shè)計,了解了語音識別的發(fā)展歷史以及在語音識別中每個算法的原理。采樣頻率為8kHz語音,語音幀長20ms,一幀分為256點,幀移為80,采用漢明窗的窗函數(shù)。通過讀?。╱igetfile函數(shù)),用戶可以打開文件并讀取語音信號波形。在MATLAB窗口中選擇自己弄好的GUI的路徑,打開GUI。這時會自動生成一個FIG文件和一個M文件,F(xiàn)IG文件會提示保存路徑。其能夠使使用者的學(xué)習(xí)和使用更為方便、簡單。接著通過DTW算法進(jìn)行匹配并計算它們的dist距離??紤]到邊界問題,有些前續(xù)格點可能不存在,因此要加用一些判斷條件。對于x軸上每前進(jìn)一幀,雖然所要比較的y軸上的幀數(shù)不同,但彎折特性是一樣的,累積距離的更新都是用下式實現(xiàn)的:D(x,y) = d(x,y)+min[D(x1,y),D(x1,y1),D(x1,y2)]通過DTW算法原理,得出DTW算法的流程如圖62所示信號輸入幀匹配距離矩陣?yán)鄯e距離矩陣動態(tài)規(guī)劃信號輸出圖62 DTW算法流程首先申請兩個n*m的矩陣D和d,分別為累計距離和幀匹配距離。另外,因為每一列各格點上的匹配計算只用到了前一列的3個網(wǎng)格,所以沒有必要保存所有的幀匹配距離矩陣和累積距離矩陣。它的一條邊斜率為2,另一條邊斜率為1/2。對齊可以采用線性擴(kuò)張的方法,如果NM可以將T線性映射為一個M幀的序列,再計算它與之間的距離。為了計算這一失真距離,應(yīng)從T和R中各個對應(yīng)幀之間的距離算起。已存入模板庫的各個詞條稱為參考模板,一個參考模板可以表示為,m為訓(xùn)練語音幀的時序標(biāo)號,m=1為起點語音幀,m=M為終點語音幀,因此M為該模板所包含的語音幀總數(shù),R(m)為第m幀語音特征矢量。圖52 DTW功率譜圖(3)將離散功率譜經(jīng)過濾波器組:將S(n)通過M個濾波組后得到功率值,也就是在各離散頻率點上將S(n)和Hm(n)的乘積并相加,得到M個參數(shù)Pm,m=0,1,……M1;(4)對數(shù)的計算:得到Lm,m=0,1,……M1;6特定人語音識別算法DTW算法語音識別中較為經(jīng)典的一種算法是DTW算法(動態(tài)時間規(guī)整)。濾波器是一個簡單的三角形的頻域濾波器的中心頻率,F(xiàn)M是均勻地分布在頻率軸。其特征提取的過程如圖51所示。常見的方法有最大值乘上某個比率、中位值乘上某個比率、最小值乘上某個常數(shù)、前三幀平均值乘上某個常數(shù)等。當(dāng)參數(shù)降至低門限則認(rèn)為進(jìn)入結(jié)束。在開始檢測之前需要設(shè)定4個門限,即分別為短時能量和短時過零率各設(shè)置一個高門限和一個低門限:EHigh、ELow和ZHigh、ZLow。這些都可以通過設(shè)置最短時間門限來判定。圖43 數(shù)字“6”的過零率波形圖圖44 數(shù)字“4”的過零率波形圖完成計算短時能量及過零率后,并調(diào)整好能量門限,接下里進(jìn)入到最關(guān)鍵的一步,即變量status分析,status可以分為四種狀態(tài):(1)在靜音段,如果能量或過零率超越了低門限,就應(yīng)該開始標(biāo)記起始點,進(jìn)入過渡段。從圖中可以看到清音‘S’的過零率明顯高于其后的‘L’音,有聲段過零率明顯高于無聲段,但在鼻音階段過零率迅速滑落到無聲水平而能量值則是緩慢下滑。短時過零表示一幀語音信號波形穿過橫軸(零電平)的次數(shù)。語音段的能量比噪聲段的大,語音段的能量是噪聲段能量疊加語音聲波能量的和。如聲母“s”、“c”等的幅度就很低。比如:一個8kHz的采樣頻率,30ms的幀長對應(yīng)240點,記為N,而10ms的幀移對應(yīng)為80點,記為M。這樣只要設(shè)定一個門限,當(dāng)語音信號幅度超過這個門限時,就當(dāng)作語音開始,當(dāng)幅度降低到門限以下時就認(rèn)為語音結(jié)束。高門限被超過的話則可以基本確定是由于語音信號引起的。(3)短時過零的作用:檢測清音。語音端點檢測是指用計算機(jī)數(shù)字處理技術(shù)從包含語音的一段信號中找出起始點及結(jié)束點,從而只存儲和處理有效語音信號。但是在錄音的時候,wavrecord函數(shù)有很大的局限性,在錄制語音的時候必須事先制定語音的時間。y=wavrecord(5*Fs,Fs,’int16’)。其中n為樣本個數(shù),F(xiàn)s為頻率,默認(rèn)值為11025,本設(shè)計采用16000,ch為通道數(shù),默認(rèn)為1,若為2,則表示采樣為雙聲道立體聲數(shù)據(jù),本設(shè)計ch為1Audiorecorder函數(shù)也可以用來錄制音頻,但在本次設(shè)計的操作上,通常采用的語音格式以wav格式為主,在保存語音上,uiputfile能更好的與wavrecord相結(jié)合,所以用wavrecord比較好。訓(xùn)練識別參考 模塊識別結(jié)果語音輸入預(yù)處理特征提取測度估計模板庫識別決策專家知識 語音識別總體架構(gòu)3 MATLAB中的語音信號的采集語音信號的采集也可以使用Windows中的“錄音機(jī)”。由于語音信號是一種典型的非平穩(wěn)信號,加之呼吸氣流、外部噪音、電流干擾等使得語音信號不能直接用于提取特征,而要進(jìn)行前期的預(yù)處理。中科院自動化所及其所屬模式科技(Pattek)公司2002年發(fā)布了他們共同推出的面向不同計算平臺和應(yīng)用的“天語”中文語音系列產(chǎn)品——PattekASR,結(jié)束了中文語音識別產(chǎn)品自1998年以來一直由國外公司壟斷的歷史。清華大學(xué)電子工程系語音技術(shù)與專用芯片設(shè)計課題組,研發(fā)的非特定人漢語數(shù)碼串連續(xù)語音識別系統(tǒng)的識別精度,%(不定長數(shù)字串)%(定長數(shù)字串)。從1987年開始執(zhí)行國家863計劃后,國家863智能計算機(jī)專家組為語音識別技術(shù)研究專門立項,每兩年滾動一次。該系統(tǒng)對新聞?wù)Z音識別具有較高的精度,是目前具有代表性的漢語連續(xù)語音識別系統(tǒng)。T和NTT都對語音識別系統(tǒng)的實用化研究投以巨資。但是真正取得實質(zhì)性進(jìn)展,并將其作為一個重要的課題開展研究則是在60年代末70年代初。國外的語音識別方面的研究工作可以追溯到20世紀(jì)50年代ATamp。它要求人工智能計算機(jī)能說會聽,應(yīng)此要求出現(xiàn)了語音識別和語音合成兩門學(xué)科。本次設(shè)計錄制0~10的數(shù)字做為參考庫(model),測試庫(test)中為需要測試及識別的語音,0的序號為11,1~9的數(shù)字以相應(yīng)數(shù)字做為文件名的命名。目錄1概述 2 2 2 3 42語音識別系統(tǒng)的概述 43 MATLAB中的語音信號的采集 4 wavrecord函數(shù) 4 wavplay函數(shù) 64語音信號的端點檢測 6 6 8 9 115語音識別參數(shù)提取 12 MFCC的基本原理 126特定人語音識別算法DTW算法 13 14 167 GUI界面的設(shè)計 17 17 18總結(jié) 20致謝 21參考文獻(xiàn) 22附件 23基于MATLAB的特定人語音識別算法設(shè)計摘要在高度發(fā)達(dá)的社會,語言是一種人類交流最方便的,最速度的信息,在高度發(fā)達(dá)的社會中,用數(shù)字化的方式舉行語音的保存、傳遞、判別、加強(qiáng)和合成等是全部數(shù)字化通信過程中最基礎(chǔ)、最重要的組成的一部分。最后在用戶開發(fā)界面(GUI界面)直觀地呈現(xiàn)出來。其中人機(jī)自然語言的接口是一個非常重要的部分。同時特定人語音識別系統(tǒng)具有廣闊的應(yīng)用前景,比如工業(yè)命令控制、計算機(jī)控制、家庭電器服務(wù)、個人移動通信呼叫等,尤其當(dāng)人手已被占用或無法使用的情況下必須進(jìn)行聲音控制時,更可以起到不可替代的作用,這項技術(shù)將給人們的日常生活帶來極大的便利。TBell實驗室Rabiner等科學(xué)家的努力,他們把原本艱澀的HMM純數(shù)學(xué)模型工程化,從而為更多研究者了解和認(rèn)識,從而使統(tǒng)計方法成為了語音識別技術(shù)的主流。20世紀(jì)90年代前期,許多著名的大公司如IBM、蘋果、ATamp。它帶有一個32,000詞的基本詞匯表,可以擴(kuò)展到65,000詞,還包括辦公常用詞條,具有“糾錯機(jī)制”,其平均識別率可以達(dá)到95%。研究水平也從實驗室逐步走向?qū)嵱谩膱D中可以看出語音識別系統(tǒng)的本質(zhì)就是一種模式識別系統(tǒng),它也包括特征提取、模式匹配、參考模式庫等基本單元。在識別階段,語音信號經(jīng)過相同的通道得到語音參數(shù),生成測試模板,與參考模板進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模板作為識別結(jié)果。y = wavrecord(n,Fs,ch)。舉個例子:Fs=16000。圖31 語音信號波形 在MATLAB平臺處理語音信號時,可以通過wavplay函數(shù)回放錄制好了的語音,次函數(shù)具有快速檢驗數(shù)據(jù)和計算可靠性。4語音信號的端點檢測無論是測試和建立模板階段還是在識別階段,都先采用端點檢測算法確定語音的起點和終點。圖41端點檢測算法流程圖(1)歸一化:為了后面處理方便,通常將讀取的語音信號進(jìn)行
點擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1