freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音識(shí)別dtw算法設(shè)計(jì)-全文預(yù)覽

2025-07-09 17:13 上一頁面

下一頁面
  

【正文】 e GUI allows only one% instance to run (singleton).%% See also: GUIDE, GUIDATA, GUIHANDLES% Copyright 20022003 The MathWorks, Inc.% Edit the above text to modify the response to help GUI% Last Modified by GUIDE 30Apr2015 22:25:50% Begin initialization code DO NOT EDITgui_Singleton = 1。Property39。 第一,我要感謝我的良師益友陳潔老師是她精細(xì),苛刻,扎實(shí)細(xì)致的工作作風(fēng)一直在我實(shí)例給我起指明燈的作用;其次,還要感謝方剛同學(xué)對(duì)我的幫助,沒有他們的幫助和耐心解釋、鼓勵(lì),這次課程設(shè)計(jì)也不會(huì)完成的如此的順利。比如:端點(diǎn)檢測(cè)算法的運(yùn)行DTW算法等等,最終通過論導(dǎo)師以及同學(xué)的解答,均解決了。數(shù)字123456789100010正確數(shù)8910710879981095錯(cuò)誤數(shù)2103023112015正確率80%90%100%70%100%80%70%90%90%80%100%86%表11 結(jié)果分析總結(jié)通過這次設(shè)計(jì),了解了語音識(shí)別的發(fā)展歷史以及在語音識(shí)別中每個(gè)算法的原理。采樣頻率為8kHz語音,語音幀長(zhǎng)20ms,一幀分為256點(diǎn),幀移為80,采用漢明窗的窗函數(shù)。通過讀?。╱igetfile函數(shù)),用戶可以打開文件并讀取語音信號(hào)波形。在MATLAB窗口中選擇自己弄好的GUI的路徑,打開GUI。這時(shí)會(huì)自動(dòng)生成一個(gè)FIG文件和一個(gè)M文件,F(xiàn)IG文件會(huì)提示保存路徑。其能夠使使用者的學(xué)習(xí)和使用更為方便、簡(jiǎn)單。接著通過DTW算法進(jìn)行匹配并計(jì)算它們的dist距離??紤]到邊界問題,有些前續(xù)格點(diǎn)可能不存在,因此要加用一些判斷條件。對(duì)于x軸上每前進(jìn)一幀,雖然所要比較的y軸上的幀數(shù)不同,但彎折特性是一樣的,累積距離的更新都是用下式實(shí)現(xiàn)的:D(x,y) = d(x,y)+min[D(x1,y),D(x1,y1),D(x1,y2)]通過DTW算法原理,得出DTW算法的流程如圖62所示信號(hào)輸入幀匹配距離矩陣?yán)鄯e距離矩陣動(dòng)態(tài)規(guī)劃信號(hào)輸出圖62 DTW算法流程首先申請(qǐng)兩個(gè)n*m的矩陣D和d,分別為累計(jì)距離和幀匹配距離。另外,因?yàn)槊恳涣懈鞲顸c(diǎn)上的匹配計(jì)算只用到了前一列的3個(gè)網(wǎng)格,所以沒有必要保存所有的幀匹配距離矩陣和累積距離矩陣。它的一條邊斜率為2,另一條邊斜率為1/2。對(duì)齊可以采用線性擴(kuò)張的方法,如果NM可以將T線性映射為一個(gè)M幀的序列,再計(jì)算它與之間的距離。為了計(jì)算這一失真距離,應(yīng)從T和R中各個(gè)對(duì)應(yīng)幀之間的距離算起。已存入模板庫的各個(gè)詞條稱為參考模板,一個(gè)參考模板可以表示為,m為訓(xùn)練語音幀的時(shí)序標(biāo)號(hào),m=1為起點(diǎn)語音幀,m=M為終點(diǎn)語音幀,因此M為該模板所包含的語音幀總數(shù),R(m)為第m幀語音特征矢量。圖52 DTW功率譜圖(3)將離散功率譜經(jīng)過濾波器組:將S(n)通過M個(gè)濾波組后得到功率值,也就是在各離散頻率點(diǎn)上將S(n)和Hm(n)的乘積并相加,得到M個(gè)參數(shù)Pm,m=0,1,……M1;(4)對(duì)數(shù)的計(jì)算:得到Lm,m=0,1,……M1;6特定人語音識(shí)別算法DTW算法語音識(shí)別中較為經(jīng)典的一種算法是DTW算法(動(dòng)態(tài)時(shí)間規(guī)整)。濾波器是一個(gè)簡(jiǎn)單的三角形的頻域?yàn)V波器的中心頻率,F(xiàn)M是均勻地分布在頻率軸。其特征提取的過程如圖51所示。常見的方法有最大值乘上某個(gè)比率、中位值乘上某個(gè)比率、最小值乘上某個(gè)常數(shù)、前三幀平均值乘上某個(gè)常數(shù)等。當(dāng)參數(shù)降至低門限則認(rèn)為進(jìn)入結(jié)束。在開始檢測(cè)之前需要設(shè)定4個(gè)門限,即分別為短時(shí)能量和短時(shí)過零率各設(shè)置一個(gè)高門限和一個(gè)低門限:EHigh、ELow和ZHigh、ZLow。這些都可以通過設(shè)置最短時(shí)間門限來判定。圖43 數(shù)字“6”的過零率波形圖圖44 數(shù)字“4”的過零率波形圖完成計(jì)算短時(shí)能量及過零率后,并調(diào)整好能量門限,接下里進(jìn)入到最關(guān)鍵的一步,即變量status分析,status可以分為四種狀態(tài):(1)在靜音段,如果能量或過零率超越了低門限,就應(yīng)該開始標(biāo)記起始點(diǎn),進(jìn)入過渡段。從圖中可以看到清音‘S’的過零率明顯高于其后的‘L’音,有聲段過零率明顯高于無聲段,但在鼻音階段過零率迅速滑落到無聲水平而能量值則是緩慢下滑。短時(shí)過零表示一幀語音信號(hào)波形穿過橫軸(零電平)的次數(shù)。語音段的能量比噪聲段的大,語音段的能量是噪聲段能量疊加語音聲波能量的和。如聲母“s”、“c”等的幅度就很低。比如:一個(gè)8kHz的采樣頻率,30ms的幀長(zhǎng)對(duì)應(yīng)240點(diǎn),記為N,而10ms的幀移對(duì)應(yīng)為80點(diǎn),記為M。這樣只要設(shè)定一個(gè)門限,當(dāng)語音信號(hào)幅度超過這個(gè)門限時(shí),就當(dāng)作語音開始,當(dāng)幅度降低到門限以下時(shí)就認(rèn)為語音結(jié)束。高門限被超過的話則可以基本確定是由于語音信號(hào)引起的。(3)短時(shí)過零的作用:檢測(cè)清音。語音端點(diǎn)檢測(cè)是指用計(jì)算機(jī)數(shù)字處理技術(shù)從包含語音的一段信號(hào)中找出起始點(diǎn)及結(jié)束點(diǎn),從而只存儲(chǔ)和處理有效語音信號(hào)。但是在錄音的時(shí)候,wavrecord函數(shù)有很大的局限性,在錄制語音的時(shí)候必須事先制定語音的時(shí)間。y=wavrecord(5*Fs,Fs,’int16’)。其中n為樣本個(gè)數(shù),F(xiàn)s為頻率,默認(rèn)值為11025,本設(shè)計(jì)采用16000,ch為通道數(shù),默認(rèn)為1,若為2,則表示采樣為雙聲道立體聲數(shù)據(jù),本設(shè)計(jì)ch為1Audiorecorder函數(shù)也可以用來錄制音頻,但在本次設(shè)計(jì)的操作上,通常采用的語音格式以wav格式為主,在保存語音上,uiputfile能更好的與wavrecord相結(jié)合,所以用wavrecord比較好。訓(xùn)練識(shí)別參考 模塊識(shí)別結(jié)果語音輸入預(yù)處理特征提取測(cè)度估計(jì)模板庫識(shí)別決策專家知識(shí) 語音識(shí)別總體架構(gòu)3 MATLAB中的語音信號(hào)的采集語音信號(hào)的采集也可以使用Windows中的“錄音機(jī)”。由于語音信號(hào)是一種典型的非平穩(wěn)信號(hào),加之呼吸氣流、外部噪音、電流干擾等使得語音信號(hào)不能直接用于提取特征,而要進(jìn)行前期的預(yù)處理。中科院自動(dòng)化所及其所屬模式科技(Pattek)公司2002年發(fā)布了他們共同推出的面向不同計(jì)算平臺(tái)和應(yīng)用的“天語”中文語音系列產(chǎn)品——PattekASR,結(jié)束了中文語音識(shí)別產(chǎn)品自1998年以來一直由國(guó)外公司壟斷的歷史。清華大學(xué)電子工程系語音技術(shù)與專用芯片設(shè)計(jì)課題組,研發(fā)的非特定人漢語數(shù)碼串連續(xù)語音識(shí)別系統(tǒng)的識(shí)別精度,%(不定長(zhǎng)數(shù)字串)%(定長(zhǎng)數(shù)字串)。從1987年開始執(zhí)行國(guó)家863計(jì)劃后,國(guó)家863智能計(jì)算機(jī)專家組為語音識(shí)別技術(shù)研究專門立項(xiàng),每?jī)赡隄L動(dòng)一次。該系統(tǒng)對(duì)新聞?wù)Z音識(shí)別具有較高的精度,是目前具有代表性的漢語連續(xù)語音識(shí)別系統(tǒng)。T和NTT都對(duì)語音識(shí)別系統(tǒng)的實(shí)用化研究投以巨資。但是真正取得實(shí)質(zhì)性進(jìn)展,并將其作為一個(gè)重要的課題開展研究則是在60年代末70年代初。國(guó)外的語音識(shí)別方面的研究工作可以追溯到20世紀(jì)50年代ATamp。它要求人工智能計(jì)算機(jī)能說會(huì)聽,應(yīng)此要求出現(xiàn)了語音識(shí)別和語音合成兩門學(xué)科。本次設(shè)計(jì)錄制0~10的數(shù)字做為參考庫(model),測(cè)試庫(test)中為需要測(cè)試及識(shí)別的語音,0的序號(hào)為11,1~9的數(shù)字以相應(yīng)數(shù)字做為文件名的命名。目錄1概述 2 2 2 3 42語音識(shí)別系統(tǒng)的概述 43 MATLAB中的語音信號(hào)的采集 4 wavrecord函數(shù) 4 wavplay函數(shù) 64語音信號(hào)的端點(diǎn)檢測(cè) 6 6 8 9 115語音識(shí)別參數(shù)提取 12 MFCC的基本原理 126特定人語音識(shí)別算法DTW算法 13 14 167 GUI界面的設(shè)計(jì) 17 17 18總結(jié) 20致謝 21參考文獻(xiàn) 22附件 23基于MATLAB的特定人語音識(shí)別算法設(shè)計(jì)摘要在高度發(fā)達(dá)的社會(huì),語言是一種人類交流最方便的,最速度的信息,在高度發(fā)達(dá)的社會(huì)中,用數(shù)字化的方式舉行語音的保存、傳遞、判別、加強(qiáng)和合成等是全部數(shù)字化通信過程中最基礎(chǔ)、最重要的組成的一部分。最后在用戶開發(fā)界面(GUI界面)直觀地呈現(xiàn)出來。其中人機(jī)自然語言的接口是一個(gè)非常重要的部分。同時(shí)特定人語音識(shí)別系統(tǒng)具有廣闊的應(yīng)用前景,比如工業(yè)命令控制、計(jì)算機(jī)控制、家庭電器服務(wù)、個(gè)人移動(dòng)通信呼叫等,尤其當(dāng)人手已被占用或無法使用的情況下必須進(jìn)行聲音控制時(shí),更可以起到不可替代的作用,這項(xiàng)技術(shù)將給人們的日常生活帶來極大的便利。TBell實(shí)驗(yàn)室Rabiner等科學(xué)家的努力,他們把原本艱澀的HMM純數(shù)學(xué)模型工程化,從而為更多研究者了解和認(rèn)識(shí),從而使統(tǒng)計(jì)方法成為了語音識(shí)別技術(shù)的主流。20世紀(jì)90年代前期,許多著名的大公司如IBM、蘋果、ATamp。它帶有一個(gè)32,000詞的基本詞匯表,可以擴(kuò)展到65,000詞,還包括辦公常用詞條,具有“糾錯(cuò)機(jī)制”,其平均識(shí)別率可以達(dá)到95%。研究水平也從實(shí)驗(yàn)室逐步走向?qū)嵱?。從圖中可以看出語音識(shí)別系統(tǒng)的本質(zhì)就是一種模式識(shí)別系統(tǒng),它也包括特征提取、模式匹配、參考模式庫等基本單元。在識(shí)別階段,語音信號(hào)經(jīng)過相同的通道得到語音參數(shù),生成測(cè)試模板,與參考模板進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模板作為識(shí)別結(jié)果。y = wavrecord(n,Fs,ch)。舉個(gè)例子:Fs=16000。圖31 語音信號(hào)波形 在MATLAB平臺(tái)處理語音信號(hào)時(shí),可以通過wavplay函數(shù)回放錄制好了的語音,次函數(shù)具有快速檢驗(yàn)數(shù)據(jù)和計(jì)算可靠性。4語音信號(hào)的端點(diǎn)檢測(cè)無論是測(cè)試和建立模板階段還是在識(shí)別階段,都先采用端點(diǎn)檢測(cè)算法確定語音的起點(diǎn)和終點(diǎn)。圖41端點(diǎn)檢測(cè)算法流程圖(1)歸一化:為了后面處理方便,通常將讀取的語音信號(hào)進(jìn)行
點(diǎn)擊復(fù)制文檔內(nèi)容
高考資料相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1