freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

-20xx0xx257-孤立詞語音識別技術(shù)研究(專業(yè)版)

2025-08-09 06:51上一頁面

下一頁面
  

【正文】 正因?yàn)樵掝}比較大,所以我們不可能對識別系統(tǒng)的每個(gè)方面展開來仔細(xì)研究和分析。, i,n)en致謝 大學(xué)四年的生活轉(zhuǎn)眼即逝,本科畢業(yè)論文的完成是我們大學(xué)生活的最后一項(xiàng)任務(wù)。 for k=1:length(samples{i}) sample(k).wave=samples{i}{k}。 warp end for x = (xa+1):n y_max = round(*(xn)+m)。d = zeros(m,1)。過零率檢測39。subplot(3,1,2)plot(amp)。 end end case 3, break。%開始端點(diǎn)檢測for n=1:length(zcr) goto = 0。 %短時(shí)能量閾值amp2 = 2。 圖14 24維特征參數(shù)的部分?jǐn)?shù)值關(guān)于參數(shù)提取在軟件上的實(shí)現(xiàn),可以編寫mfcc程序再保存到當(dāng)前路徑下,在后面語音識別時(shí)能夠調(diào)用該函數(shù)。下面是端點(diǎn)檢測的部分源代碼,可以在MATLAB中運(yùn)行實(shí)現(xiàn):。這其中包括了音訊變量y和采樣頻率fs。本文的設(shè)計(jì)是在MATLAB中的GUI圖形頁面下完成的。(2) 然后根據(jù)待測模板和參考模板交叉的數(shù)值,即矢量距離,進(jìn)行相加求出兩者之間的累加距離。他們分別被標(biāo)注在時(shí)間軸上,中間的彎曲線表示兩者的映射關(guān)系。上面是前向算法的方式,后向算法和它類似。但是如何確定段與段之間什么時(shí)候轉(zhuǎn)變又是一個(gè)問題,HMM就通過統(tǒng)計(jì)學(xué)理論很好的突破這樣的難題。屬于上面分類中模板匹配的一種方式。計(jì)算過程如下: (12)下圖為Mel倒譜系數(shù)(MFCC)的計(jì)算流程框圖: 圖 8 MFCC計(jì)算流程圖 目前存在多種語音識別方法,主要分為三種:隨機(jī)模型法、模板匹配法、概率語法分析法。值得注意的是,通過兩者的比較我們發(fā)現(xiàn)MFCC比LFCC有更好的優(yōu)越性:(1)語音信號的低頻部分包含大量信息,而Mel到頻譜在轉(zhuǎn)化時(shí)也是比較注重其低頻信息;(2)MFCC的使用情況非常的廣泛,沒有各種前提假設(shè);(3)語音識別屬于人工智能的范疇,它的所有技術(shù)都應(yīng)考慮到人類本身的構(gòu)造,這樣才能在該技術(shù)上產(chǎn)生突破。就離散信號而言,鄰近兩個(gè)參數(shù)取樣值不同的話就稱之為過零。 圖 4 三種窗的時(shí)域和頻域波形圖 海明窗和漢寧窗都屬于廣義升余弦函數(shù),經(jīng)過對兩者頻率特性的研究發(fā)現(xiàn),矩形窗的譜旁瓣比海明窗和漢寧窗都要高,可能會使其頻譜泄露,高頻成分不易保存;漢寧窗也有其自身的局限性,比如說頻譜衰減太快;因?yàn)楹C鞔暗牡屯ㄌ匦院煤团园甑投惠^多的運(yùn)用。但是在語音信號的處理過程中。首先我們要獲取一個(gè)語音庫,其次是要對這些語音信號進(jìn)行訓(xùn)練和處理,這些過程會在后面的章節(jié)中詳細(xì)論述。 GUI引言語音是人類進(jìn)行交流的手段,因此,使用語音作為人機(jī)交互的途徑對于使用者來說是最自然的一種方式,同時(shí)設(shè)備的小型化也要求省略鍵盤以節(jié)省體積。隱馬爾科夫模型具有較高的識別準(zhǔn)確度,在實(shí)現(xiàn)上也比較簡單方便。語音識別系統(tǒng)主要包括語音信號的分析和預(yù)處理過程、特征提取、語音模板庫的訓(xùn)練、模式匹配等幾個(gè)部分。端點(diǎn)檢測是為排除噪聲和無聲頻段的干擾,找出我們需要處理的有聲語音部分。語音信號屬于整體非穩(wěn)定的一類信號,可是研究人員發(fā)現(xiàn)在極短的時(shí)間里它是較為穩(wěn)定。端點(diǎn)檢測的方法很多,我們可以對不同的方法進(jìn)行不同的分類,幾種主要常見的端點(diǎn)檢測方法和特征參量如下:(1)根據(jù)語音信號的時(shí)域特性來檢測,如音量,過零率的檢測,其計(jì)算量比較小。 (3)為了方便計(jì)算,對于選取的特征參數(shù)的個(gè)數(shù)要小,而且要具有較高的有效性。下面是MFCC倒譜系數(shù)的求取步驟: (1) 首先我們要獲得信號并將其進(jìn)行數(shù)字化,這是信號處理的重要部分。在DTW算法中,主要是把語音信號的時(shí)間軸失真處理。所以本文僅僅對隱馬爾科夫的算法加以介紹。 基于HMM識別系統(tǒng)需解決的以下問題:(1)如何確定一個(gè)狀態(tài)轉(zhuǎn)移序列。它常常會拿來和DTW算法進(jìn)行比較。那么我們就需要找出一種函數(shù)對匹配路徑加以限制。軟件設(shè)計(jì)主要是包括語音預(yù)處理子程序、端點(diǎn)檢測子程序以及語音識別子程序。(2) 錄音的時(shí)候還要注意音量的大小要合適,只有這樣才能建立較好的語音庫。檢測過程中的門限是一個(gè)參考量度。而mfcc系數(shù)的函數(shù)可以表示為[[7][J].電子學(xué)報(bào),2000,28(1)]。test文件夾中包含一組測試語音[[8]楊行俊,[M].北京:電子工業(yè)出版社,1995.附錄A 部分程序[x,fs,nbits]=wavread(39。tmp2 = enframe(x(2:end) , FrameLen,inc)。 end case 2, % 2 = 語音段 if amp(n) amp2 ||zcr(n) zcr2 % 保持在語音段 count = count + 1。red39。line([x2 x2], [min(amp),max(amp)], 39。, 39。 y_min = round(*x)。for i=1:3 for k=1:8 s=sprintf(39。 [x1 x2] = vad(x)。此外,語音檢測前的各種處理程序應(yīng)該準(zhǔn)備好并且保存在默認(rèn)路徑。這些都是我們有待解決的問題。感謝這里所有的老師,他們?yōu)槲覀兊膶W(xué)習(xí)提供了許多的幫助。,i)。function warpglobal x y_min y_maxglobal t rglobal D dglobal m nd = D。 y_min = round(*x)。line([x2 x2], [min(zcr),max(zcr)], 39。red39。Color39。 else % 靜音狀態(tài) status = 0。 %語音序列的長度silence = 0。進(jìn)行語音測試前要做一些準(zhǔn)備工作,首先錄制語音,由于條件的限制我們不在用MATLAB進(jìn)行錄音,而是使用已經(jīng)準(zhǔn)備好的語音包。melbankm(m,n,fs)被用來作為求取其系數(shù)的函數(shù)。它們分別為靜音段、過渡段、語音段以及結(jié)束段[[5][M]. 哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2000.]。(1) 錄音的時(shí)候要盡可能的排除外界環(huán)境的干擾。在對DTW的后續(xù)研究中,人們也對該方法做了許多的改進(jìn)和優(yōu)化,在這里對優(yōu)化后的DTW就不再作詳細(xì)表述。通過這樣一個(gè)公式我們就可以在某一個(gè)開始點(diǎn)進(jìn)行搜索在眾多的距離中找出一個(gè)最優(yōu)的路徑。這種方法在上個(gè)世紀(jì)六十年代就開始被使用,所以它是一種比較早而且常用的方法。在HMM的模型算法中它是最不重要的。在眾多的方法比較中HMM方法的識別準(zhǔn)確度比DTW要高。這樣就不能同時(shí)完成參數(shù)間的檢測,識別率機(jī)會大大降低。它能夠?qū)︻l率進(jìn)行不均勻的標(biāo)定。特征參數(shù)的要求是: (1)各個(gè)參量間應(yīng)該具有較好的的獨(dú)立特性,可以提高語音檢測的效率。端點(diǎn)檢測是語音識別中不可忽略的一部分,好的端點(diǎn)檢測技術(shù)不僅能提高識別的準(zhǔn)確度,而且它在是在孤立詞語音識別中能將計(jì)算量較大的非實(shí)時(shí)系統(tǒng)加以簡化。值接近于1。信號的加窗分幀是在處理時(shí)必不可少的也是經(jīng)常要用到的。最后闡述了系統(tǒng)的軟件設(shè)計(jì)過程,對各部分給出了相應(yīng)的軟件流程圖,并且對具體算法進(jìn)行了MATLAB仿真論證。孤立詞語音識別系統(tǒng)主要應(yīng)用于自動控制,如機(jī)器人操縱、通信設(shè)備控制、智能玩具操縱等。語音識別技術(shù)的創(chuàng)立是以上一個(gè)世紀(jì)Bell實(shí)驗(yàn)室研發(fā)的能識別一到十字母的實(shí)驗(yàn)為旗幟,近年來該技術(shù)發(fā)展也比較迅速。識別過程中,說話者聲音也會經(jīng)過一樣的通道取得參數(shù),保存建立為測試的模版。另外,如果我們對語音信號的帶寬不明確的話,我們需要在A/D變換之前做一些必要的處理。但是為了很好的處理信號我們需要選擇一種比較好的方式。同時(shí)應(yīng)用這兩種檢測法可以更高效的檢測信號的開始點(diǎn)以及結(jié)束點(diǎn)。目前語音識別系統(tǒng)的相關(guān)處理工作也是把MFCC作為主要方向。動態(tài)時(shí)間規(guī)整技術(shù)(DTW)和隱馬爾科夫模型(HMM)歸屬于模板匹配的范疇。這種對比庫在和待測量進(jìn)行比較之前會進(jìn)行大量的訓(xùn)練。它的每一個(gè)元素都可以用a表述,它是有某一個(gè)狀態(tài)向另外一個(gè)狀態(tài)莊毅的概率,同時(shí)前后的兩者狀態(tài)轉(zhuǎn)變又是有聯(lián)系的。其算法敘述如下: 定義為時(shí)刻t時(shí)沿一條路徑,且,產(chǎn)生出的最大概率,既有 (17) Viterbi算法也是一種格型結(jié)構(gòu),而且類似于前向算法。 在上圖中我們是把字母A當(dāng)作測試部分,而字母B當(dāng)作參考部分。在上面的DTW原理的介紹中我們說到,在計(jì)算匹配路徑的時(shí)候不可
點(diǎn)擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1