freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

-20xx0xx257-孤立詞語(yǔ)音識(shí)別技術(shù)研究(存儲(chǔ)版)

  

【正文】 的研究是語(yǔ)音識(shí)別技術(shù)的重大突破,盡管還未成熟,但是如今它是研究的重點(diǎn)。 (HMM)HMM是一種較好描述語(yǔ)音信號(hào)整體非平穩(wěn)特性的統(tǒng)計(jì)模型,我們將其看作數(shù)學(xué)上的一個(gè)雙重隨機(jī)過(guò)程。它有離散型和連續(xù)型兩類,對(duì)于離散HMM模型,B是一個(gè)概率矩陣;其中,M是編碼符號(hào)集中符號(hào)的總數(shù),并且滿足;連續(xù)的模型滿足條件:。下面簡(jiǎn)單介紹一下隱馬爾科夫的三種基本算法,即前向后向算法,Viterbi算法和BaumWelch算法。(DTW)在孤立詞語(yǔ)音識(shí)別中,比較常用的一種識(shí)別方法是DYW,它的原理還是比較容易理解,另外其用法也不復(fù)雜。這種方法應(yīng)用的比較廣泛,并且它對(duì)語(yǔ)音識(shí)別技術(shù)產(chǎn)生了很重要的影響。而動(dòng)態(tài)時(shí)間規(guī)整就是尋找一個(gè)時(shí)間規(guī)整函數(shù),通俗地講就是尋找一條最優(yōu)路徑[[4]何強(qiáng),何英.MATLAB擴(kuò)展編程[M].第一版,北京:清華大學(xué)出版社.]。每一個(gè)表格中都有一個(gè)數(shù)字,每個(gè)數(shù)字代表A和B之間的矢量距離。 (25)(3) 最后我們根據(jù)限制后的路徑找出被測(cè)模板和參考模板之間匹配的最佳路徑?,F(xiàn)在matlab中已經(jīng)存在各種比較好的開發(fā)工具箱。另外存在一份待測(cè)試的語(yǔ)音庫(kù)。 MATLAB中有一些語(yǔ)音信號(hào)處理常用的函數(shù),比如說(shuō)wavread函數(shù)。本文中選用短時(shí)能量E和過(guò)零率ZCR一起的雙門限條件來(lái)實(shí)現(xiàn)。只有等到過(guò)渡段再次升高,達(dá)到一個(gè)較高的門限我們才能確定。下圖是數(shù)字1的訓(xùn)練語(yǔ)音的端點(diǎn)檢測(cè)結(jié)果,程序開始運(yùn)行后會(huì)依次顯示上面錄入的語(yǔ)音文檔的波形,并且用紅色的線標(biāo)出語(yǔ)音端點(diǎn)。最后可以使用M個(gè)Mel帶通濾波器進(jìn)行濾波。這個(gè)工具箱主要是一些函數(shù)程序。%幅度歸一化到[1,1]%參數(shù)設(shè)置FrameLen = 256。 %判斷是語(yǔ)音的最小長(zhǎng)度status = 0。%計(jì)算短時(shí)能量amp = sum((abs(enframe(filter([1 ], 1, x), FrameLen, inc))).^2, 2)。 elseif amp(n) amp2 || zcr(n) zcr2 % 可能處于語(yǔ)音段 status = 1。 silence = 0。)。, 39。Color39。)。red39。r = ref。xb = round((2*nm)*2/3)。 y_min = round(*x)。 y_min = round(2*(xn)+m)。g:\\yuyin\\wh\\39。end%數(shù)碼識(shí)別for i=1:3 fname = sprintf(39。 end [d,n] = max(pout)。沒(méi)有老師的督促我們是不能完成這項(xiàng)工作的。 圖 15 語(yǔ)音識(shí)別系統(tǒng)的文件結(jié)構(gòu) 上面的各個(gè)文件準(zhǔn)備完畢后就可以進(jìn)行最終的語(yǔ)音識(shí)別了,相應(yīng)的源程序文件可見(jiàn)附錄部分。語(yǔ)音識(shí)別的一大問(wèn)題就是如何排除外界噪聲的影響,如何研究非特定人的識(shí)別技術(shù)以及各種因素對(duì)識(shí)別系統(tǒng)的影響也是我們要突破的難題。實(shí)際應(yīng)用部分主要是將語(yǔ)音識(shí)別技術(shù)在web上的實(shí)現(xiàn)為主。對(duì)于實(shí)驗(yàn)結(jié)果也可以通過(guò)GUI視圖頁(yè)面顯示出來(lái),在這里不對(duì)該方式做詳細(xì)表述。當(dāng)然,最終論文的完成和導(dǎo)師的耐心指導(dǎo)是分不開的。 m = m(x12:x22,:)。\n第%d詞訓(xùn)練39。,i,k)。 y_min = round(*x)。 y_min = round(2*(xn)+m)。% 如果兩個(gè)模板長(zhǎng)度相差過(guò)多,匹配失敗if (2*mn3) | (2*nm2) dist = realmax。)。Color39。, 39。)。line([x2*inc x2*inc], [1 1], 39。 %記錄語(yǔ)音段結(jié)束點(diǎn)subplot(3,1,1)plot(x)axis([1 length(x) 1 1])ylabel(39。 if silence minsilence % 靜音還不夠長(zhǎng),尚未結(jié)束 count = count + 1。 silence = 0。diffs = (tmp1 tmp2)。minsilence = 6。)。利用這些函數(shù)可以實(shí)現(xiàn)某些語(yǔ)音信號(hào)處理工作。然后便是對(duì)其能量進(jìn)行計(jì)算,相關(guān)計(jì)算方法在上節(jié)部分已經(jīng)做了表述,緊接著就是對(duì)信號(hào)的各種處理。 實(shí)驗(yàn)時(shí)需要調(diào)用 voicebox 中的 vad 函數(shù)。也就是過(guò)渡段。 資料表明,語(yǔ)音識(shí)別的識(shí)別率較低等原因可能都是來(lái)自端點(diǎn)檢測(cè),所以較為精準(zhǔn)的確定起止點(diǎn)和終止點(diǎn)能夠提高語(yǔ)音識(shí)別的精度。在后續(xù)對(duì)語(yǔ)音信號(hào)的處理過(guò)程中文件的存儲(chǔ)路徑要和系統(tǒng)默認(rèn)的路徑一致。一般情況下可以用錄音筆或者筆記本電腦來(lái)完成。由于條件限制在信號(hào)的仿真方面我們可以通過(guò)MATLAB來(lái)實(shí)現(xiàn)。函數(shù)如下: (23)對(duì)于上面的路徑約束,具體的推導(dǎo)公式為: 。我們可以稱之為總的代價(jià)函數(shù),其計(jì)算公式為 (22)式中,d[c(k)]為匹配點(diǎn)c(k)本身的代價(jià),min D[c(k1)]是限制路徑中最小的一條。他們的關(guān)系通過(guò)橫縱坐標(biāo)指示出來(lái)了。另外使用DTW技術(shù)還解決了端點(diǎn)檢測(cè)中某些參量效果不明顯的問(wèn)題,主要是因?yàn)檫@種方法可以把待測(cè)量和參考量的差異放大。同樣,由后向算法的思路出發(fā)也可以推導(dǎo)出Viterbi算法的另外一種實(shí)現(xiàn)方式。根據(jù)此概率判斷語(yǔ)音命令的識(shí)別; (2)如何調(diào)整的參數(shù)使得輸出概率最大。矩陣元素必須滿足:。另外,DTW比較適合實(shí)際的應(yīng)用。通過(guò)這些訓(xùn)練可以得到一個(gè)和待測(cè)語(yǔ)音很近的矢量值作為存儲(chǔ)模板保留。這樣做的目的是為了限制該算法中匹配路徑的個(gè)數(shù)。人工神經(jīng)網(wǎng)絡(luò)(ANN)、矢量量化(VQ)也是出現(xiàn)比較早并且用到的較多的。這樣就可以獲取信號(hào)的離散功率譜X(k)。 MFCC的計(jì)算方式是比較復(fù)雜的。所以本文中主要介紹后者。具體方法需要根據(jù)流程檢驗(yàn)。端點(diǎn)檢測(cè)檢測(cè)的過(guò)程中有很多的特征參量作為可以作為參考量,在這些參量中我們要選擇一種合適的方式來(lái)作為該方式的參考量,這個(gè)參考量必須能夠很好地代表信號(hào)的某些特征,而且能夠很好地實(shí)現(xiàn)端點(diǎn)檢測(cè)這樣一個(gè)關(guān)鍵技術(shù)。綜合而言在本文的研究中,要選用的函數(shù)是海明窗。幀移與幀長(zhǎng)有一定的關(guān)系,通常情況下兩者之比在1/3到1/2的區(qū)間 [[2]王倩,吳國(guó)平,陳琳.特定人語(yǔ)音識(shí)別算法——DRW算法[J].中國(guó)地質(zhì)大學(xué)(武漢)通信工程學(xué)院,湖北 武漢 430074.]。預(yù)加重是我們處理信號(hào)時(shí)常常會(huì)使用的一種信號(hào)處理方式,其作用在不同的信息處理中有不同的作用,在這里我們主要是為了放大信號(hào)中的高頻分量 [[1]宋庭新,[M]. 出版社,2000.]。作時(shí)域離散化處理。并在先前存儲(chǔ)的參考模板庫(kù)中匹配保存,然后把匹配率最大的參考模版作為最終的識(shí)別成果。比如說(shuō)預(yù)處理部分中的端點(diǎn)檢測(cè)的好壞在整個(gè)過(guò)程中就比較重要。本文就是在這種情況下對(duì)特定人孤立詞語(yǔ)音識(shí)別系統(tǒng)做了一些探討。關(guān)鍵詞:語(yǔ)音識(shí)別;孤立詞;隱馬爾可夫模型;動(dòng)態(tài)時(shí)間規(guī)整技術(shù);MATLAB;GUIStudy of Isolated Word Speech Recognition Technology Student: Jiang Zhao Zhao(Faculty Adviser:Fang Jie)(College of mechanical and Electronic Engineering, West Anhui University)Abstract: Speech recognition is the technology of humanputer interaction. It is to make the machine through the understanding and recognition of the process of the speech signal into the corresponding text or mand technology, then realize the munication between human and puter. The isolated word speech recognition system is mainly used in automatic control, such as robot manipulation, munication equipment, smart toys and so on. This paper focus on the research and implement of isolated mand word recognition with HMM based on MATLAB
點(diǎn)擊復(fù)制文檔內(nèi)容
黨政相關(guān)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1