freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)本科畢業(yè)設(shè)計(jì)(專(zhuān)業(yè)版)

  

【正文】 所以混合模型在系統(tǒng)框架上保持了傳統(tǒng) HMM的框架,而局部功能模塊如:概率估計(jì)、上下文關(guān)聯(lián)等則通過(guò) ANN 實(shí)現(xiàn),這樣有機(jī)地將 HMM 和 ANN 的各自?xún)?yōu)勢(shì)統(tǒng)一在一個(gè)系統(tǒng)之中.又彌補(bǔ)了各自的不足。 ANN 和 HMM 可以以不同的方式進(jìn)行結(jié)合,如 ANN 直接實(shí)現(xiàn) HMM,兩者在幀層面上的結(jié)合,語(yǔ)音層面上的結(jié)合, 音段層面的結(jié)合和子層面上的結(jié)合等方式,而 HMM和 ANN 混合模型的結(jié)合,即能優(yōu)化 HMM 模型,又能充分利用每一種技術(shù)的長(zhǎng)處: HMM 的時(shí)間建模和 ANN河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 22 的聲學(xué)建模,特別是用神經(jīng)網(wǎng)絡(luò)計(jì)算 HMM 狀態(tài)的觀測(cè)概率。而這種隱含關(guān)系在 HMM 模型中通常以概率形式表現(xiàn)出來(lái),模型的輸出結(jié)果也以概率形式給出。信息存儲(chǔ)和信息處理二者密不可分,信息處理過(guò)程同人腦一樣,如同一個(gè)黑箱。知識(shí)和規(guī)則的方法之所以很難取得更大的進(jìn)展,既由于語(yǔ)音的多變,又由于規(guī)則的難以搜集完備,還有執(zhí)行規(guī)則的算法難以高效運(yùn)行。因而更多地是采用動(dòng)態(tài)規(guī)劃 (DP)的方法。用于孤立詞識(shí)別, DTW 算法與 HMM 算法在相同的環(huán)境條件下,識(shí)別效果相差不大,但 HMM算法要復(fù)雜得多,主要體現(xiàn)在 HMM 算法在訓(xùn)練階段需要提供大量的語(yǔ)音數(shù)據(jù),通過(guò)反復(fù)計(jì)算才能得到模型參數(shù),而 DTW 算法的訓(xùn)練中 幾乎不需要額外的計(jì)算。 Mel頻率倒譜系數(shù) 美爾頻標(biāo)倒譜系數(shù) (Mel Frequency Cepstrum Coefficient, MFCC)考慮了人耳的聽(tīng)覺(jué)特性,將頻譜轉(zhuǎn)化為基于 Mel 頻標(biāo)的非線性頻譜,然后轉(zhuǎn)換到倒譜域上。這種信號(hào)可以輸入計(jì)算機(jī)進(jìn)行各種分析和處理。正確確定語(yǔ) 音端點(diǎn)也會(huì)減少系統(tǒng)的計(jì)算量和存儲(chǔ)量。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 12 圖 語(yǔ)音信號(hào)“ 0”的短時(shí)平均過(guò)零率 語(yǔ)音信號(hào) xw(n)的短時(shí)自相關(guān)函數(shù) Rn(k)的計(jì)算式如下: ? ? ? ? ? ? ? ?KkmxmxkR nkNm nn ???? ??? 010 (28) 這里 K 是最大的延遲點(diǎn)數(shù)??梢钥闯?,短時(shí)能量可以看作語(yǔ)音信號(hào)的平方經(jīng)過(guò)一個(gè)線性濾波器的輸出,該線性濾波器的單位沖激響應(yīng)為 h(n),如圖 。在河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 9 取數(shù)據(jù)時(shí),前一幀與后一幀的交疊部分稱(chēng)為幀移。這樣,不僅能夠進(jìn)行預(yù)加重,而且可以壓縮信號(hào)的動(dòng)態(tài)范圍,有效地提高信噪比。在實(shí)際語(yǔ)音信號(hào)處理中,采樣頻率通常為 7~ 10kHz。所以,在漢語(yǔ)的相互交談中,不但要憑借不同的元音和輔音來(lái)辨別這些字或詞的意義,還需要從不同的聲調(diào)來(lái)區(qū)別它,也就是說(shuō)聲調(diào)有辨義作用。 (4)信息理論和計(jì)算機(jī)科學(xué):各種算法的研究、快速搜索查找匹配的方法。例如,“我對(duì)我的手機(jī)上的一些功能不太明白,想問(wèn)一下”,或者“嗯,我的賬單應(yīng)該到期了,請(qǐng)幫我查一下要交多少錢(qián)”。優(yōu)化過(guò)程對(duì)所有系統(tǒng)的表現(xiàn)都會(huì)有提高,也可以解決小范圍的口音問(wèn)題。 2,各階參數(shù)之間有良好的獨(dú)立性。 語(yǔ)音識(shí)別系統(tǒng)的分類(lèi) 語(yǔ)音識(shí)別是近年來(lái)十分活躍的一個(gè)研究領(lǐng)域。 IBM、 Microsoft、 Lamp。 關(guān)鍵詞 :語(yǔ)音識(shí)別算法; HMM 模型; Matlab; GUI ABSTRACT Speech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of recognition technology is not only an important internationally peted technology,but also an indispensable foundational technology for the national economic on the mathematical model from the speech signal,this paper analyze audio signal from the time domain,frequency domain proceeding,and discussed the basic theory of speech recognition algorithm are discussed:Dynamic Time Warping(DTW)、 Rulebased Artificial Intelligence,Artificial Neural Network(ANN),Hidden Markov Model(HMM),HMM bined with focus is put in the theoretical studies of Hidden Markov(HMM) model algorithm,and the classical HMM algorithm is improved. Speech recognition algorithm is realized in various programs,this article taking the method is to use Matlab powerful mathematical operation ability to realize the recognition of speech signal isolation. Matlab is a powerful mathematic software with a mass of toolboxes dealing with signal processing. It gives a terrific shortcut to the research of signal processing,especially the wave analysis. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, hidden Markov model (HMM) recognition algorithm using MFCC (MEL 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) II frequency cepstral coefficients) as the main voice characteristic parameters, the establishment of a Chinese digital speech recognition system, including the preprocessing of the speech signal,the extraction of characteristic parameters the training of the recognition template,identifying matching algorithm。 Matlab 是一款功能強(qiáng)大的數(shù)學(xué)軟件,它附帶大量的信號(hào)處理工具箱為信號(hào)分析研究,特別是文中主要探討的聲波分析研究帶來(lái)極大便利。 語(yǔ)音識(shí)別研究現(xiàn)狀 20世紀(jì) 90年代后,在細(xì)化模型的設(shè)計(jì)、參數(shù)提取和優(yōu)化,以及系統(tǒng)的自適應(yīng)技術(shù)上取得了一些關(guān)鍵進(jìn)展。在聲學(xué)識(shí)別層次,以多個(gè)說(shuō)話人發(fā)音的大規(guī)模語(yǔ)音數(shù)據(jù)為基礎(chǔ),以馬爾可夫鏈為基礎(chǔ)的語(yǔ)音序列建模方法 HMM(隱含馬爾可夫模型 )比較有效的解決了語(yǔ)音信號(hào)短時(shí)穩(wěn)定、長(zhǎng)時(shí)時(shí)變 的特性,并且能根據(jù)一些基本建模單元構(gòu)造成連續(xù)語(yǔ)音的句子模型,達(dá)到了比較高的建模精度和建模靈活性。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 3 語(yǔ)音識(shí)別系統(tǒng)的基本構(gòu)成 語(yǔ)音識(shí)別系統(tǒng)的典型實(shí)現(xiàn)方案為:輸入的模擬語(yǔ)音信號(hào) 首先要進(jìn)行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測(cè)、預(yù)加重等。對(duì)某一種口音,語(yǔ)言的聲學(xué)模型的適應(yīng)性決定了基礎(chǔ)識(shí)別率,而在此基礎(chǔ)上的優(yōu)化和模型適應(yīng)方案則提供了很好的解決方案。而一旦用戶(hù)以跟人交談的方式來(lái)進(jìn)行語(yǔ)音輸入時(shí),口語(yǔ)的語(yǔ)法不規(guī)范和語(yǔ)序不正常的特點(diǎn)會(huì)給語(yǔ)義的分析和理解帶來(lái)困難。 (1)物理學(xué) (聲學(xué) ):聲音產(chǎn)生與傳播原理、聲電轉(zhuǎn)換以及聲音在房間回響等相關(guān)知識(shí)。輔音也有清濁之分。圖 給出了經(jīng)典的語(yǔ)音信號(hào)的產(chǎn)生模型,語(yǔ)音信號(hào)被看成是線性時(shí)不變系統(tǒng)在隨機(jī)噪聲或準(zhǔn)周期脈沖序列激勵(lì)下的輸出。 由于語(yǔ)音信號(hào)的平均功率譜受聲門(mén)激勵(lì)和鼻輻射的影響,在 800Hz以上的高 頻時(shí)約按6dB/oct 衰減,為此要在預(yù)處理中進(jìn)行預(yù)加重。在語(yǔ)音信號(hào)處理中,一般用循環(huán)隊(duì)列的方式來(lái)存儲(chǔ)這些數(shù)據(jù),以便用一個(gè)有限容量的數(shù)據(jù)區(qū)來(lái)應(yīng)付數(shù)量極大的語(yǔ)音數(shù)據(jù)。通常在 l0kHz 采樣頻率下, L 折衷選擇為 100~ 200 個(gè)采樣點(diǎn) (即持續(xù)時(shí)間為 10~ 20ms)。在背景噪聲較小的情況下,短時(shí) 能量比較準(zhǔn)確,但當(dāng)背景噪聲較大時(shí),短時(shí)平均過(guò)零率可以獲得較好的檢測(cè)效果。與 Rn(k)相反的是,在周期的各個(gè)整數(shù)倍點(diǎn)上 Fn(k)具有谷值而不是峰值。使用窄帶帶通濾波器,其頻率分辨率提高,相當(dāng)于短時(shí)處理時(shí)窗寬較寬的那種情況。通過(guò)分析激勵(lì)信號(hào)的語(yǔ)音特點(diǎn)以及聲道傳輸函數(shù)的零極點(diǎn)分布情況,可知 ??ne? 的分布范圍很寬, c(n)從低時(shí)域延伸到高時(shí)域,而 ??nh? 主要分布于低時(shí)域中。 三、語(yǔ)音識(shí)別主要算法 動(dòng)態(tài)時(shí)間伸縮算法 日本學(xué)者首先將動(dòng)態(tài)規(guī)劃的概念用于解決孤立詞識(shí)別時(shí)說(shuō)話速度不 均勻的難題,提出了著名的 DTW算法,當(dāng)詞匯表較小以及各個(gè)詞條不易于混淆時(shí),這個(gè)算法取得了很大成功。若 N=M則可以直接計(jì)算,否則要考慮將 T(n)和 R(m)對(duì)齊。另一方面,人類(lèi)的語(yǔ)言要受詞、句法、語(yǔ) 義等約束,人在識(shí)別語(yǔ)音的過(guò)程中充分應(yīng)用了這些約束以及對(duì)話環(huán)境的有關(guān)信息,將來(lái)自聲學(xué) —— 語(yǔ)音學(xué)的“區(qū)別性特征” (這稱(chēng)為一個(gè)識(shí)別系統(tǒng)的“底層” )與來(lái)自構(gòu)詞、句法、語(yǔ)義和語(yǔ)用約束 (這稱(chēng)為識(shí)別系統(tǒng)的“頂層” )相互結(jié)合,就可以構(gòu)成一個(gè)“由底向上 (Bottomup)”和“由頂向下 (Topdown)”交互作用的識(shí)別系統(tǒng),不同層次的知識(shí)可以用若干規(guī)則來(lái)描述。它完全不同于傳統(tǒng)識(shí)別方法的地方在于:?jiǎn)蝹€(gè)權(quán)值與識(shí)別基元之間不存在明確的對(duì)應(yīng)關(guān)系,只存在整個(gè)權(quán)值構(gòu)成的系統(tǒng)參數(shù)與整個(gè)識(shí)別空間之間的對(duì)應(yīng)關(guān)系。這是因?yàn)檫@種數(shù)學(xué)模型出現(xiàn)的時(shí)間較早,人們對(duì)它的研究也比較深入,己建立起了完整的理論框架。由于該模 型解除了對(duì)語(yǔ)音信號(hào)狀態(tài)的齊次性和對(duì)語(yǔ)音特征的非相關(guān)性的限制,因此,為語(yǔ)音識(shí)別研究的深入發(fā)展提供了一個(gè)和諧的框架。 (4)ANN的訓(xùn)練著眼于描述類(lèi)間的邊界,而不是描述每一類(lèi)內(nèi)的分布.所以是一種區(qū)分性訓(xùn)練。預(yù)測(cè)網(wǎng)絡(luò)的輸入是相繼的幾幀語(yǔ)音特征矢量,輸出下一幀語(yǔ)音的預(yù)測(cè)值,通過(guò)給每一個(gè)音子分配一個(gè)預(yù)測(cè)網(wǎng)絡(luò),就可以比較每個(gè)音素預(yù)測(cè)網(wǎng)絡(luò)的預(yù)測(cè)誤差,選取其中具有最小預(yù)測(cè)誤差的網(wǎng)絡(luò)與當(dāng)前語(yǔ)音段匹配,體現(xiàn)了相鄰語(yǔ)音幀之間的時(shí)域相關(guān)性。這樣就可以讓網(wǎng)絡(luò)更好地利用存在音段中的所有語(yǔ)音幀之間的相 關(guān)性,而且還可以更容易地利用其它信息,比如時(shí)長(zhǎng)。因此, HMM 語(yǔ)音識(shí)別模型與算法是迄今為止最為完美的一個(gè)語(yǔ)音識(shí)別模型,從中也可看出好的理論體系對(duì)研究工作所起的重要的指導(dǎo)作用。 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說(shuō)明書(shū) 20 圖 基于神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法原理圖 神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)音進(jìn)行分類(lèi)有兩個(gè)基本方法:靜態(tài)識(shí)別和動(dòng)態(tài)識(shí)別。 人工神經(jīng)網(wǎng)絡(luò)方法 人工神經(jīng)網(wǎng)絡(luò)的出發(fā)點(diǎn)是通過(guò)模擬大腦的機(jī)制 (實(shí)際上人們到目前為止還不完全清楚大腦的思維機(jī)制 ),將包括聽(tīng)覺(jué)系統(tǒng)的生物神經(jīng)系統(tǒng)的信息處理機(jī)制引入機(jī)器學(xué)習(xí)的研究中,使其具有學(xué)習(xí)和理解的能力。 DTW 算法的優(yōu)點(diǎn)是既簡(jiǎn)單又有效,對(duì)于小詞匯表孤立詞識(shí)別系統(tǒng)十分適用。已存入模板庫(kù)的各個(gè)詞條稱(chēng)為參考模板,一個(gè)參考模板可表示為, m 為訓(xùn)練語(yǔ)音幀的時(shí)序標(biāo)號(hào), m=1為起點(diǎn)語(yǔ)音幀, m=M為終點(diǎn)語(yǔ)音幀,因此為該模板所包含的語(yǔ)音幀總數(shù),為第幀的語(yǔ)音特征矢量。在漢語(yǔ)數(shù)碼語(yǔ)音識(shí)別中, MFCC參數(shù)的性能明顯優(yōu)于 LPCC參數(shù)。傅立葉頻譜分析的基礎(chǔ)是傅立葉變換,用傅立葉變換及其反變換可以求得傅立葉譜、自相關(guān)函數(shù)、功率譜、倒譜。雙門(mén)限前端檢測(cè)算法用于有話、無(wú)話鑒別或詞語(yǔ)前端檢測(cè),通常窗長(zhǎng) (即幀長(zhǎng) )取 10~ 15ms,幀間隔 (即采樣間隔 )取 5~ 10ms,有一定的抗干擾能力,即使存在小的隨機(jī)噪聲,只要它不使信號(hào)越過(guò)正負(fù)門(mén)限所構(gòu)成的帶,就不會(huì)產(chǎn)生虛假的過(guò)零率。 短時(shí)自相關(guān)函數(shù)是語(yǔ)音信號(hào)時(shí)域分析的重要參量。在語(yǔ)音識(shí)別系統(tǒng)中,一股也作為特征中的一維參數(shù)來(lái)表示語(yǔ)音信號(hào)能量的大小和超音段信息。一般每秒的幀數(shù)為33~ 100,視實(shí)際情況而定。它一般是一階的,即:11)( ??? uzzH ,式中 u值接近于 1,本文中去為 。 采樣之后要對(duì)信號(hào)進(jìn)行量化,在量化過(guò)程中不可避免的會(huì)產(chǎn)生誤差。聲調(diào)曲線從一個(gè)韻母的起始端開(kāi)始,到韻母的終止端結(jié)束。 (8)微電子技術(shù):超大規(guī)模集成電路 (VLSI)技術(shù)的發(fā)展對(duì)語(yǔ)音識(shí)別的具體應(yīng)用有很大的影響, VLSI使語(yǔ)音識(shí)別系統(tǒng)商品化成為可能。從某種意義上說(shuō),語(yǔ)音識(shí)別是將計(jì)算機(jī)變成真正的“智能化”設(shè)備的最佳途徑。人多的公共場(chǎng)所巨大的噪音對(duì)語(yǔ)音識(shí)別的影響自不用說(shuō),早期即使在實(shí)驗(yàn)室環(huán)境下,敲擊鍵盤(pán)、挪動(dòng)麥克風(fēng)都會(huì)成為背景噪音。在識(shí)別階段,語(yǔ)音喜好經(jīng)過(guò)相同的通道得到語(yǔ)音參數(shù),生成測(cè)試模版,與參考模版進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模版作為識(shí)別結(jié)果。 語(yǔ)音識(shí)別按說(shuō)話人的講話方式可分為孤立詞 (Isolated Word)識(shí)別、連接詞
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1