freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音識(shí)別系統(tǒng)的設(shè)計(jì)本科畢業(yè)設(shè)計(jì)(已修改)

2025-07-04 01:17 本頁面
 

【正文】 河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書摘 要語音識(shí)別主要是讓機(jī)器聽懂人說的話,即在各種情況下,準(zhǔn)確地識(shí)別出語音的內(nèi)容,從而根據(jù)其信息執(zhí)行人的各種意圖。語音識(shí)別技術(shù)既是國際競爭的一項(xiàng)重要技術(shù),也是每一個(gè)國家經(jīng)濟(jì)發(fā)展不可缺少的重要技術(shù)支撐。本文基于語音信號(hào)產(chǎn)生的數(shù)學(xué)模型,從時(shí)域、頻域出發(fā)對(duì)語音信號(hào)進(jìn)行分析,論述了語音識(shí)別的基本理論。在此基礎(chǔ)上討論了語音識(shí)別的五種算法:動(dòng)態(tài)時(shí)間伸縮算法(Dynamic Time Warping,DTW)、基于規(guī)則的人工智能方法、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)方法、隱馬爾可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。重點(diǎn)是從理論上研究隱馬爾可夫(HMM)模型算法,對(duì)經(jīng)典的HMM模型算法進(jìn)行改進(jìn)。語音識(shí)別算法有多種實(shí)現(xiàn)方案,本文采取的方法是利用Matlab強(qiáng)大的數(shù)學(xué)運(yùn)算能力,實(shí)現(xiàn)孤立語音信號(hào)的識(shí)別。Matlab 是一款功能強(qiáng)大的數(shù)學(xué)軟件,它附帶大量的信號(hào)處理工具箱為信號(hào)分析研究,特別是文中主要探討的聲波分析研究帶來極大便利。本文應(yīng)用隱馬爾科夫模型(HMM) 為識(shí)別算法,采用MFCC(MEL頻率倒譜系數(shù))為主要語音特征參數(shù),建立了一個(gè)漢語數(shù)字語音識(shí)別系統(tǒng),其中包括語音信號(hào)的預(yù)處理、特征參數(shù)的提取、識(shí)別模板的訓(xùn)練、識(shí)別匹配算法;同時(shí),提出利用Matlab圖形用戶界面開發(fā)環(huán)境設(shè)計(jì)語音識(shí)別系統(tǒng)界面,設(shè)計(jì)簡單,使用方便,系統(tǒng)界面友好。經(jīng)過統(tǒng)計(jì),識(shí)別效果明顯達(dá)到了預(yù)期目標(biāo)。關(guān)鍵詞:語音識(shí)別算法;HMM模型;Matlab;GUIABSTRACTSpeech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of recognition technology is not only an important internationally peted technology,but also an indispensable foundational technology for the national economic on the mathematical model from the speech signal,this paper analyze audio signal from the time domain,frequency domain proceeding,and discussed the basic theory of speech recognition algorithm are discussed:Dynamic Time Warping(DTW)、Rulebased Artificial Intelligence,Artificial Neural Network(ANN),Hidden Markov Model(HMM),HMM bined with focus is put in the theoretical studies of Hidden Markov(HMM) model algorithm,and the classical HMM algorithm is improved.Speech recognition algorithm is realized in various programs,this article taking the method is to use Matlab powerful mathematical operation ability to realize the recognition of speech signal isolation. Matlab is a powerful mathematic software with a mass of toolboxes dealing with signal processing. It gives a terrific shortcut to the research of signal processing,especially the wave analysis. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, hidden Markov model (HMM) recognition algorithm using MFCC (MEL frequency cepstral coefficients) as the main voice characteristic parameters, the establishment of a Chinese digital speech recognition system, including the preprocessing of the speech signal,the extraction of characteristic parameters the training of the recognition template,identifying matching algorithm。the same time,the use of Matlab graphical user interface development environment designed speech recognition system interface,is designed to be simple,easy to use,friendly interface. Besides,to have a simple exploration of the voice recognition is another statistics,recognition result obviously is made out as the expected goal.Key words:Speech recognition algorithm;HMM model;Matlab;GUI44目錄一、前言 1 1 1 2 3 3 4二、語音信號(hào)分析 4 4 5 5 6 7 7 7 8 8 9 9 11 12 13 14 14 14 15 LPCC倒譜系數(shù) 15 Mel頻率倒譜系數(shù) 16三、語音識(shí)別主要算法 17 17 18 19 20 HMM和ANN的混合模型 21四、隱含馬爾可夫模型算法 23 HMM的基本理論和數(shù)學(xué)描述 23 HMM的三個(gè)基本問題及解決算法 24 HMM算法的改進(jìn) 31 HMM的結(jié)構(gòu)和類型 33 HMM算法實(shí)現(xiàn)的問題 34五、基于Matlab環(huán)境下的語音識(shí)別算法實(shí)現(xiàn) 35 35 36 36 36 37 38六、結(jié)束語 39 39 39七、致謝 40參考文獻(xiàn) 40河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書一、前言作為智能計(jì)算機(jī)研究的主導(dǎo)方向和人機(jī)語音通信的關(guān)鍵技術(shù),語音識(shí)別技術(shù)一直受到各國科學(xué)界的廣泛關(guān)注。以語音識(shí)別開發(fā)出的產(chǎn)品應(yīng)用領(lǐng)域非常廣泛,有聲控電話交換、語音撥號(hào)系統(tǒng)、信息網(wǎng)絡(luò)查詢、家庭服務(wù)、賓館服務(wù)、旅行社服務(wù)系統(tǒng)、訂票系統(tǒng)、聲控智能玩具、醫(yī)療服務(wù)、銀行服務(wù)、股票查詢服務(wù)、計(jì)算機(jī)控制、工業(yè)控制、語音通信系統(tǒng)、軍事監(jiān)聽、信息檢索、應(yīng)急服務(wù)、翻譯系統(tǒng)等,幾乎深入到社會(huì)的每個(gè)行業(yè)、每個(gè)方面,其應(yīng)用和經(jīng)濟(jì)社會(huì)效益前景非常廣泛。因此語音識(shí)別技術(shù)既是國際競爭的一項(xiàng)重要技術(shù),也是每一個(gè)國家經(jīng)濟(jì)發(fā)展不可缺少的重要技術(shù)支撐。研究語音識(shí)別,開發(fā)相應(yīng)的產(chǎn)品有著廣泛的社會(huì)意義和經(jīng)濟(jì)意義。語音識(shí)別中的說話人辨認(rèn)的研究始于20世紀(jì)30年代。早期的工作主要集中在人耳聽辨試驗(yàn)和探討聽音識(shí)別的可能性方面。Bell實(shí)驗(yàn)室的L.G.Kesta目視觀察語譜圖進(jìn)行識(shí)別,提出了“聲紋(Voiceprint)”的概念。Bell實(shí)驗(yàn)室的S.Pruzansky提出了模版匹配和概率統(tǒng)計(jì)方差分析的聲紋識(shí)別方法,形成了聲紋識(shí)別研究的一個(gè)高潮。60年代末和70年代初語音識(shí)別最重要的發(fā)展是語音信號(hào)線性預(yù)測編碼(LPC)技術(shù)和動(dòng)態(tài)時(shí)間規(guī)整(DTW)技術(shù),有效地解決了語音的特征提取和時(shí)間不等長匹配問題,對(duì)特定人的語音識(shí)別十分有效。研究特點(diǎn)是以孤立字語音識(shí)別為主,通常把孤立字作為一個(gè)整體來建立模板。80年代,語音識(shí)別研究的重點(diǎn)之一是連接詞語音識(shí)別,開發(fā)了各種連接詞語音識(shí)別和關(guān)鍵詞識(shí)別算法,如多級(jí)動(dòng)態(tài)規(guī)劃語音識(shí)別算法。另一個(gè)重要發(fā)展是語音識(shí)別算法從模板匹配技術(shù)轉(zhuǎn)向基于統(tǒng)計(jì)模型技術(shù)。20世紀(jì)90年代后,在細(xì)化模型的設(shè)計(jì)、參數(shù)提取和優(yōu)化,以及系統(tǒng)的自適應(yīng)技術(shù)上取得了一些關(guān)鍵進(jìn)展。語音識(shí)別技術(shù)進(jìn)一步成熟,并開始向市場提供產(chǎn)品。由于中國的國際地位不斷提高,以及在經(jīng)濟(jì)和市場方面所處的重要地位,漢語語音識(shí)別也越來越受到重視。IBM、Microsoft、Lamp。H等公司相繼投入到漢語語音識(shí)別系統(tǒng)的開發(fā)中,其投資也逐年增加。IBM開發(fā)的Viavoice和Microsoft開發(fā)的中文識(shí)別引擎代表了當(dāng)前漢語語音識(shí)別的最高水平。臺(tái)灣的一些大學(xué)和研究所也開發(fā)出大詞匯量非特定人連續(xù)語音識(shí)別演示系統(tǒng)。日本也先后在語音識(shí)別領(lǐng)域大展頭角,還有如Philips公司開發(fā)的Speech—Media和Speech Pearl兩套軟件,涵蓋了自然語音識(shí)別與理解的對(duì)話系統(tǒng)。我國語音識(shí)別研究工作近年來發(fā)展很快,同時(shí)也從實(shí)驗(yàn)室逐步走向?qū)嵱?。?987年開始執(zhí)行863計(jì)劃后,國家863《智能計(jì)算機(jī)主題》專家組為語音識(shí)別研究立項(xiàng)。每兩年滾動(dòng)一次,從1991年開始,專家組每一至二年舉行一次全國性的語音識(shí)別系統(tǒng)測試。漢語語音識(shí)別研究已經(jīng)走上組織化的道路。目前我國大詞匯量連續(xù)語音識(shí)別系統(tǒng)的研究已經(jīng)接近國外最高水平。語音識(shí)別發(fā)展到一定階段,世界各國都加快了語音識(shí)別引用系統(tǒng)的研究開發(fā),通常連續(xù)語音是含有較完整語法信息的連續(xù)語句,最接近于人的自然講話方式,從非連續(xù)語音到連續(xù)語音的研究面臨著很多完全不同的技術(shù)難點(diǎn),非連續(xù)語音的識(shí)別是一些孤立的聲波片段,連續(xù)語音則面臨著如何切分聲波的問題。諸如此類的新問題使連續(xù)語音識(shí)別率的提高比非連續(xù)語音更加困難。經(jīng)過幾十年的發(fā)展和摸索,人們終于在實(shí)驗(yàn)室突破了大詞匯量、連續(xù)語音和非特定人這三大障礙,第一次把這三個(gè)特性一起集中于一個(gè)系統(tǒng)中,并以此確定了統(tǒng)計(jì)方法和模型在語音識(shí)別和語音處理中的主流地位。在聲學(xué)識(shí)別層次,以多個(gè)說話人發(fā)音的大規(guī)模語音數(shù)據(jù)為基礎(chǔ),以馬爾可夫鏈為基礎(chǔ)的語音序列建模方法HMM(隱含馬爾可夫模型)比較有效的解決了語音信號(hào)短時(shí)穩(wěn)定、長時(shí)時(shí)變的特性,并且能根據(jù)一些基本建模單元構(gòu)造成連續(xù)語音的句子模型,達(dá)到了比較高的建模精度和建模靈活性。目前在語音識(shí)別研究領(lǐng)域非?;钴S的課題為穩(wěn)健語音識(shí)別、說話人自適應(yīng)技術(shù)、大詞匯量關(guān)鍵詞識(shí)別算法、語音識(shí)別的可信度評(píng)測算法、基于類的語言模型和自適應(yīng)語言模型,以及深層次的自然語音的理解。研究的方向也越來越側(cè)重于口語對(duì)話系統(tǒng)。語音識(shí)別是近年來十分活躍的一個(gè)研究領(lǐng)域。在不遠(yuǎn)的將來,語音識(shí)別技術(shù)有可能作為一種重要的人機(jī)交互手段,輔助甚至取代傳統(tǒng)的鍵盤、鼠標(biāo)等輸入設(shè)備,在個(gè)人計(jì)算機(jī)上進(jìn)行文字錄入和操作控制。本文介紹了語音識(shí)別的基本流程、所用到的語音參數(shù)算法、語音識(shí)別的訓(xùn)練算法和識(shí)別算法做初步的探究,主要運(yùn)用了特定人孤立詞識(shí)別的DTW算法和非特定人識(shí)別的連續(xù)HMM算法的Matlab識(shí)別系統(tǒng)。語音識(shí)別按說話人的講話方式可分為孤立詞(Isolated Word)識(shí)別、連接詞(Connected Word)識(shí)別和連續(xù)語音(Continuous Speech)識(shí)別。孤立詞識(shí)別是指說話人每次只說一個(gè)詞或短語,每個(gè)詞或短語在詞匯表中都算作一個(gè)詞條,一般用在語音電話撥號(hào)系統(tǒng)中。連接詞語音識(shí)別支持一個(gè)小的語法網(wǎng)絡(luò),其內(nèi)部形成一個(gè)狀態(tài)機(jī),可以實(shí)現(xiàn)簡單的家用電器的控制,而復(fù)雜的連接詞語音識(shí)別系統(tǒng)可以用于電話語音查詢、航空定票等系統(tǒng)。連續(xù)語音識(shí)別是指對(duì)說話人以日常自然的方式發(fā)音,通常特指用于語音錄入的聽寫機(jī)。顯然,連續(xù)非特定人語音識(shí)別的難度要大得多,因?yàn)椴粌H有說話人口音的問題,還有協(xié)同發(fā)音、斷字?jǐn)嗑?、搜索等問題,除了考慮語音的聲學(xué)模型外還要涉及到語言模型,如構(gòu)詞法、文法等。從識(shí)別對(duì)象的類型來看,語音識(shí)別可以分為特定人(Speaker Dependent)語音識(shí)別和非特定人(Speaker Independent)語音識(shí)別。特定人是指只針對(duì)一個(gè)用戶的語音識(shí)別,非特定人則可用于不同的用戶。實(shí)際上,非特定人語音識(shí)別的初始識(shí)別率往往都比較低,一般都要求用戶花一定的時(shí)間對(duì)系統(tǒng)進(jìn)行訓(xùn)練,將系統(tǒng)的參數(shù)進(jìn)行一定的自適應(yīng)調(diào)整,才能使識(shí)別率達(dá)到滿意的程度。非特定人大詞表連續(xù)語音識(shí)別是近幾年研究的重點(diǎn),也是研究的難點(diǎn)。目前的連續(xù)語音識(shí)別大多是基于HMM(隱馬爾可夫模型)框架,并將聲學(xué)、語言學(xué)的知識(shí)統(tǒng)一引入來改善這個(gè)框架,其硬件平臺(tái)通常是功能強(qiáng)大的工作站或PC機(jī)。語音識(shí)別系統(tǒng)的典型實(shí)現(xiàn)方案為:輸入的模擬語音信號(hào)首先要進(jìn)行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測、預(yù)加重等。語音信號(hào)經(jīng)預(yù)處理后,接下來很重要的一環(huán)就是特征參數(shù)提取。對(duì)特征參數(shù)的要求是:1,提取的特征參數(shù)能有效地代表語音特征,具有很好的區(qū)分性。2,各階參數(shù)之間有良好的獨(dú)立性。3,特征參數(shù)要計(jì)算方便,最好有高效的計(jì)算方法,以保證語音識(shí)別的實(shí)時(shí)實(shí)現(xiàn)。在訓(xùn)練階段,將特征參數(shù)進(jìn)行一定的處理之后,為每個(gè)詞條得到一個(gè)模型,保存為模版庫。在識(shí)別階段,語音喜好經(jīng)過相同的通道得到語音參數(shù),生成測試模版,與參考模版進(jìn)行匹配,將匹配分?jǐn)?shù)最高的參考模版作為識(shí)別結(jié)果。同時(shí)還可以在很多先驗(yàn)知識(shí)的幫助下,提高識(shí)別的準(zhǔn)確率。雖然語音識(shí)別已突破了最初對(duì)技術(shù)的檢驗(yàn)階段,
點(diǎn)擊復(fù)制文檔內(nèi)容
語文相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號(hào)-1