freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音識別系統(tǒng)的設(shè)計本科畢業(yè)設(shè)計(已修改)

2025-07-04 01:17 本頁面
 

【正文】 河南理工大學(xué)畢業(yè)設(shè)計(論文)說明書摘 要語音識別主要是讓機器聽懂人說的話,即在各種情況下,準確地識別出語音的內(nèi)容,從而根據(jù)其信息執(zhí)行人的各種意圖。語音識別技術(shù)既是國際競爭的一項重要技術(shù),也是每一個國家經(jīng)濟發(fā)展不可缺少的重要技術(shù)支撐。本文基于語音信號產(chǎn)生的數(shù)學(xué)模型,從時域、頻域出發(fā)對語音信號進行分析,論述了語音識別的基本理論。在此基礎(chǔ)上討論了語音識別的五種算法:動態(tài)時間伸縮算法(Dynamic Time Warping,DTW)、基于規(guī)則的人工智能方法、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)方法、隱馬爾可夫(Hidden Markov Model,HMM)方法、HMM和ANN的混合模型。重點是從理論上研究隱馬爾可夫(HMM)模型算法,對經(jīng)典的HMM模型算法進行改進。語音識別算法有多種實現(xiàn)方案,本文采取的方法是利用Matlab強大的數(shù)學(xué)運算能力,實現(xiàn)孤立語音信號的識別。Matlab 是一款功能強大的數(shù)學(xué)軟件,它附帶大量的信號處理工具箱為信號分析研究,特別是文中主要探討的聲波分析研究帶來極大便利。本文應(yīng)用隱馬爾科夫模型(HMM) 為識別算法,采用MFCC(MEL頻率倒譜系數(shù))為主要語音特征參數(shù),建立了一個漢語數(shù)字語音識別系統(tǒng),其中包括語音信號的預(yù)處理、特征參數(shù)的提取、識別模板的訓(xùn)練、識別匹配算法;同時,提出利用Matlab圖形用戶界面開發(fā)環(huán)境設(shè)計語音識別系統(tǒng)界面,設(shè)計簡單,使用方便,系統(tǒng)界面友好。經(jīng)過統(tǒng)計,識別效果明顯達到了預(yù)期目標。關(guān)鍵詞:語音識別算法;HMM模型;Matlab;GUIABSTRACTSpeech Recognition is designed to allow machines to understand what people say,and accurately identify the contents of voice to execute the intent of recognition technology is not only an important internationally peted technology,but also an indispensable foundational technology for the national economic on the mathematical model from the speech signal,this paper analyze audio signal from the time domain,frequency domain proceeding,and discussed the basic theory of speech recognition algorithm are discussed:Dynamic Time Warping(DTW)、Rulebased Artificial Intelligence,Artificial Neural Network(ANN),Hidden Markov Model(HMM),HMM bined with focus is put in the theoretical studies of Hidden Markov(HMM) model algorithm,and the classical HMM algorithm is improved.Speech recognition algorithm is realized in various programs,this article taking the method is to use Matlab powerful mathematical operation ability to realize the recognition of speech signal isolation. Matlab is a powerful mathematic software with a mass of toolboxes dealing with signal processing. It gives a terrific shortcut to the research of signal processing,especially the wave analysis. We can characterize the sound with key parameters such as intensity, frequency etc. In this paper, hidden Markov model (HMM) recognition algorithm using MFCC (MEL frequency cepstral coefficients) as the main voice characteristic parameters, the establishment of a Chinese digital speech recognition system, including the preprocessing of the speech signal,the extraction of characteristic parameters the training of the recognition template,identifying matching algorithm。the same time,the use of Matlab graphical user interface development environment designed speech recognition system interface,is designed to be simple,easy to use,friendly interface. Besides,to have a simple exploration of the voice recognition is another statistics,recognition result obviously is made out as the expected goal.Key words:Speech recognition algorithm;HMM model;Matlab;GUI44目錄一、前言 1 1 1 2 3 3 4二、語音信號分析 4 4 5 5 6 7 7 7 8 8 9 9 11 12 13 14 14 14 15 LPCC倒譜系數(shù) 15 Mel頻率倒譜系數(shù) 16三、語音識別主要算法 17 17 18 19 20 HMM和ANN的混合模型 21四、隱含馬爾可夫模型算法 23 HMM的基本理論和數(shù)學(xué)描述 23 HMM的三個基本問題及解決算法 24 HMM算法的改進 31 HMM的結(jié)構(gòu)和類型 33 HMM算法實現(xiàn)的問題 34五、基于Matlab環(huán)境下的語音識別算法實現(xiàn) 35 35 36 36 36 37 38六、結(jié)束語 39 39 39七、致謝 40參考文獻 40河南理工大學(xué)畢業(yè)設(shè)計(論文)說明書一、前言作為智能計算機研究的主導(dǎo)方向和人機語音通信的關(guān)鍵技術(shù),語音識別技術(shù)一直受到各國科學(xué)界的廣泛關(guān)注。以語音識別開發(fā)出的產(chǎn)品應(yīng)用領(lǐng)域非常廣泛,有聲控電話交換、語音撥號系統(tǒng)、信息網(wǎng)絡(luò)查詢、家庭服務(wù)、賓館服務(wù)、旅行社服務(wù)系統(tǒng)、訂票系統(tǒng)、聲控智能玩具、醫(yī)療服務(wù)、銀行服務(wù)、股票查詢服務(wù)、計算機控制、工業(yè)控制、語音通信系統(tǒng)、軍事監(jiān)聽、信息檢索、應(yīng)急服務(wù)、翻譯系統(tǒng)等,幾乎深入到社會的每個行業(yè)、每個方面,其應(yīng)用和經(jīng)濟社會效益前景非常廣泛。因此語音識別技術(shù)既是國際競爭的一項重要技術(shù),也是每一個國家經(jīng)濟發(fā)展不可缺少的重要技術(shù)支撐。研究語音識別,開發(fā)相應(yīng)的產(chǎn)品有著廣泛的社會意義和經(jīng)濟意義。語音識別中的說話人辨認的研究始于20世紀30年代。早期的工作主要集中在人耳聽辨試驗和探討聽音識別的可能性方面。Bell實驗室的L.G.Kesta目視觀察語譜圖進行識別,提出了“聲紋(Voiceprint)”的概念。Bell實驗室的S.Pruzansky提出了模版匹配和概率統(tǒng)計方差分析的聲紋識別方法,形成了聲紋識別研究的一個高潮。60年代末和70年代初語音識別最重要的發(fā)展是語音信號線性預(yù)測編碼(LPC)技術(shù)和動態(tài)時間規(guī)整(DTW)技術(shù),有效地解決了語音的特征提取和時間不等長匹配問題,對特定人的語音識別十分有效。研究特點是以孤立字語音識別為主,通常把孤立字作為一個整體來建立模板。80年代,語音識別研究的重點之一是連接詞語音識別,開發(fā)了各種連接詞語音識別和關(guān)鍵詞識別算法,如多級動態(tài)規(guī)劃語音識別算法。另一個重要發(fā)展是語音識別算法從模板匹配技術(shù)轉(zhuǎn)向基于統(tǒng)計模型技術(shù)。20世紀90年代后,在細化模型的設(shè)計、參數(shù)提取和優(yōu)化,以及系統(tǒng)的自適應(yīng)技術(shù)上取得了一些關(guān)鍵進展。語音識別技術(shù)進一步成熟,并開始向市場提供產(chǎn)品。由于中國的國際地位不斷提高,以及在經(jīng)濟和市場方面所處的重要地位,漢語語音識別也越來越受到重視。IBM、Microsoft、Lamp。H等公司相繼投入到漢語語音識別系統(tǒng)的開發(fā)中,其投資也逐年增加。IBM開發(fā)的Viavoice和Microsoft開發(fā)的中文識別引擎代表了當(dāng)前漢語語音識別的最高水平。臺灣的一些大學(xué)和研究所也開發(fā)出大詞匯量非特定人連續(xù)語音識別演示系統(tǒng)。日本也先后在語音識別領(lǐng)域大展頭角,還有如Philips公司開發(fā)的Speech—Media和Speech Pearl兩套軟件,涵蓋了自然語音識別與理解的對話系統(tǒng)。我國語音識別研究工作近年來發(fā)展很快,同時也從實驗室逐步走向?qū)嵱?。?987年開始執(zhí)行863計劃后,國家863《智能計算機主題》專家組為語音識別研究立項。每兩年滾動一次,從1991年開始,專家組每一至二年舉行一次全國性的語音識別系統(tǒng)測試。漢語語音識別研究已經(jīng)走上組織化的道路。目前我國大詞匯量連續(xù)語音識別系統(tǒng)的研究已經(jīng)接近國外最高水平。語音識別發(fā)展到一定階段,世界各國都加快了語音識別引用系統(tǒng)的研究開發(fā),通常連續(xù)語音是含有較完整語法信息的連續(xù)語句,最接近于人的自然講話方式,從非連續(xù)語音到連續(xù)語音的研究面臨著很多完全不同的技術(shù)難點,非連續(xù)語音的識別是一些孤立的聲波片段,連續(xù)語音則面臨著如何切分聲波的問題。諸如此類的新問題使連續(xù)語音識別率的提高比非連續(xù)語音更加困難。經(jīng)過幾十年的發(fā)展和摸索,人們終于在實驗室突破了大詞匯量、連續(xù)語音和非特定人這三大障礙,第一次把這三個特性一起集中于一個系統(tǒng)中,并以此確定了統(tǒng)計方法和模型在語音識別和語音處理中的主流地位。在聲學(xué)識別層次,以多個說話人發(fā)音的大規(guī)模語音數(shù)據(jù)為基礎(chǔ),以馬爾可夫鏈為基礎(chǔ)的語音序列建模方法HMM(隱含馬爾可夫模型)比較有效的解決了語音信號短時穩(wěn)定、長時時變的特性,并且能根據(jù)一些基本建模單元構(gòu)造成連續(xù)語音的句子模型,達到了比較高的建模精度和建模靈活性。目前在語音識別研究領(lǐng)域非?;钴S的課題為穩(wěn)健語音識別、說話人自適應(yīng)技術(shù)、大詞匯量關(guān)鍵詞識別算法、語音識別的可信度評測算法、基于類的語言模型和自適應(yīng)語言模型,以及深層次的自然語音的理解。研究的方向也越來越側(cè)重于口語對話系統(tǒng)。語音識別是近年來十分活躍的一個研究領(lǐng)域。在不遠的將來,語音識別技術(shù)有可能作為一種重要的人機交互手段,輔助甚至取代傳統(tǒng)的鍵盤、鼠標等輸入設(shè)備,在個人計算機上進行文字錄入和操作控制。本文介紹了語音識別的基本流程、所用到的語音參數(shù)算法、語音識別的訓(xùn)練算法和識別算法做初步的探究,主要運用了特定人孤立詞識別的DTW算法和非特定人識別的連續(xù)HMM算法的Matlab識別系統(tǒng)。語音識別按說話人的講話方式可分為孤立詞(Isolated Word)識別、連接詞(Connected Word)識別和連續(xù)語音(Continuous Speech)識別。孤立詞識別是指說話人每次只說一個詞或短語,每個詞或短語在詞匯表中都算作一個詞條,一般用在語音電話撥號系統(tǒng)中。連接詞語音識別支持一個小的語法網(wǎng)絡(luò),其內(nèi)部形成一個狀態(tài)機,可以實現(xiàn)簡單的家用電器的控制,而復(fù)雜的連接詞語音識別系統(tǒng)可以用于電話語音查詢、航空定票等系統(tǒng)。連續(xù)語音識別是指對說話人以日常自然的方式發(fā)音,通常特指用于語音錄入的聽寫機。顯然,連續(xù)非特定人語音識別的難度要大得多,因為不僅有說話人口音的問題,還有協(xié)同發(fā)音、斷字斷句、搜索等問題,除了考慮語音的聲學(xué)模型外還要涉及到語言模型,如構(gòu)詞法、文法等。從識別對象的類型來看,語音識別可以分為特定人(Speaker Dependent)語音識別和非特定人(Speaker Independent)語音識別。特定人是指只針對一個用戶的語音識別,非特定人則可用于不同的用戶。實際上,非特定人語音識別的初始識別率往往都比較低,一般都要求用戶花一定的時間對系統(tǒng)進行訓(xùn)練,將系統(tǒng)的參數(shù)進行一定的自適應(yīng)調(diào)整,才能使識別率達到滿意的程度。非特定人大詞表連續(xù)語音識別是近幾年研究的重點,也是研究的難點。目前的連續(xù)語音識別大多是基于HMM(隱馬爾可夫模型)框架,并將聲學(xué)、語言學(xué)的知識統(tǒng)一引入來改善這個框架,其硬件平臺通常是功能強大的工作站或PC機。語音識別系統(tǒng)的典型實現(xiàn)方案為:輸入的模擬語音信號首先要進行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、端點檢測、預(yù)加重等。語音信號經(jīng)預(yù)處理后,接下來很重要的一環(huán)就是特征參數(shù)提取。對特征參數(shù)的要求是:1,提取的特征參數(shù)能有效地代表語音特征,具有很好的區(qū)分性。2,各階參數(shù)之間有良好的獨立性。3,特征參數(shù)要計算方便,最好有高效的計算方法,以保證語音識別的實時實現(xiàn)。在訓(xùn)練階段,將特征參數(shù)進行一定的處理之后,為每個詞條得到一個模型,保存為模版庫。在識別階段,語音喜好經(jīng)過相同的通道得到語音參數(shù),生成測試模版,與參考模版進行匹配,將匹配分數(shù)最高的參考模版作為識別結(jié)果。同時還可以在很多先驗知識的幫助下,提高識別的準確率。雖然語音識別已突破了最初對技術(shù)的檢驗階段,
點擊復(fù)制文檔內(nèi)容
語文相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1