【正文】
文件編輯器窗口。 ( 3) 與在指令窗中直接運(yùn)行質(zhì)量一樣,腳本文件運(yùn)行時產(chǎn)生的變量都駐留在 MATLAB基本工作空間中。 M腳本文件是指: ( 1) 對于解決同一個問題,在文件中的指令形式和前后位置與在指令窗中輸入的那組指令毫無任何區(qū)別。但是當(dāng)待解決問題所需的指令較多而且所用指令結(jié)構(gòu)較復(fù)雜時,或者當(dāng)一組指令通過改變少量參數(shù)就可以被反復(fù)使用去解決不同問題 時,直接在直欞窗中輸入指令的方法就顯得累贅、繁瑣和笨拙。 ( 4) 豐富的函數(shù)工具箱 提供專門的對語音信號進(jìn)行處理的工具箱。 ( 2) 開放式的體系結(jié)構(gòu) 除了內(nèi)部函數(shù)外,所有的 MATLAB 主包文件和各工具 包文件都是對用戶開放的源程序文件,用戶可以通過修改源程序文件來構(gòu)成新的適合自己使用的專用工具包。其主要特點(diǎn)有: ( 1) 先進(jìn)的技術(shù)界面支持 MATLAB 給用戶提供的是一種最直觀、最簡潔的程序開發(fā)環(huán)境。利用 MATLAB可以實(shí)現(xiàn)符號運(yùn)算、科學(xué)計(jì)算、算法研究、數(shù)據(jù)分析和可視化、數(shù)學(xué)建模和仿真、圖形用戶界面設(shè)計(jì)以及科學(xué)工程繪圖等強(qiáng)大功能。 MATLAB 語言 MATLAB 語言 [1]是在 20 世紀(jì) 80 年代初期,由美國的 Math Works 軟件開發(fā)公司推出的一種信號圖像處理的數(shù)學(xué)工具軟件。 ( 3) I/O 接口儀器驅(qū)動程序的設(shè)計(jì) I/O 接口儀器驅(qū)動程序是控制硬件設(shè)備的驅(qū)動程序,也是連接主控計(jì)算機(jī)與儀器設(shè)備的紐帶。 用 LABVIEW 設(shè)計(jì)的虛擬儀器控制系統(tǒng)主要包括三個部分: ( 1) 儀器前面板的設(shè)計(jì) 儀器前面板的設(shè)計(jì)是指在虛擬儀器的開發(fā)平臺上,利用各類子模板圖標(biāo)創(chuàng)建用戶界面,即虛擬儀器的前面板。 ( 5) 囊括了 DAQ、 GPIB、 PXI、 VXI在內(nèi)的各種儀器通信總線標(biāo)準(zhǔn)的所有功能函數(shù),使得 不懂總線標(biāo)準(zhǔn)的開發(fā)者也能夠驅(qū)動不同總線標(biāo)準(zhǔn)接口設(shè)備與儀器。 ( 3) 既提供了傳統(tǒng)的程序調(diào)試手段,如設(shè)置斷點(diǎn)、單步運(yùn)行,同時又提供了獨(dú)到的高亮執(zhí)行工具,使程序動畫式運(yùn)行,利于設(shè)計(jì)者觀察程序運(yùn)行的細(xì)節(jié),使程序的調(diào)試和開發(fā)更為便捷。虛擬儀器的構(gòu)成,如圖 所示: 顯 示 器信 號 分 析 及 處 理數(shù) 據(jù) 發(fā) 生 器A / D 轉(zhuǎn) 換 器D / A 轉(zhuǎn) 換 器信 號 調(diào) 理 器 信 號 調(diào) 理 器信 號 調(diào) 理 器各 類 接 口人 機(jī) 接 口信 號 輸 入信 號 輸 出 圖 虛擬儀器的構(gòu)成 LABVIEW 軟件工具的特點(diǎn)可歸納為: ( 1) 圖形化的編程方式,無須寫任何文本格式的代碼,是真正的工程師語言。 決定虛擬儀器具備傳統(tǒng) 儀器不可能具備的上述特點(diǎn)的根本原因在于:“虛擬儀器的關(guān)鍵是軟件”。 ( 4)研制周期較傳統(tǒng)儀器大為縮短。 ( 2)儀器的功能是由用戶根據(jù)需要由軟件來定義的,而不是事先由廠家定義好的。使用者只要用鼠標(biāo)點(diǎn)擊虛擬面板,就可以操作這臺計(jì)算機(jī)系統(tǒng)硬件平臺,就如同使用一臺專用的測量儀器。虛擬儀器是計(jì)算機(jī)硬件資源、虛擬儀器軟件資源和儀器與測控系統(tǒng)硬件資源三者的有效結(jié)合。但漢語數(shù)字語音識別技術(shù)由于漢語數(shù)字語音存在高混淆的問題,使得其進(jìn)展相當(dāng)緩慢,再加上漢語獨(dú)特的單音節(jié)特征和多方言語種等問題使得漢語數(shù)字識別系統(tǒng)在噪聲環(huán)境下仍然具有很大難度,任務(wù)艱巨。其中聲母識別采用 CHMM 模型,聲調(diào)識別采用感知神經(jīng)網(wǎng)絡(luò)模型,整個系統(tǒng)識別率高達(dá) %,聲調(diào)識別率為 %,詞的識別率為 95% [1, 4,8]。清華大學(xué)電子工程系研究的語音識別系統(tǒng)以 1183 個單音節(jié)詞作為識別單元,它采用的是分段概率的模型,對詞的組成音節(jié)進(jìn)行仔細(xì)的分解,最后用搜索匹配算法來計(jì)算整體的識別率,使二字詞和三字詞的識別率達(dá)到 %。 80 年代后期,從 1987 年起國家“ 863”智能計(jì)算機(jī)的主題專家組委對語音識別技術(shù)立項(xiàng),經(jīng)過二十多年的發(fā)展,漢語語音識別取得了國內(nèi)前所未有的成果,研究水平已經(jīng)與國際同步,在漢語語音識別的技術(shù)上還有自己的特點(diǎn)和優(yōu)勢。如 IBM 的 ViaVoice 系統(tǒng)、劍橋大學(xué)的 HTK 系統(tǒng)、 DARGON 系統(tǒng)、 Microsoft 的 Whisper 系統(tǒng)等,這些語音識別系統(tǒng)代表著當(dāng)時語音識別的最高水平,同時結(jié)合自然語音處理技術(shù),發(fā)展到基于自然口語識別、理 解的人機(jī)對話系統(tǒng)和不同語種的直接語音翻 譯設(shè)備。發(fā)達(dá)國家如日本、美國等著名大公司( IBM、 Apple、 ATamp。 90 年代以前,語音識別系統(tǒng)主要是在實(shí)驗(yàn)室中進(jìn)行的。 HMM 的理論基礎(chǔ)在 1970 年前后由 Baum 等人建立起來,隨后由 CMU 的 Baker 和 IBM 的 Jelinek 等人應(yīng)用于語音識別之中, HMM 模型的廣泛應(yīng)用歸功于貝爾實(shí)驗(yàn)室 Rabiner 等研究者的努力,他們把原來艱澀的純數(shù)學(xué)化的 HMM 模型工程化,讓從事語音處理的研究者更了解和熟悉,進(jìn)而成為公認(rèn)的一個研究熱點(diǎn) [1, 4,6,7]。 繼 70年代的孤立詞語音識別研究后, 80 年代主要研究的是連接詞語音識別的問題,由單個詞的模式串接在一起的短連接詞語音進(jìn)行匹配識別。在這期間,貝爾實(shí)驗(yàn)室開展了用于建立真正的非特定人語音識別系統(tǒng)的實(shí)驗(yàn)研究,提出了范圍較廣泛的一類復(fù)雜的聚類算法,用來確定能夠表示大量人群 的不同詞語的所有聲學(xué)變化的不同模式。這使得孤立詞發(fā)音和孤立詞發(fā)音的識別技術(shù)成為可行的生活實(shí)用技術(shù)。盡管動態(tài)時間彎折 (Dynamic Time Wrapping, DTW)概念的實(shí)質(zhì)和用 于連接詞識別的算法雛形已經(jīng)包含在 Vintsyuk 的研究工作中 [1, 2],但這十年之中并沒有取得令人鼓舞的突破性進(jìn)展。計(jì)算機(jī)的使用在很大程度上加快了語音識別方法的研究。 1952 年貝爾實(shí)驗(yàn)室的 Davis 等人首次采用識別方法是根 據(jù)語音第一、二共振峰位置提取若干特征的方法研制出能識別十個英語數(shù)字的語音識別系統(tǒng),實(shí)現(xiàn)了用模擬電路實(shí)現(xiàn)未知語音與參考語音之間的相關(guān)度運(yùn)算 [1]。起初,語音識別是通過人工分析語譜圖而進(jìn)行識別的。在國外這方面的例子數(shù)不勝數(shù),特別在近些年來,此技術(shù)已經(jīng)作為語音識別技術(shù)在應(yīng)用領(lǐng)域的一大主題,該應(yīng)用對軍事和司法調(diào)查、刑事偵查具有巨大的實(shí)用價值。比如,在外國科幻電影中,我們經(jīng)常會看到高精密發(fā)射的核設(shè)施發(fā)射系統(tǒng),它除了一般的發(fā)射檢測程序外,總統(tǒng)聲音命令也成為了核發(fā)射系統(tǒng)的重要密匙,在最終確認(rèn)發(fā)射時,需要通過總統(tǒng)的特定語音命令,才可進(jìn)行程序釋放,核發(fā)射才進(jìn)入相應(yīng)倒計(jì)時階段。據(jù)外國有關(guān)媒體報(bào)道,語音玩具的銷售遠(yuǎn)遠(yuǎn)超出了預(yù)期水平 [7]。該系統(tǒng)也可稱為家庭幼兒輔導(dǎo)老師及中小學(xué)教育不可或缺的輔助工具。目前,這種智能汽車已經(jīng)進(jìn)入了研究階段,相信過不了多久,這個構(gòu)想將很快成為現(xiàn)實(shí)。一些國內(nèi)外知名的汽車制造公司,很早就預(yù)見了語音技術(shù)在汽車行業(yè)的發(fā)展前景,他們已經(jīng)提出了無需操控的、在后座說話就可以駕駛的智能汽車,完全告別了手動駕駛車輛的模式。一些帶有語音功能的辦公設(shè)備,甚至可以幫助殘疾人士在家里或在工作崗位上,開辟出一個新的生存空間。 ( 3)語音識別技術(shù)在扶殘扶弱方面的應(yīng)用 為了幫助殘疾人士由于肢體功能方面的缺陷而引起的動作不便,運(yùn)用語音識別系統(tǒng),則能對其給予一定的方便。 1996 年,美國卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)系開發(fā)的語言語音機(jī)票預(yù)訂系統(tǒng),在實(shí)踐方面,就做出了有益的嘗試 [6]。該系統(tǒng)不僅能提供英語和漢語查詢,而且可以用其它語言來查詢。目前在國際上的各大旅游景區(qū)已經(jīng)開始逐步采用語音識別查詢系統(tǒng),其中最具代表性的是日本豐橋大學(xué)設(shè)計(jì)研發(fā)的“富士山旅游咨詢系統(tǒng)”,該系統(tǒng)是一個比較實(shí)用的語音查詢系統(tǒng),此外它還可以采用問卷調(diào)查等方式,集成了自動語言的語音導(dǎo)覽系統(tǒng)。它與自動撥號,健康和福利,生命支持系統(tǒng)和其他實(shí)際應(yīng)用相互銜接,直接控制商業(yè),制造業(yè),金融業(yè),運(yùn)輸業(yè),旅游業(yè),公安消防等工業(yè)生產(chǎn)部門和應(yīng)用領(lǐng)域,該技術(shù)的日益成熟有望成為下一代的操作系統(tǒng)和應(yīng)用程序的用戶界面。經(jīng)過二十年的研究探索,語音識別技術(shù)取得 了很大的發(fā)展。語音識別研究的就是如何讓機(jī)器聽懂人的語音內(nèi)容,同時辨別是否是主人所發(fā)出的指令,執(zhí)行相應(yīng)的操作。隨著現(xiàn)代社會的不斷發(fā)展,科學(xué)技術(shù)的日益成熟,全自動機(jī)器逐漸被運(yùn)用于各個領(lǐng)域,取代了很多原本依靠人來完成的工作,人們對機(jī) 器的智能要求也越來越高,人機(jī)進(jìn)行信息交互的手段也越來越便捷和迅速,因此語言交流自然而然的成為了首選。 Followed, this paper realizes automatically speech signal acquisition , and uses multithread of LABVIEW to calculate the feature parameters in aparallel way and short 1/4 of the calculating time which improve the efficiency of the feature functional testing。s normal life. Currently, a lot of appliances have the function that can give warning messages to the user in sound which improves the efficiency of human and machine interaction. This design is a use of virtual instrument and do speech recognition system design. Will the virtual instrument technology used in speech recognition system, realized the instrument of the software, and reflect the software is instrument thought. Use notes itself with sound card for voice signal collection, the speech signal digital conversion and further processing. MATLAB wavelet in the toolkit of collected a voice signal wavelet denoising treatment, and with the help of LABVIEW provided in the Script Node sub. vi connect the mainstream algorithm simulation analysis software MATLAB, make full use of MATLAB powerful data processing capabilities, even though the LABVIEW provides some information processing functions, but limited after all, still can39。最后在分析語音識 別系統(tǒng)主要需求的基礎(chǔ)上,對識別系統(tǒng)的軟硬件進(jìn)行了設(shè)計(jì),并 對語音信號做噪聲消除以及預(yù)處理后進(jìn)行特征提取,利用不同語音獨(dú)特的特征和模式匹配算法,實(shí)現(xiàn)說話人語音信號的最終識別。 文中首先 介紹了語音識別技術(shù)的基本原理,分析了經(jīng)常使用的線性預(yù)測倒譜系數(shù)和美爾頻率倒譜系數(shù),并選定美爾頻率倒譜系數(shù)作為本系統(tǒng)中采用的語音特征參數(shù) 。在這里我們利用MATLAB 中的小波工具包,實(shí)現(xiàn)了利用小波的方法對含有雜聲的語音信號進(jìn)行噪聲消除的工作。 利用 MATLAB 中的小波工具包對采集到的語音信號進(jìn)行小波消噪處理,并借助 LABVIEW 中提供的 Script Node 子 VI 連接主流算法即仿真分析軟件 MATLAB ,充分發(fā)揮 MATLAB 強(qiáng)大的數(shù)據(jù)處理能力,雖然 LABVIEW 中提供了一些信息處理功能函數(shù),但其畢竟功能有限,仍然無法滿足部分用戶對數(shù)值進(jìn)行各種各樣的計(jì)算和分析的需求。 本次設(shè)計(jì)將虛擬儀器技術(shù)用于語音識別系統(tǒng),實(shí)現(xiàn)了儀器的 軟件化,真正體現(xiàn)了“軟件就是儀器”的思想。 涉密論文按學(xué)校規(guī)定處理。 作者簽名: 日期: 年 月 日 學(xué)位論文版權(quán)使用授權(quán)書 本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國 家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。對本文的研究做出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式標(biāo)明。 作者簽名: 日 期: 學(xué)位論文原創(chuàng)性聲明 本人鄭重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。對本研究提供過幫助和做出過貢獻(xiàn)的個人或集體,均已在文中作了明確的說明并表示了謝意。 本科生畢業(yè)設(shè)計(jì)說明書(畢業(yè)論文) 題 目:基于虛擬儀器的語音識別 算法研究 畢業(yè)設(shè)計(jì)(論文)原創(chuàng)性聲明和使用授權(quán)說明 原創(chuàng)性聲明 本人鄭重承諾:所呈交的畢業(yè)設(shè)計(jì)(論文),是我個人在指導(dǎo)教師的指導(dǎo)下進(jìn)行的研究工作及取得的成果。盡我所知,除文中特別加以標(biāo)注和致謝的地方外,不包含其他人或組織已經(jīng)發(fā)表或公布過的研究成果,也不包含我