freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

畢業(yè)論文基于虛擬儀器的語音識別算法研究(編輯修改稿)

2025-10-03 10:49 本頁面
 

【文章內(nèi)容簡介】 的多個高等院校,此語音識別教學(xué)系統(tǒng)用來幫助學(xué)生在語言學(xué)習(xí)的過程中,引導(dǎo)學(xué)生正確發(fā)音,及時的糾正外語口語的發(fā)音。該系統(tǒng)也可稱為家庭幼兒輔導(dǎo)老師及中小學(xué)教育不可或缺的輔助工具。 ( 6)語言語音玩具 在對孩子進行啟蒙教育的時候,你可以用帶有語音說話功能的娃娃與孩子交談,讓孩子操作服從語音命令的玩具,在孩子們幼小的心靈就播下科學(xué)的種子,讓這些玩具引導(dǎo)孩子們探索科技,發(fā)現(xiàn)科學(xué)的偉大力量。據(jù)外國有關(guān)媒體報道,語音玩具的銷售遠遠超出了預(yù)期水平 [7]。 ( 7)語音識別技術(shù)在軍事方面,刑事調(diào)查方面的應(yīng)用 由于每 個人的發(fā)音都有其獨特的特點,就像人的指紋一樣,具有獨特性和唯一性,是非常有特點的識別標(biāo)志,科學(xué)上可以運用它來判斷一個特定的人。比如,在外國科幻電影中,我們經(jīng)常會看到高精密發(fā)射的核設(shè)施發(fā)射系統(tǒng),它除了一般的發(fā)射檢測程序外,總統(tǒng)聲音命令也成為了核發(fā)射系統(tǒng)的重要密匙,在最終確認(rèn)發(fā)射時,需要通過總統(tǒng)的特定語音命令,才可進行程序釋放,核發(fā)射才進入相應(yīng)倒計時階段。再有,在司法刑偵檢測時,犯罪嫌疑人的聲音也可以作為破案的重要線索,因為每個人說話的聲音是不一樣的,語音數(shù)據(jù)將會和 DNA 測試結(jié)果一起作為證據(jù),這種方法已經(jīng)得到 了法律上的認(rèn)可。在國外這方面的例子數(shù)不勝數(shù),特別在近些年來,此技術(shù)已經(jīng)作為語音識別技術(shù)在應(yīng)用領(lǐng)域的一大主題,該應(yīng)用對軍事和司法調(diào)查、刑事偵查具有巨大的實用價值。 語音識別發(fā)展歷史及現(xiàn)狀 語音識別技術(shù)的研究歷史可以追溯到上個世紀(jì)三十年代初, 1947 年,貝爾 (Bell)實驗室發(fā)明了語譜圖分析儀,意味著語音識別技術(shù)研究的萌芽。起初,語音識別是通過人工分析語譜圖而進行識別的。 50 年代初期,研究人員大部分致力于聲學(xué) — 語音學(xué)的基本概念進行探索。 1952 年貝爾實驗室的 Davis 等人首次采用識別方法是根 據(jù)語音第一、二共振峰位置提取若干特征的方法研制出能識別十個英語數(shù)字的語音識別系統(tǒng),實現(xiàn)了用模擬電路實現(xiàn)未知語音與參考語音之間的相關(guān)度運算 [1]。 60 年代初期,語音識別系統(tǒng)的構(gòu)成基本上是用硬件實現(xiàn)的,通過濾波器組提取頻譜特征,用計算機進行匹配、計算和判決。計算機的使用在很大程度上加快了語音識別方法的研究。這期間出現(xiàn)了語音識別的幾個重要的思想,前蘇聯(lián)研究人員 Vintsyuk 提出使用動態(tài)規(guī)劃來對齊兩個長度不同的語音音段。盡管動態(tài)時間彎折 (Dynamic Time Wrapping, DTW)概念的實質(zhì)和用 于連接詞識別的算法雛形已經(jīng)包含在 Vintsyuk 的研究工作中 [1, 2],但這十年之中并沒有取得令人鼓舞的突破性進展。 70 年代初, 日本學(xué)者板倉 (Itakura)提出了動態(tài)時間規(guī)整 (DTW)技術(shù) [4],使語音識別技術(shù)研究在匹配算法方面開辟了新思路;中期的線性預(yù)測技術(shù) [5] (Linear Prediction, LP)被應(yīng)用于語音信號處理,然后隱馬爾可夫模型法 [6] (Hidden Markov Model, HMM)也獲得初步的成果,該技術(shù)在語音信號處理的多個方面獲得了巨大成果; 70 年代末 ,Linda、 Buzo、 Gray 和 Markel 等人首次解決了矢量量化 [7, 11] (Vector Quantization, VQ)碼書生成的方法,并首先將矢量量化技術(shù)用于語音編碼并且獲得了成功。這使得孤立詞發(fā)音和孤立詞發(fā)音的識別技術(shù)成為可行的生活實用技術(shù)。另外, 70 年代的里程碑是在 IBM 進行了一個長期持續(xù)的、頗有成效的大詞匯量連續(xù)語音識別研究的集體努力的成果。在這期間,貝爾實驗室開展了用于建立真正的非特定人語音識別系統(tǒng)的實驗研究,提出了范圍較廣泛的一類復(fù)雜的聚類算法,用來確定能夠表示大量人群 的不同詞語的所有聲學(xué)變化的不同模式。這些研究為后來非特定人模式聚類技術(shù)的研究奠定了基礎(chǔ),現(xiàn)在已經(jīng)得到了廣泛的應(yīng)用。 繼 70年代的孤立詞語音識別研究后, 80 年代主要研究的是連接詞語音識別的問題,由單個詞的模式串接在一起的短連接詞語音進行匹配識別。識別的方法也逐漸從最初的模板匹配方法轉(zhuǎn)變到了統(tǒng)計模型方法,其中典型的統(tǒng)計方法代表是隱馬爾可夫模型,由于這種方法在結(jié)構(gòu)、參數(shù)和訓(xùn)練方法的選擇上有很大的靈活性,逐漸成為了語音識別技術(shù)的主流。 HMM 的理論基礎(chǔ)在 1970 年前后由 Baum 等人建立起來,隨后由 CMU 的 Baker 和 IBM 的 Jelinek 等人應(yīng)用于語音識別之中, HMM 模型的廣泛應(yīng)用歸功于貝爾實驗室 Rabiner 等研究者的努力,他們把原來艱澀的純數(shù)學(xué)化的 HMM 模型工程化,讓從事語音處理的研究者更了解和熟悉,進而成為公認(rèn)的一個研究熱點 [1, 4,6,7]。隨著 HMM模型和人工神經(jīng)網(wǎng)絡(luò)等技術(shù)在語音識別中的廣泛應(yīng)用,科學(xué)家們已經(jīng)在實驗室突破了單個詞匯量的識別,并且對大詞匯量、連續(xù)語音和非特定人的語音識別技術(shù)也取得了顯著 進展。 90 年代以前,語音識別系統(tǒng)主要是在實驗室中進行的。 90 年代 后,隨著 IT 技術(shù)的迅速發(fā)展,多媒體時代的來臨,迫切需要語音識別系統(tǒng)走出實驗室,走向人們的日常生活乃至工廠。發(fā)達國家如日本、美國等著名大公司( IBM、 Apple、 ATamp。T、 NTT) 都為語音識別系統(tǒng)的實用化研究開發(fā)投入巨大資金和人力,研制出大詞匯量語音識別系統(tǒng) [1,4,8]。如 IBM 的 ViaVoice 系統(tǒng)、劍橋大學(xué)的 HTK 系統(tǒng)、 DARGON 系統(tǒng)、 Microsoft 的 Whisper 系統(tǒng)等,這些語音識別系統(tǒng)代表著當(dāng)時語音識別的最高水平,同時結(jié)合自然語音處理技術(shù),發(fā)展到基于自然口語識別、理 解的人機對話系統(tǒng)和不同語種的直接語音翻 譯設(shè)備。 國內(nèi)的語音識別研究開始于 50 年代后期,中科院聲學(xué)所利用頻譜分析的方法成功研究出漢語的 10 個元音的語音識別, 70 年代后期,研究出了基于模板匹配的孤立詞語音識別系統(tǒng)。 80 年代后期,從 1987 年起國家“ 863”智能計算機的主題專家組委對語音識別技術(shù)立項,經(jīng)過二十多年的發(fā)展,漢語語音識別取得了國內(nèi)前所未有的成果,研究水平已經(jīng)與國際同步,在漢語語音識別的技術(shù)上還有自己的特點和優(yōu)勢。越來越多的大學(xué)和科研院所紛紛作出響應(yīng),加大投資,加入到語音識別的研究行列,大 大推動了漢語語音識別技術(shù)的發(fā)展。清華大學(xué)電子工程系研究的語音識別系統(tǒng)以 1183 個單音節(jié)詞作為識別單元,它采用的是分段概率的模型,對詞的組成音節(jié)進行仔細的分解,最后用搜索匹配算法來計算整體的識別率,使二字詞和三字詞的識別率達到 %。北京中科院自動化系研究所的模式識別實驗室將漢語的音節(jié)切分成韻母和聲母,并結(jié)合聲調(diào)信息,然后進行識別。其中聲母識別采用 CHMM 模型,聲調(diào)識別采用感知神經(jīng)網(wǎng)絡(luò)模型,整個系統(tǒng)識別率高達 %,聲調(diào)識別率為 %,詞的識別率為 95% [1, 4,8]。鑒于中國龐 大的市場,國外也非常重視漢語語音識別的研究。但漢語數(shù)字語音識別技術(shù)由于漢語數(shù)字語音存在高混淆的問題,使得其進展相當(dāng)緩慢,再加上漢語獨特的單音節(jié)特征和多方言語種等問題使得漢語數(shù)字識別系統(tǒng)在噪聲環(huán)境下仍然具有很大難度,任務(wù)艱巨。 虛擬儀器( Virtual Instrument,簡稱 VI)是現(xiàn)代計算機技術(shù)和儀器技術(shù)相結(jié)合的產(chǎn)物,是目前計算機輔助測試( CAT)領(lǐng)域的一項重要技術(shù)。虛擬儀器是計算機硬件資源、虛擬儀器軟件資源和儀器與測控系統(tǒng)硬件資源三者的有效結(jié)合。 所謂虛擬儀器,就是以通用計算機為核 心,借助這個硬件平臺,由用戶自己設(shè)計定義,其具有虛擬面板并且測試功能由測試軟件實現(xiàn)的一種計算機儀器系統(tǒng)。使用者只要用鼠標(biāo)點擊虛擬面板,就可以操作這臺計算機系統(tǒng)硬件平臺,就如同使用一臺專用的測量儀器。 虛擬儀器的特點可歸納為: ( 1)在通用硬件平臺確定后,由軟件取代傳統(tǒng)儀器中 的硬件來完成儀器的功能。 ( 2)儀器的功能是由用戶根據(jù)需要由軟件來定義的,而不是事先由廠家定義好的。 ( 3)儀器性能的改進和功能擴展只需進行相關(guān)軟件的設(shè)計更新,而不需購買新的儀器。 ( 4)研制周期較傳統(tǒng)儀器大為縮短。 ( 5)虛擬儀器開放、靈活,可與計算機同步發(fā)展,可與網(wǎng)絡(luò)及其它周邊設(shè)備互聯(lián)。 決定虛擬儀器具備傳統(tǒng) 儀器不可能具備的上述特點的根本原因在于:“虛擬儀器的關(guān)鍵是軟件”。 LABVIEW( Laboratory Virtual Instrument Engineering Workbench,實驗室虛擬儀器工程平臺)是美國 NI 公司 (National Instrument Company)推出的一種基于 G語言( Graphics Language,圖形化編程語言)的虛擬儀器軟件開發(fā)工具。虛擬儀器的構(gòu)成,如圖 所示: 顯 示 器信 號 分 析 及 處 理數(shù) 據(jù) 發(fā) 生 器A / D 轉(zhuǎn) 換 器D / A 轉(zhuǎn) 換 器信 號 調(diào) 理 器 信 號 調(diào) 理 器信 號 調(diào) 理 器各 類 接 口人 機 接 口信 號 輸 入信 號 輸 出 圖 虛擬儀器的構(gòu)成 LABVIEW 軟件工具的特點可歸納為: ( 1) 圖形化的編程方式,無須寫任何文本格式的代碼,是真正的工程師語言。 ( 2) 提供了豐富的數(shù)據(jù)采集、分析及存儲的庫函數(shù)。 ( 3) 既提供了傳統(tǒng)的程序調(diào)試手段,如設(shè)置斷點、單步運行,同時又提供了獨到的高亮執(zhí)行工具,使程序動畫式運行,利于設(shè)計者觀察程序運行的細節(jié),使程序的調(diào)試和開發(fā)更為便捷。 ( 4) 32bit 的編譯器編譯生成 32bit 的編譯程序,保證數(shù)據(jù)采集、測試和測量方案的高速執(zhí)行。 ( 5) 囊括了 DAQ、 GPIB、 PXI、 VXI在內(nèi)的各種儀器通信總線標(biāo)準(zhǔn)的所有功能函數(shù),使得 不懂總線標(biāo)準(zhǔn)的開發(fā)者也能夠驅(qū)動不同總線標(biāo)準(zhǔn)接口設(shè)備與儀器。 ( 6) 提供大量與外部代碼或軟件進行連接的機制,諸如 DLLs(動態(tài)連接庫)、 DDE(共享庫)、 ActiveX 等。 用 LABVIEW 設(shè)計的虛擬儀器控制系統(tǒng)主要包括三個部分: ( 1) 儀器前面板的設(shè)計 儀器前面板的設(shè)計是指在虛擬儀器的開發(fā)平臺上,利用各類子模板圖標(biāo)創(chuàng)建用戶界面,即虛擬儀器的前面板。 ( 2) 儀器流程和算法的設(shè)計 儀器流程和算法的設(shè)計是根據(jù)儀器功能的要求,利用虛擬儀器開發(fā)平臺所提供的子模板,確定程序的流程圖、所實現(xiàn)的技術(shù)方法和主要的處理算法。 ( 3) I/O 接口儀器驅(qū)動程序的設(shè)計 I/O 接口儀器驅(qū)動程序是控制硬件設(shè)備的驅(qū)動程序,也是連接主控計算機與儀器設(shè)備的紐帶。 用 LABVIEW 設(shè)計的虛擬儀器系統(tǒng)可脫離 LABVIEW 開發(fā)環(huán)境,最終用戶看見的是和實際的硬件儀器相似的操作面板。 MATLAB 語言 MATLAB 語言 [1]是在 20 世紀(jì) 80 年代初期,由美國的 Math Works 軟件開發(fā)公司推出的一種信號圖像處理的數(shù)學(xué)工具軟件。它擁有功能全面的函數(shù)庫,為了讓用戶脫離了復(fù)雜繁瑣的程序計算過程,把大量的函數(shù)封裝起來,大大提高了工作效率。利用 MATLAB可以實現(xiàn)符號運算、科學(xué)計算、算法研究、數(shù)據(jù)分析和可視化、數(shù)學(xué)建模和仿真、圖形用戶界面設(shè)計以及科學(xué)工程繪圖等強大功能。同時 MATLAB 為用戶提供了豐富而實用的資源,它涵蓋了許多門類的科學(xué)研究,如控制、通信、數(shù)學(xué)、經(jīng)濟、地理、數(shù)字信號處理和數(shù)字圖像處理等。其主要特點有: ( 1) 先進的技術(shù)界面支持 MATLAB 給用戶提供的是一種最直觀、最簡潔的程序開發(fā)環(huán)境。用 MATLAB 編程時,就如同在現(xiàn)實中的便簽上列公式和求解一樣。 ( 2) 開放式的體系結(jié)構(gòu) 除了內(nèi)部函數(shù)外,所有的 MATLAB 主包文件和各工具 包文件都是對用戶開放的源程序文件,用戶可以通過修改源程序文件來構(gòu)成新的適合自己使用的專用工具包。 ( 3) 簡單易學(xué) 與 FORTRAN 和 C 語言等高級語言相比較, MATLAB 語法規(guī)則簡單,語言的思維特點更符合人們在實際應(yīng)用中的習(xí)慣。 ( 4) 豐富的函數(shù)工具箱 提供專門的對語音信號進行處理的工具箱。 對于比較簡單的和“一次性”的問題,通過在直欞窗中直接輸入一組指令求解是比較簡便、快捷的。但是當(dāng)待解決問題所需的指令較多而且所用指令結(jié)構(gòu)較復(fù)雜時,或者當(dāng)一組指令通過改變少量參數(shù)就可以被反復(fù)使用去解決不同問題 時,直接在直欞窗中輸入指令的方法就顯得累贅、繁瑣和笨拙。設(shè)計 M腳本文件就是用來解決這個矛盾的。 M腳本文件是指: ( 1) 對于解決同一個問題,在文件中的指令形式和前后位置與在指令窗中輸入的那組指令毫無任何區(qū)別。 ( 2) MATLAB 在運行這個腳本時,簡單地從文件中讀取那一條條指令,然后送到MATLAB 中去運行。 ( 3) 與在指令窗中直接運行質(zhì)量一樣,腳本文件運行時產(chǎn)生的變量都駐留在 MATLAB基本工作空間中。 ( 4) 文件的擴展名是“ .m”。其具體步驟如下: 1)
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1