freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于matlab的語音識別系統(tǒng)的設(shè)計本科畢業(yè)設(shè)計-文庫吧資料

2024-09-04 15:19本頁面
  

【正文】 度為 N,則短時能量可表示為: 河南理工大學(xué)畢業(yè)設(shè)計(論文)說明書 10 ? ?????? 1 2Nn nm wn mxE (24) 如圖 “ 0”時域波形圖和語音“ 0”短時能量圖。 對于信號 x(n),短時能量定義為: ? ? ? ?? ? ? ? ? ?? ? ? ? ? ?nhnxmnwmxmnwmxE n Nnmmn *1 222 ?? ??????? ????? (23) 式中, h(n)=w2(n), N為窗長, En表示在信號的第 n個點開始加窗函數(shù)時的短時能量。通常在 l0kHz 采樣頻率下, L 折衷選擇為 100~ 200 個采樣點 (即持續(xù)時間為 10~ 20ms)。通常認為在一個語音幀內(nèi),應(yīng)含 有 1~ 7 個基音周期。通幫采用最多的窗函數(shù)是矩形窗、漢寧窗(Hanning)和哈明窗 (Hamming)。這種時間以來處理的基本手段,一般是用 一個長度有限的窗序列 w(n)截取一段語音信號來進行分析,并讓這個窗滑動,以便分析任意時刻附近的信號。 在 10~ 20ms 這樣的時間段內(nèi),數(shù)字化后的語音信號的頻譜特性和某些物理特征參量可近似地看作是不變地。一般每秒的幀數(shù)為33~ 100,視實際情況而定。幀移與幀長之比一般取為 0~ 。一般來說,語音信號處理的幀長一般取 20ms(當 Fs=8kHz 時,相應(yīng)每幀由 160個信號樣值 )。在語音信號處理中,一般用循環(huán)隊列的方式來存儲這些數(shù)據(jù),以便用一個有限容量的數(shù)據(jù)區(qū)來應(yīng)付數(shù)量極大的語音數(shù)據(jù)。對于這種低通濾波器的特性和 A/D 轉(zhuǎn)換頻率,也要求與采樣時具有相同的關(guān)系。低通濾波器的截至頻率由語音信號帶寬決定,用于慮除高于 l/2 采樣頻率的信號成分 或噪聲,并且希望其帶內(nèi)波動和帶外衰減特性盡可能好。 圖 語音信號“ 0”的預(yù)加重處理效果 A/D轉(zhuǎn)換之前還需要加一個防混疊濾波器。圖 “ 0”的預(yù)加重處理結(jié)果。它一般是一階的,即:11)( ??? uzzH ,式中 u值接近于 1,本文中去為 。所以為盡量提高 SNR,應(yīng)在 A/D 轉(zhuǎn)換之前進行預(yù)加重。預(yù)加重在防混疊濾波與 A/D 轉(zhuǎn)換之前進行。 由于語音信號的平均功率譜受聲門激勵和鼻輻射的影響,在 800Hz以上的高 頻時約按6dB/oct 衰減,為此要在預(yù)處理中進行預(yù)加重。研究表明 :要使語音波形的動態(tài)變化信噪比達到 55dB的信噪比, B應(yīng)取 10位以上。當 B=7位時, SNR=35dB。此時上式變?yōu)?SNR=。信號與量化噪聲的功率之比為量化信噪比。 采樣之后要對信號進行量化,在量化過程中不可避免的會產(chǎn)生誤差。在信號的帶寬不明確時,采樣前應(yīng)接入抗混疊濾波器 (低通濾波器 ),使其帶寬限制在某個范圍內(nèi);否則,如果采樣頻率不滿足采樣定理,則會產(chǎn)生混疊。根據(jù)采樣定理,當采樣頻率大于信號的 2 倍帶寬時,在采樣過程中不會丟失信息,且從采樣信號中可以精確地重構(gòu)原始信號波形。圖 給出了經(jīng)典的語音信號的產(chǎn)生模型,語音信號被看成是線性時不變系統(tǒng)在隨機噪聲或準周期脈沖序列激勵下的輸出。做一個合理的假設(shè),當在較短的時間間隔內(nèi)表示語音信號時,則可以采用線性 時不變模型。由于在發(fā)音過程中聲道是運動的,因此可以用一個時變線性系統(tǒng)來模擬。圖 給出了單獨說一個音節(jié)時的四種聲調(diào)的典型曲線 ( HzF/0 )。一般來說,彎頭段和降尾段對聲調(diào)的聽辨不起作用,起作用的是調(diào)型段。聲調(diào)曲線從一個韻母的起始端開始,到韻母的終止端結(jié)束。 漢語普通話的聲調(diào)有陰平、陽平、上聲、去聲等四種聲調(diào) (另外,有時還包括“輕聲” ),這些基本的調(diào)型在語句中雖然受語法、語氣的影響而有所變動,但基 本上不改變原有的模式一調(diào)型。 漢語是一種聲調(diào)語言,相同聲母和韻母構(gòu)成的音節(jié)隨聲調(diào)的不同而具有完全不同的意義,對應(yīng)著不同的漢字。輔音也有清濁之分。所有元音都是濁音。當聲帶振動發(fā)出的聲音氣流從喉腔、咽腔進入口腔從唇腔出去時,這些聲腔完全開放,氣流順利通過,這種音稱為元音。清音通過將口腔內(nèi)有的空氣釋放出來而發(fā)聲,發(fā)聲時喉部封閉,由于該氣流通過一個狹窄通道時在口腔中形成流,因此具有明顯的隨機噪聲的特點。 河南理工大學(xué)畢業(yè)設(shè)計(論文)說明書 5 音素是語音信號的最基本組成單位,可分為濁音和清音兩大類。 (8)微電子技術(shù):超大規(guī)模集成電路 (VLSI)技術(shù)的發(fā)展對語音識別的具體應(yīng)用有很大的影響, VLSI使語音識別系統(tǒng)商品化成為可能。 (5)語言學(xué):有關(guān)人的語言產(chǎn)生、感覺方面的知識。 (3)統(tǒng)計學(xué)和模式識別理論;基于各種統(tǒng)計方法對模式進行匹配,以及建立有關(guān)的統(tǒng)計模型,對語音特征參數(shù)進行估值和分類。 (1)物理學(xué) (聲學(xué) ):聲音產(chǎn)生與傳播原理、聲電轉(zhuǎn)換以及聲音在房間回響等相關(guān)知識。摩爾定律所預(yù)言的硬件產(chǎn)品奇跡般的更新速度使計算機處理復(fù)雜運算的能力突飛猛進,也使體積龐大的語音庫有機會棲身于普通用戶的硬盤或其他存儲介質(zhì)上;技術(shù)方面,新的語音統(tǒng)計算法日趨成熟:市場需求方面,簡化 PDA、移動電話和其他信息家電原本繁瑣的操作步驟的最佳途徑便是通過語音技術(shù)。語音識別技術(shù)的成熟使人機界面發(fā)生革命性突破,網(wǎng)絡(luò)時代用戶需要更自然、更簡單、更方便的以語音為中心點的人機界面。目前這種采用聲覺、視覺兩種信息融合進行識別的研究在全球范圍內(nèi)己經(jīng)展開,成為語音識別研究的重要發(fā)展方向和研究熱點之一。自然語音數(shù)據(jù)庫的設(shè)計:語音特征的提取;利用語音料庫進行聲學(xué)模型訓(xùn)練的研究;適應(yīng)說話人聲學(xué)模型的研究;語音識別算法的研究:語言翻譯和對話處理的研究等成為語音技術(shù)的熱點方向。從某種意義上說,語音識別是將計算機變成真正的“智能化”設(shè)備的最佳途徑。它為用戶提供了一種像“人人對話”的自然語音交互界面,這種更加友善的界面允許一般對話時的一些行為,如停頓及不完全的語句等。Nuance的最新版識別軟件所提供的“隨意說 (Say anything)”技術(shù),使用戶可以以自然的河南理工大學(xué)畢業(yè)設(shè)計(論文)說明書 4 語言說出自己的需求。而一旦用戶以跟人交談的方式來進行語音輸入時,口語的語法不規(guī)范和語序不正常的特點會給語義的分析和理解帶來困難。它既涉及到自然語言理解,又與聲學(xué)有關(guān)。 第三個就是“口語”的問題。這將會使識別系統(tǒng)具有很強的適應(yīng)性。實際應(yīng)用中,噪音是無法避免的。人多的公共場所巨大的噪音對語音識別的影響自不用說,早期即使在實驗室環(huán)境下,敲擊鍵盤、挪動麥克風(fēng)都會成為背景噪音。而針對嚴重的口音問題,它的聲學(xué)模型適應(yīng)機制提供了很好的解決方案,可以使 系統(tǒng)的識別率有很大改善。此外,該公司的系統(tǒng)優(yōu)化工具為所有系統(tǒng)提供一個實用、有效的優(yōu)化方法。對某一種口音,語言的聲學(xué)模型的適應(yīng)性決定了基礎(chǔ)識別率,而在此基礎(chǔ)上的優(yōu)化和模型適應(yīng)方案則提供了很好的解決方案。也就是說是有別于普通話 的不同的語言,應(yīng)該用不同的聲學(xué)模型來描述。首先要明確的是,口音是指同一種語言在不同地區(qū)的發(fā)音有所不同,與同一地區(qū) (例如中國 )的不同方言是有區(qū)別的。目前,技術(shù)及應(yīng)用的焦點主要集中在三個方面。 語音識別技術(shù)難點 雖然語音識別已突破了最初對技術(shù)的檢驗階段,而進入通過對話及系統(tǒng)形象的設(shè)計,建立用戶喜愛的應(yīng)用系統(tǒng)時期。在識別階段,語音喜好經(jīng)過相同的通道得到語音參數(shù),生成測試模版,與參考模版進行匹配,將匹配分數(shù)最高的參考模版作為識別結(jié)果。 3,特征參數(shù)要計算方便,最好有高效的計算方法,以保證語音識別的實時實現(xiàn)。對特征參數(shù)的要求是: 1,提取的特征參數(shù)能有效地代表語音特征,具有很好的區(qū)分性。 河南理工大學(xué)畢業(yè)設(shè)計(論文)說明書 3 語音識別系統(tǒng)的基本構(gòu)成 語音識別系統(tǒng)的典型實現(xiàn)方案為:輸入的模擬語音信號 首先要進行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、端點檢測、預(yù)加重等。 非特定人大詞表連續(xù)語音識別是近幾年研究的重點,也是研究的難點。特定人是指只針對一個用戶的語音識別,非特定人則可用于不同的用戶。顯然,連續(xù)非特定人語音識別的難度要大得多,因為不僅有說話人口音的問題,還有協(xié)同發(fā)音、斷字斷句、搜索等問題,除了考慮語音的聲學(xué)模型外還要涉及到語言模型,如構(gòu)詞法、文法等。連接詞語音識別支持一個小的語法網(wǎng)絡(luò) ,其內(nèi)部形成一個狀態(tài)機,可以實現(xiàn)簡單的家用電器的控制,而復(fù)雜的連接詞語音識別系統(tǒng)可以用于電話語音查詢、航空定票等系統(tǒng)。 語音識別按說話人的講話方式可分為孤立詞 (Isolated Word)識別、連接詞 (Connected Word)識別和連續(xù)語音 (Continuous Speech)識別。在不遠的將來,語音識別技術(shù)有可能作為一種重要的人機交互手段,輔助甚至取代傳統(tǒng)的鍵盤、鼠標等輸入設(shè)備,在個人計算機上進行文字錄入 和操作控制。研究的方向也越來越側(cè)重于口語對話系統(tǒng)。在聲學(xué)識別層次,以多個說話人發(fā)音的大規(guī)模語音數(shù)據(jù)為基礎(chǔ),以馬爾可夫鏈為基礎(chǔ)的語音序列建模方法 HMM(隱含馬爾可夫模型 )比較有效的解決了語音信號短時穩(wěn)定、長時時變 的特性,并且能根據(jù)一些基本建模單元構(gòu)造成連續(xù)語音的句子模型,達到了比較高的建模精度和建模靈活性。諸如此類的新問題使連續(xù)語音識別率的提高比非連續(xù)語音更加困難。目前我國大詞匯量連續(xù)語音識別系統(tǒng)的研究已經(jīng)接河南理工大學(xué)畢業(yè)設(shè)計(論文)說明書 2 近國外最高水平。每兩年滾動一次,從 1991年開始,專家組每一至二年舉行一次全國性的語音識別系統(tǒng)測試。 我國語音識別研究工作近年來發(fā)展很快,同時也從實驗室逐步走向?qū)嵱?。臺灣的一些大學(xué)和研究所也開發(fā)出大詞匯量非特定人連續(xù)語音識別演示系統(tǒng)。H等公司相繼投入到漢語語音識別系統(tǒng)的開發(fā)中,其投資也逐年增加。由于中國的國際地位不斷提高,以及在經(jīng)濟和市場方面所處的重要地位,漢語語音識別也越來越受到重視。 語音識別研究現(xiàn)狀 20世紀 90年代后,在細化模型的設(shè)計、參數(shù)提取和優(yōu)化,以及系統(tǒng)的自適應(yīng)技術(shù)上取得了一些關(guān)鍵進展。 80年代,語音識別研究的重點之一是連接詞語音識別,開發(fā)了各種連接詞語音識別和關(guān)鍵詞識別算法,如多級動態(tài)規(guī)劃語音識別算法。 60年代末和 70年代初語音識別最重要的發(fā)展是語音信號線性預(yù)測編碼 (LPC)技術(shù)和動態(tài)時間規(guī) 整 (DTW)技術(shù),有效地解決了語音的特征提取和時間不等長匹配問題,對特定人的語音識別十分有效。 Bell實驗室的 L. G. Kesta目視觀察語譜圖進行識別,提出了“聲紋 (Voiceprint)”的概念。 語音識別中的說話人辨認的研究始于 20世紀 30年代。因此語音識別技術(shù)既是國際競爭的一項重要技術(shù),也是每一個國家 經(jīng)濟發(fā)展不可缺少的重要技術(shù)支撐。the same time,the use of Matlab graphical user interface development environment designed speech recognition system interface,is designed to be simple,easy to use,friendly interface. Besides,to have a simple exploration of the voice recognition is another statistics,recognition result obviously is made out as the expected goal. Key words: Speech recognition algorithm; HMM model; Matlab; GUI 河南理工大學(xué)畢業(yè)設(shè)計(論文)說明書 III 目錄 一、前言 ................................................................................................................ 1 .................................................................................. 1 ...................................................................................... 1 .................................................................................. 2 ........................................................................... 3 ...................................................................................... 3 ...................................................................................... 4 二、語音信號分析 ................................................................................................... 4 ................................................................................................ 4 .......................................
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1