freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于倒譜的大學(xué)生語音識別算法研究畢業(yè)論文-文庫吧資料

2025-07-10 23:34本頁面
  

【正文】 音模型、半音節(jié)模型或音素模型)對語音訓(xùn)練數(shù)據(jù)量大小、系統(tǒng)識別率,以及靈活性有較大的影響。 聲學(xué)模型 的目的是提供一種 有效的方法計(jì)算語音的 特征矢量 序列和每個(gè)發(fā)音模板之間的距離。在識別時(shí)將輸入的語音特征同聲學(xué)模型(模式)進(jìn)行匹配與比較,得到最佳的識別結(jié)果。 也有研究者嘗試把 小波分析 技術(shù)應(yīng)用于 特征提取 ,但目前性能難以與上述技術(shù)相比,有待進(jìn)一步研究。實(shí)驗(yàn)證明,采用這種技術(shù),語音識別系統(tǒng)的性能有 很大 提高。但線性 預(yù)測模型 是純數(shù)學(xué)模型,沒有考慮人類聽覺系統(tǒng)對語音的處理特點(diǎn)。非特定人語音識別系統(tǒng)一般側(cè)重提取反映語義的特征參數(shù),盡量去除說話人的個(gè)人信息;而特定人語音識別系統(tǒng)則希望在提取反映語義的特征參數(shù)的同時(shí),盡量也包含說話人的個(gè)人信息 [9]。在實(shí)際應(yīng)用中,語音信號的 壓縮率 介于 10100 之間。 語音識別一個(gè)根本的問題是合理的選用特征。實(shí)際應(yīng)用中常把聲母依后續(xù)韻母的不同而構(gòu)成細(xì)化聲母,這樣雖然增加了模型數(shù)目,但提高了易混淆音節(jié)的區(qū)分能力。 蘭州理工大學(xué)畢業(yè)論文 11 音素單元以前多見于英語語音識別的研究中,但目前中、大詞匯量漢語語音識別系統(tǒng)也在越來越多地采用。 音節(jié)單元多見于漢語語音識別,主要因 為漢語是單音節(jié)結(jié)構(gòu)的語言,而英語是多音節(jié),并且漢語雖然有大約 1300 個(gè)音節(jié),但若不考慮聲調(diào),約有 408 個(gè)無調(diào)音節(jié),數(shù)量相對較少。語音識別單元有單詞(句)、音節(jié)和音素三種,具體選擇哪一種,由具體的研究任務(wù)決定。 語音識別系統(tǒng)基本結(jié)構(gòu) 一個(gè)完整的基于統(tǒng)計(jì)的語音識別系統(tǒng)可大致分為三部分: (1)語音信號預(yù)處理與 特征提取 ; (2)聲學(xué)模型 與模式匹配 ; (3)語言模型與語言處理 。但由于存在訓(xùn)練、識別時(shí)間太長的缺點(diǎn),目前仍處于實(shí)驗(yàn)探 索階段。 神經(jīng)網(wǎng)絡(luò)的方法: 利用人工神經(jīng)網(wǎng)絡(luò)的方法是 80 年代末期提出的一種新的語音識別方法 。 在實(shí)際的應(yīng)用過程中,人們還研究了多種降低 復(fù)雜度 的方法,這些方法大致可以分為兩類:無記憶的 矢量量化 和有記憶的矢量量化。 矢量量化 器的設(shè)計(jì)就是從大量信號樣本中訓(xùn)練出好的碼書,從實(shí)際效果出發(fā)尋找到好的失真測度定義 公式 ,設(shè)計(jì)出最佳的矢量量化系統(tǒng),用最少的搜索和計(jì)算失真的運(yùn)算量,實(shí)現(xiàn)最大可能的平均信噪比 [9]。其 識別 過程是:將語音信號波形的 k 個(gè)樣點(diǎn)的每一幀,蘭州理工大學(xué)畢業(yè)論文 10 或有 k 個(gè)參數(shù)的每一參數(shù)幀,構(gòu)成 k維空間 中的一個(gè) 矢量 ,然后對矢量進(jìn)行量化。 矢量量化 (VQ) 矢量量化 (VectorQuantization)是一種重要的信號壓縮方法。人的言語過程實(shí)際上就是一個(gè)雙重隨機(jī)過程,語音信號本身是一個(gè)可觀測的時(shí)變序列,是由大腦根據(jù)語法知識和言語需要 (不可觀測的狀態(tài) )發(fā)出的音素的參數(shù)流。 HMM 是對語音信號的時(shí)間序列結(jié)構(gòu)建立 統(tǒng)計(jì)模型 ,將之看作一個(gè)數(shù)學(xué)上的雙重隨機(jī)過程:一個(gè)是用具有有限狀態(tài)數(shù)的Markov 鏈來模擬語音信號統(tǒng)計(jì)特性變化的隱含的隨機(jī)過程,另一個(gè)是與 Markov 鏈的每一個(gè)狀態(tài)相關(guān)聯(lián)的觀測序列的隨機(jī)過程。 隱馬爾可夫法 (HMM) 隱馬爾可夫法 (HMM)是 70 年代引入語音識別理論的,它的出現(xiàn)使得自然語音識別系統(tǒng)取得了實(shí)質(zhì)性的突破。 算法的思想就是把未知量均勻的升長或縮短 ,直到與參考模式的長度一致。但效果往往不明顯。所謂 端點(diǎn) 檢測就是在語音信號中的各種段落 (如音素、音節(jié)、詞素 )的始點(diǎn)和終點(diǎn)的位置,從語音信號中排除無聲段。常用的技術(shù)有三種:隱 馬爾可夫 ( HMM)理論、動(dòng)態(tài)時(shí)間規(guī)整 (DTW)、 矢量量化 ( VQ)技術(shù)。 模板匹配的方法: 模板匹配的方法發(fā)展比較成熟,目前已達(dá)到了實(shí)用階段。然后根據(jù)相應(yīng)聲學(xué)特性對每個(gè)分段給出相近的語音標(biāo)號 。 通常認(rèn)為常用語言中有有限個(gè)不同的語音 基 元,而且可以通過其語音信號的頻域或時(shí)域特性來區(qū)分。 語音識別基本方法 一般來說 ,語音識別的方法有三種:基于聲道模型和語音知識的方法、模板匹配的方法以及利用人工神經(jīng)網(wǎng)絡(luò) [7]的方法 。目前是中等詞匯量的識別系統(tǒng)到將來可能就是小詞匯量的語音識別系統(tǒng)。 (3)大詞匯量語音識別系統(tǒng) : 通常 包括幾千到幾萬個(gè)詞的語音識別系統(tǒng)。 從識別系統(tǒng)的詞匯量大小考慮 : 也可以將識別系統(tǒng)分為 3類: (1)小詞匯量語音識別系統(tǒng) : 通常包括幾十個(gè)詞的語音識別系統(tǒng)。 從說話者與識別系統(tǒng)的相關(guān)性考慮 : 可以將識別系統(tǒng)分為 3 類: (1)特定人語音識別系統(tǒng):僅考慮對于專人的話音進(jìn)行識別;(2)非特定人語音系統(tǒng):識別的語音與人無關(guān),通常要用大量不同人的語音數(shù)據(jù)庫對識別系統(tǒng)進(jìn)行 擴(kuò)充 ; (3)多人的識別系統(tǒng):通常能識別一組人的語音,或者 是 特定組語音識別系統(tǒng),該系統(tǒng)僅要求對要識別的那組人的語音進(jìn)行 訓(xùn)練。使讀者對相關(guān)技術(shù)的基本理論,方法和基本應(yīng)用有一個(gè)系統(tǒng)的了解。 倒譜域是將對數(shù)功率譜進(jìn)行逆傅立葉變換后得到的,它可以進(jìn)一步 將聲道特性和激勵(lì)特蘭州理工大學(xué)畢業(yè)論文 8 性有效地分開,因此可以更好地揭示語音信號的本質(zhì)特 性。另外,語音信號的頻譜具有非常明顯的聲學(xué)特性,利用頻域分析獲得的語音特征具有實(shí)際的物理意義。但更為有效的分析是圍繞頻域進(jìn)行的,因?yàn)檎Z音中最重要的感知特性反映在其功率譜中,而相位變化只起著很小的作用 [5]。進(jìn)行語音信號分析時(shí),最先接觸到的,也是最直觀的是它的時(shí)域波形。對于語音信號而言,倒譜可以將頻譜上的高低頻成分分離,所以只需取前面幾項(xiàng)參數(shù),就能代表語音信號的特性,從而提高識別率。 語音識別的技術(shù)原理是找出特征參數(shù)。在語音信號的各種分析合成系統(tǒng)中,需要提取頻譜包絡(luò)參數(shù),推測音源參數(shù)(清濁音的判定以及濁音周期等)。語音的壓縮和恢復(fù)是語音信號處理的關(guān)鍵技術(shù)。語音識別聽寫機(jī)在一些領(lǐng)域的應(yīng)用被 美國 新聞界評為 1997年計(jì)算機(jī)發(fā)展十件大事之一。語音識別是一門交叉學(xué)科 , 近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場。 與機(jī)器進(jìn)行語音交流,讓機(jī)器明 白你說什么,這是人們長期以來夢寐以求的事情。 語音識別是一門交叉學(xué)科,語音識別正逐步成為 信息技術(shù) 中人機(jī)接口的關(guān)鍵技術(shù),語音識別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤,通過語音命令進(jìn)行操作。而 聲學(xué)模型 本身定義了一些更具推廣性的聲學(xué)建反混疊濾波 A/D 轉(zhuǎn)換 平滑濾波 D/A 轉(zhuǎn)換 分析處理 傳輸或存儲 合成處理 語音輸入 語音輸出 蘭州理工大學(xué)畢業(yè)論文 7 模單元,并且提供了在給定輸入特征下,估計(jì) P 的方法。首先,統(tǒng)計(jì)語音識別的最基本問題是,給定輸入信號或特征序列,符號集(詞典),求解符號串使得: )0/(m a xa rg WPW ? ( 22) 通過貝葉斯公式,上式可寫為: )()/0(m a xa r g WPWPW ? ( 23) 由于對于確定的輸入串 P(O)[4]是確定的,因此省略它并不會影響上式的最終結(jié)果,因此,一般來說語音識別所討論的問題可以用 上 面的公式來表示,可以將它稱為語音識別的基本 公式。解碼器 : 解碼器 是語音識別系統(tǒng)的核心之一,其任務(wù)是對輸入的信號,根據(jù) 聲學(xué) 、語言模型及詞典,尋找能夠以最大概率輸出該信號的詞串。語言模型 : 語言模型對系統(tǒng)所針對的語言進(jìn)行建模。 發(fā)音詞典 : 發(fā)音詞典包含系統(tǒng)所能處理的詞匯集及其發(fā)音。同時(shí),它一般包括了一些信號處理技術(shù),以盡可能 的 降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。典型的基于 統(tǒng)計(jì)模式識別 方法的語音識別系統(tǒng)由以下幾個(gè)基本 模塊 所構(gòu)成 : 信號處理及 特征提取 模塊。圖 21 蘭州理工大學(xué)畢業(yè)論文 6 是語音信號數(shù)字分析或處理的系統(tǒng)框圖。預(yù)處理一般包括預(yù)處理、加窗和分幀等。 3)對音頻信號進(jìn)行重疊分幀:為避免信號間斷一般取 256 點(diǎn)為一幀 ,幀間重疊為 128 點(diǎn)。 1)歸一化處理:歸一化處理的目的是消除不同樣本聲音大小的差異,將樣本幅度值限定在 [1,+1]。降噪后,通過對語音信號的短時(shí)能量和短時(shí)過零率檢測可以剔除掉靜默幀、白噪聲幀和清音幀,最后保留對求取基音、 LPCC、 MFCC 等特征參數(shù)非常有用的語音信號。標(biāo)準(zhǔn)的 MFCC 和 LPCC 參數(shù)只反映了語音的靜態(tài)特性 ,而它們的差分倒譜參數(shù)可以反映語音的 動(dòng)態(tài)變化。 LPCC 參數(shù)是根據(jù)聲管模型建立的特征參數(shù) ,主要反映聲道響應(yīng)。一個(gè)完整的語音識別系統(tǒng)主要由兩部分組成 :語音特征提取、聲學(xué)模型和模式匹配 (即識別算法 )。與說話人識別 和 說話人確認(rèn)不同,后者 嘗試識別或確認(rèn)發(fā)出語音的說話人而非其中所包含的詞匯內(nèi)容。接著介紹倒譜在同態(tài)信號處理系統(tǒng)中的作用及同態(tài)信號處理系統(tǒng)的工作原理,然后是語音信號的主要應(yīng)用,也是語音倒譜分析的重點(diǎn)內(nèi)容,包括基音檢測和共振峰檢測兩個(gè)方面,作為語音信號的重要參數(shù),分別進(jìn)行了詳細(xì)的設(shè)計(jì),同時(shí)為了清晰的描述程序的編寫過程,對設(shè)計(jì)思路方法都進(jìn)行了完備的闡述,并依據(jù)設(shè)計(jì)的算法畫出了邏輯流程圖,從而在 MATLAB 中完成程序 的編寫,最后通過對仿真結(jié)果進(jìn)行了理論的分析,得出了語音的參數(shù)量值,完成了對語音信號倒譜分析的內(nèi)容。 最后第 五章具體研究了倒譜在語音信號處理中的實(shí)現(xiàn)方法,主要是語音信號識別的參數(shù)提取。然后利用到譜進(jìn)行了 MFCC 參數(shù)的提取。 第三章詳細(xì)敘述了倒譜的定義基本原理以及計(jì)算方法,優(yōu)點(diǎn)和缺點(diǎn)。 第二章介紹了 語音識別技術(shù)基本理論。 中科院自動(dòng)化所及其所屬模式科技公司 20xx 年發(fā)布了他們共同推出的面向不同計(jì)算平臺和應(yīng)用的“天語”中文語音系列產(chǎn)品 —— PattekASR,結(jié)束了中文語音識別產(chǎn)品自 1998 年以來一直由國外公司壟斷的歷史。在有 5%拒識率情況下, 系統(tǒng)識別率可以達(dá)到 %(不定長數(shù)字串)和 %(定長數(shù)字串),這是目前國際最好的識別結(jié)果之一,其性能已經(jīng)達(dá)到實(shí)用水平。中科院自動(dòng)化所、聲學(xué)所、北京大學(xué)、清華大學(xué)、哈爾濱工業(yè)大學(xué)、中國科技大學(xué)、上海交通大學(xué)、北京郵電大學(xué)、華中科技大學(xué)等科研機(jī)構(gòu)都有實(shí)驗(yàn)室進(jìn)行過語音識別方面的研究,其中具有代表性的研究單位為清華大學(xué)電子工程系和中科院自動(dòng)化研究所的模式識別國家重點(diǎn)實(shí)驗(yàn)室。從 1987 年開始執(zhí)行國家 863 計(jì)劃后,國家計(jì)算機(jī)專家組為語音識別技術(shù)研究專門立項(xiàng),每兩年滾動(dòng)一次。 我國語音識別研究工作起步于五十年代初,但近年來發(fā)展很快。它帶有一個(gè) 320xx 詞的基本詞匯表,可以擴(kuò)展到 65000 詞,還包括辦公常用詞條,具有“糾錯(cuò)機(jī)制”,其平均識別率可以達(dá)到 95%。比較有代表性的系統(tǒng)如下:IBM 公司推出的 ViaVoice 和 DragonSystem 公司的 NaturallySpeaking, Nuance 公司的NuanceVoicePlatform語音平臺, Microsoft 的 Whisper, Sun 的 VoiceTone 等。T 都對語音識別系統(tǒng)的實(shí)用化研究投以巨資。因此原有的模板匹配方法已不再適用。這一時(shí)期的語音識別主要基于模板匹配原理,研究的領(lǐng)域局限在特定人,小詞匯表的孤立詞識別,實(shí)現(xiàn)了基于線性預(yù)測倒譜和 DTW 技術(shù)的特定人孤立詞語音識別系統(tǒng);同時(shí)提出了矢量量化 ( VQ) 和隱馬爾可夫模型( HMM) 理論。 但真正取得實(shí)質(zhì) 性進(jìn)展,并將其作為一個(gè)重要的課題開展研究則是在 60 年代末 70 年代初。 語音識別的研究工作可以追溯到 20 世紀(jì) 50 年代 ATamp。它的發(fā)展很快,在通信、自動(dòng)控制等領(lǐng)域,解決了很多用傳統(tǒng)方法難以解決的問題。例如頻譜分析可以用傅里葉變換或快速傅里葉變換 ( FFT)實(shí)現(xiàn),數(shù)字濾波器可以用差分方程實(shí)現(xiàn)。第二次飛躍應(yīng)該是 20 世紀(jì) 70 年代初 ,由于電子計(jì)算機(jī)和數(shù)字信號處理的發(fā)展,人們發(fā)現(xiàn):聲音信號特別是語音信號,可以通過模數(shù)轉(zhuǎn)換器 (A /D)采樣和量化,它們轉(zhuǎn)換 為數(shù)字信號后,能夠送進(jìn)計(jì)算機(jī)。 因?yàn)橛辛穗娮庸芊糯笃?,很微弱的聲音也可以放大,而且可以定量測量。語言聲學(xué)蘭州理工大學(xué)畢業(yè)論文 2 的發(fā)展和電子學(xué)以及計(jì)算機(jī)科學(xué)有著非常密切的關(guān)系。它主要的研究方向是人的發(fā)聲器官機(jī)理,發(fā)聲器官的類比線路和數(shù)學(xué)模型,聽覺器官的特性 (如聽閾、掩蔽、臨界帶寬、聽力損失等 ) ,聽覺器官的數(shù)學(xué)模型,語音信號的物理特性 (如頻譜特性、聲調(diào)特性、相關(guān)特性、概率分布等 ) ,語音的清晰度和可懂度等。 倒譜系數(shù)是 一種非常有效表征語音特征的參數(shù)矢量 , 倒譜具有解卷的特性 , 它能將語音信號的聲門激勵(lì)信息和聲道響應(yīng)信息分離開,因此倒譜是說話人識別和語音識別中最常用的特征參數(shù)之一。 語音識別的關(guān)鍵是提取出語音特征,而語音特征有很多,倒譜系數(shù)分析是其中一種。 語音識別技術(shù),也稱為自動(dòng)語音識別,其是為了將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如二進(jìn)制編碼、按鍵或者字符序列。利用計(jì)算機(jī)來幫助外語教學(xué)是幫助提高外語水平的重要方 法 之 一 。例如 ,課堂教學(xué)通常受時(shí)間、地點(diǎn)以及教師教學(xué)水平的限制 。 隨著我國改革開放和對外合作的不斷深化 ,商務(wù)往來、文化交流、跨國旅游等活動(dòng)日益頻繁 ,越來越多的人需要學(xué)習(xí)一門外語。人類開始進(jìn)入信息化時(shí)代 ,用現(xiàn)代手段研究語音處理技術(shù) ,使人們能更加有效地產(chǎn)生、傳輸、存儲和獲取語言信息 ,這對于促進(jìn)社會的發(fā)展具有十分重要的意義。 附錄 .......................................................................... 32 I 相關(guān)程序 .......
點(diǎn)擊復(fù)制文檔內(nèi)容
研究報(bào)告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1