正文內(nèi)容

多媒體技術(shù)講稿第5章-jian-資料下載頁

2025-08-04 10:47本頁面

　　

【正文】術(shù)經(jīng)歷的從孤立詞、小詞匯量、特定人到大詞匯量、非特定人、自然口語識別的發(fā)展歷程。語音識別技術(shù) ? 不同的語音識別系統(tǒng)，雖然具體實現(xiàn)細節(jié)有所不同，但所采用的基本技術(shù)相似，它所涉及的領(lǐng)域包括：信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。 ? 語音識別技術(shù)主要包括特征提取技術(shù) 、模式匹配準則及模型訓練技術(shù)三個方面。此外，還涉及到語音識別單元的選取。典型語音識別系統(tǒng) 的實現(xiàn)過程語音識別單元的選取 ? 選擇識別單元是語音識別研究的第一步 ? 語音識別單元有單詞（句）、音節(jié) 和音素三種 ? 單詞單元廣泛應用于中小詞匯語音識別系統(tǒng) ? 音節(jié)單元多見于漢語語音識別 ? 音素單元以前多見于英語語音識別的研究中，但目前中、大詞匯量漢語語音識別系統(tǒng)也在越來越多地采用特征參數(shù)提取技術(shù) ? 語音信號中含有豐富的信息，這些信息稱為語音信號的聲學特征 ? 特征提取是對語音信號進行分析處理，去除對語音識別無關(guān)緊要的冗余信息，獲得影響語音識別的重要信息 ? 由于語音信號的時變特性，特征提取必須在一小段語音信號上進行，也即進行短時分析常用的一些聲學特征 ? 線性預測系數(shù) LPC ? 倒譜系數(shù) CEP ? Mel倒譜系數(shù) MFCC和感知線性預測 PLP 模式匹配及模型訓練技術(shù) ? 模型訓練是指按照一定的準則，從大量已知模式中獲取表征該模式本質(zhì)特征的模型參數(shù)，而模式匹配則是根據(jù)一定準則，使未知模式與模型庫中的某一個模型獲得最佳匹配。 ? 語音識別所應用的模式匹配和模型訓練技術(shù)主要有動態(tài)時間歸正技術(shù)（ DTW，又稱為動態(tài)時間彎折技術(shù)）、隱馬爾可夫模型（ HMM）和人工神經(jīng)元網(wǎng)絡（ ANN）。語音識別系統(tǒng)的類型 * 語音識別系統(tǒng)有以下幾種分類方式： ? 根據(jù)對說話人的依賴程度可以分為特定人和非特定人語音識別系統(tǒng) ? 根據(jù)對說話人說話方式的要求，可以分為孤立字（詞）語音識別系統(tǒng)，連接詞語音識別系統(tǒng)以及連續(xù)語音識別系統(tǒng) ? 根據(jù)詞匯量大小，可以分為小詞匯量、中等詞匯量、大詞匯量以及無限詞匯量語音識別系統(tǒng) 特定人語音識別系統(tǒng) ? 特定人的識別系統(tǒng)精明得足以能了解講話者的語音特點，它從語音簽名上就能知道講話者的身份。 ? 只有在講話者用特定單詞組形成的詞匯表訓練系統(tǒng)后，它才能識別 ? 特定人系統(tǒng)的優(yōu)點是它是可訓練的，系統(tǒng)很靈活，可以訓練它來識別新詞 ? 特定人的系統(tǒng)的缺點是由一個用戶訓練的系統(tǒng)不能被另一用戶使用 ? 例：手機中使用的語音撥號非特定人語音識別系統(tǒng) ? 非持定人識別系統(tǒng)可識別任何用戶的語音。它不需要任何來自用戶的訓練，因為它不依賴于個人的語音簽名。 ? 為生成非特定人識別系統(tǒng)、大量的用戶訓練了大詞匯表的識別器。 ? 在訓練系統(tǒng)時，男聲和女聲、不同的口音和方言，以及帶有背景噪音的環(huán)境都計入了考慮范圍之內(nèi)以生成參考模板。 ? 例： IBM Via Voice 孤立詞語音識別系統(tǒng) ? 孤立詞 (語音 )識別系統(tǒng)，一次只提供一個單一詞的識別 ? 識別器的第一個任務是進行幅度和噪聲歸一化，下一步是參數(shù)分析 ? 可以通過把對應于一個詞的大量樣本聚集為單一群來獲得非特定人孤立單詞語音識別器。連接詞語音識別系統(tǒng) ? 連接詞的語音由所說的短語組成，而短語又是由詞序列組成 ? 識別連接詞短語中單詞的一種方法是采用詞定位技術(shù) ? 類似于孤立詞語音識別，連接詞語音識別用于命令和控制應用連續(xù)語音識別系統(tǒng) ? 連續(xù)語音由在聽寫中形成段落的完整句子組成 ? 連續(xù)語音識別系統(tǒng)可以分成下列三部分： ? 第一部分包括數(shù)字化、幅度歸一化、時間歸一化和參數(shù)表示 ? 另一部分包括分割并把語音段標記成在基于知識或基于規(guī)則系統(tǒng)上的符號串 ? 最后一部分是設計用于識別詞序列而進行語音段匹配語音識別的應用 ? 語音郵件集成 ? 數(shù)據(jù)庫輸人和詢問應用 ? 語音命令和控制應用第四章音頻信號和聲音卡 ? √音頻編碼基礎 ? √音頻信號壓縮技術(shù) ? √音頻編碼標準 ? √聲音卡的組成和工作原理 ? √語音識別技術(shù)及應用思考題思考題 1 列出你所知道的話音編碼標準。 2 什么叫做均勻量化？什么叫做非均勻量化？ 3 什么叫做 μ律壓擴？什么叫做 A律壓擴？ 4 在增量調(diào)制中為什么會產(chǎn)生粒狀噪聲？ 5 自適應脈沖編碼調(diào)制 (APCM)的基本思想是什么？ 6 差分脈沖編碼調(diào)制 (DPCM)的基本思想是什么？ 7 自適應差分脈沖編碼調(diào)制 (ADPCM)的兩個基本思想是什么？ 8 列出并比較你所了解的聲卡的性能。 9 簡單說明聲卡的工作原理。 10 簡述語音壓縮技術(shù)的基本原理和應用領(lǐng)域。

點擊復制文檔內(nèi)容

醫(yī)療健康相關(guān)推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

多媒體技術(shù)講稿第5章-jian-資料下載頁

[精選]多媒體技術(shù)第10章多媒體光盤制作技術(shù)-資料下載頁

[精選]第5章多媒體技術(shù)及應用-資料下載頁

[精選]多媒體應用系統(tǒng)技術(shù)第5章-資料下載頁

第9章160;多媒體技術(shù)與工具-資料下載頁

第9章常用外設及多媒體技術(shù)-資料下載頁

建筑施工技術(shù)第4章多媒體-資料下載頁

多媒體通信技術(shù)第6章多媒體通信協(xié)議-資料下載頁

[精選]多媒體技術(shù)及應用基礎第1章多媒體技術(shù)概述-資料下載頁

[精選]第8章多媒體技術(shù)-資料下載頁

多媒體技術(shù)基礎第3版第5章顏色的度量體系-資料下載頁

多媒體技術(shù)基礎(第3版)第5章顏色的度量體系-資料下載頁

多媒體通信技術(shù)第7章多媒體通信服務質(zhì)量與管理)-資料下載頁

多媒體技術(shù)基礎第3版第12章mpeg視像-資料下載頁

[精選]第1章多媒體技術(shù)概述-資料下載頁

[精選]第2章多媒體音頻技術(shù)-資料下載頁

多媒體技術(shù)講稿第5章-jian(留存版)

多媒體技術(shù)講稿第5章-jian-文庫吧

多媒體技術(shù)講稿第5章-jian-wenkub

多媒體技術(shù)講稿第5章-jian(已修改)