正文內(nèi)容

[工學]數(shù)字語音處理1-2章-wenkub

2022-12-22 23:35:46 本頁面

　

【正文】成分。聲道具有的一組共振峰，聲道的頻譜特性主要反映出這些共振峰的不同位置以及各個峰的頻帶寬度。濁音：聲帶繃緊，氣流通過時會使得開口變成一開一閉的周期性動作，這時候就造成周期性的激發(fā)氣流，如 a， o；清音：聲帶完全舒展，聲道某部位收縮形成一個狹窄的通道，產(chǎn)生空氣湍流，如 h， d；爆破音：聲帶完全舒展，聲道的某部位完全閉合，一旦閉合點突然開啟，空氣壓力快速釋放，如 b， p。返回 Speech Signal Processing 第二章基礎知識 1. 人類的語言器官 2. 語音產(chǎn)生過程 3. 語音信號產(chǎn)生的數(shù)字模型 4. 語音信號的特性 5. 人類的聽覺功能返回下一章 Speech Signal Processing 1. 人類的語言器官人類能以語言溝通，進而累積知識，形成文化，其中一個主要的原因，就是人類具有較其它生物優(yōu)越的發(fā)音器官。 3. 語音信號的數(shù)字表示方法 ? 波形表示 — 采樣和量化，保持波形 ? 參數(shù)表示 — 激勵源和模型參數(shù)（第二章） Speech Signal Processing 語音信號波形表示示例一些常用的語音波形分析與處理的軟件 Cooledit Goldenwave SFS Nero waveedit Praat Speech Signal Processing Cooledit Pro 界面返回 Speech Signal Processing 3. 語音信號的數(shù)字處理方法 1. 語音信號的特點 — 短時平穩(wěn)性 2. 短時時域處理方法 — 短時能量、短時平均過零率以及短時自相關(guān)函數(shù)計算 3. 短時頻域分析 — 短時傅立葉分析 4. 線性預測技術(shù) — 本質(zhì)上屬于時域分析方法，但其結(jié)果可以是頻域參數(shù) 5. 倒譜和同態(tài)分析、矢量量化和隱馬爾可夫模型 Speech Signal Processing 語音信號的特點 —短時平穩(wěn)性 Speech Signal Processing 語音信號數(shù)字處理基本過程以降低語音發(fā)音速率的處理過程為例 Speech Signal Processing 語音信號數(shù)字處理基本過程 ?連續(xù)語音波形 ? A/D 轉(zhuǎn)換 ? 離散時間信號 ? 用數(shù)字系統(tǒng)進行處理 ? 修改后的離散時間信號 ? D/A 變換 ? 模擬波形返回 Speech Signal Processing 4. 數(shù)字語音處理的應用 1. 語音壓縮和編碼 — 語音通信數(shù)字化； 2. 語音合成 — 自動報站、自動報時、自動警告、電話自動查詢和語音提示等； 3. 語音識別 — 聲控應用、自動口語翻譯； 4. 說話人識別 — 安全加密、銀行信息電話查詢服務以及破案和法庭取證； 5. 語音增強 — 通常作為語音處理的前端。文語轉(zhuǎn)換說話人識別 /確認 ?通過對語音信號進行某種運算以達到某種要求。 Speech Signal Processing ：以語音語言學和數(shù)字信號處理為基礎而形成的一門涉及面很廣的學科 ,與心理學、生理學、計算機科學、通信與信息科學、模式識別和人工智能等學科均有密切的關(guān)系。 Speech Signal Processing 各種語音產(chǎn)品返回 Speech Signal Processing 語音處理的發(fā)展歷史 ?1876年電話的發(fā)明，貝爾（ Bell）； ?1939年聲碼器的研制成功 — 聲源＋聲道； ?1947年貝爾實驗室發(fā)明語譜圖儀 — 語音識別研究的開始； ?50年代第一臺口授打字機和英語單詞語音識別器； ?60年代出現(xiàn)了第一臺以數(shù)字計算機為基礎的孤立詞語音識別器和有限連續(xù)語音識別器； Speech Signal Processing 語音處理的發(fā)展歷史 ?70年代動態(tài)規(guī)劃技術(shù)、隱馬爾可夫模型、線性預測技術(shù)和矢量量化碼書生成方法用于語音編碼和識別； ?80、 90年代語音處理技術(shù)產(chǎn)品化 — IBM Tangora5和 Tangora20英語聽寫機， Dragon Dictate 詞匯翻譯系統(tǒng) (70000)， viavoice漢語聽寫機。人類的發(fā)音器官能夠產(chǎn)生多樣性的聲音，構(gòu)成豐富的詞匯，無疑是最關(guān)鍵的因素。 Speech Signal Processing 2. 語音產(chǎn)生過程語音的兩個重要聲學特性： ?濁音的基音頻率 (F0)：由聲帶的尺寸、特性和聲帶所受張力決定，其值等于聲帶張開和閉合一次的時間的倒數(shù)。共振峰及其帶寬取決于聲道某一瞬間的形狀和尺寸，因而不同的語音對應于一組不同的共振峰參數(shù)。在語譜圖上呈現(xiàn)等距的黑白相間橫線條，其間距就是基頻 (F0) 。在發(fā)元音時，音強較大，聲帶振動而呈現(xiàn)出基頻及其諧振頻率，也可以明顯看到共振峰，能量集中在低頻。 Speech Signal Processing 元音與輔音的聲學特性 (一 ) 元音發(fā)元音的聲音時，聲帶是振動的，音強也較大，波形上可以看到大的振幅，而且呈現(xiàn)周期性。在 5 kHz的語音頻帶范圍內(nèi)，會有 5個共振峰，分別以 F1﹑F 2﹑F 3﹑F 4﹑ 與 F5代表，其中 F1﹑F 2與 F3比較明顯。發(fā)鼻音時，鼻腔的共振效果使得低頻成分受到壓抑，雖然是聲帶振動而有共振峰，但低

點擊復制文檔內(nèi)容

教學課件相關(guān)推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

[工學]數(shù)字語音處理1-2章-wenkub

財務管理學(1-2章)-資料下載頁

普通動物學第1-2章-資料下載頁

[工學]數(shù)字信號處理第四章fft-資料下載頁

數(shù)字圖像處理第1章概論-資料下載頁

數(shù)字圖像處理第3章(1)-資料下載頁

劉毅標簽設計第1-2章-資料下載頁

武科大現(xiàn)代設計方法1-2章-資料下載頁

[工學]matlab在數(shù)字圖像處理-資料下載頁

[工學]數(shù)字信號處理總復習-資料下載頁

[工學]數(shù)字信號處理chapter-資料下載頁

[工學]數(shù)字信號處理復習ppt-資料下載頁

[工學]第五章數(shù)字信號處理1ad_da_采樣定律、能量泄漏-資料下載頁

實訓1-2財會書寫——中文大寫數(shù)字書寫-資料下載頁

[工學]1-2曲線運動和相對運動-資料下載頁

[文學]第01章1-2節(jié)采用。ppt-資料下載頁

[工學]數(shù)字語音處理1-2章(專業(yè)版)

[工學]數(shù)字語音處理1-2章(留存版)

[工學]數(shù)字語音處理1-2章-文庫吧