freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

第3章聲音2數(shù)字語音的壓縮編碼-文庫吧資料

2024-10-06 16:14本頁面
  

【正文】 3) R(2) R(1) R(0) R(1) R(2) a8 R(8) R(8) R(7) R(6) R(5) R(4) R(3) R(2) R(1) R(0) R(1) a9 R(9) R(9) R(8) R(7) R(6) R(5) R(4) R(3) R(2) R(1) R(0) a10 R(10) = 其中 R(k) = ∑s(n) 聲道 聲帶 空氣 語音 2020/11/4 南京大學(xué)多媒體研究所 29 語音生成過程( 2) ? 聲道濾波器由肺部空氣經(jīng)過聲帶而激勵,根據(jù)激勵的模式,語音可分成 2類: 濁音(時間域) – 濁音 Voiced sounds (聲帶震動,產(chǎn)生準(zhǔn)周期的空氣脈沖激勵信號,送入聲道) 清音(時間域) – 清音 Unvoiced sounds(聲帶不振動,聲門始終處于“開”狀態(tài),送入聲道的空氣激勵信號是一種無周期性的噪音信號) 2020/11/4 南京大學(xué)多媒體研究所 30 語音生成的聲道濾波器模型 (1) 2020/11/4 南京大學(xué)多媒體研究所 31 語音生成的聲道濾波器模型 (2) LPC模型 = (a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, G, V/UV, T) 脈沖序列發(fā)生器 隨機噪聲發(fā)生器 基音周期 T (聲帶振動 ) (聲帶不振動 ) UV(清音 ) V(濁音 ) H(z) 聲 道 參 數(shù) a1 a2 a3 a10 ... 語音 (聲道濾波器 ) s(n) 增益 G u(n) 激勵信號 2020/11/4 南京大學(xué)多媒體研究所 32 ? 語音是一個近似的短時 (10~30ms)平穩(wěn)隨機過程, LPC模型的參數(shù) A = (a1, a2, a3, a4, a5, a6, a7, a8, a9, a10, G, V/UV, T)變化比較慢 , 大約每 20ms變化一次; ? 假設(shè)語音信號的取樣頻率為 8kHz,將每秒鐘分成 50幀,每幀 20ms(其中有 20x8=160個樣本 ) ,每一幀的所有信號近似地滿足同一模型,即每一幀語音可以使用同一組參數(shù)來表示 : ? 濁音還是清音( 1位) ? 濁音的基頻 T( 6位) ? 音源的幅度 G( 5位) ? 線性濾波器的參數(shù) ( 10個參數(shù),每個參數(shù) 6位,共 60位) 語音的參數(shù)編碼( LPC分析) —— 從已知的數(shù)字語音信號中提取參數(shù) 所以,每秒總碼率為: 50 x 72 bits = 3600 bps = 2020/11/4 南京大學(xué)多媒體研究所 33 2 如何確定 LPC的系數(shù) (1) ? 對聲音波形的編碼實際就轉(zhuǎn)化為如何提取語音生成模型的參數(shù),經(jīng)典的方法是線性預(yù)測編碼 LPC。 提取語音生成參數(shù) 語音生成模型 (編碼器) 語音參數(shù) 數(shù)字語音 使用參數(shù)合成語音 語音生成模型 (解碼器) 重建的語音 2020/11/4 南京大學(xué)多媒體研究所 28 語音生成過程 ( 1) ? 空氣由肺部呼出,經(jīng)過聲帶,送入聲道,最后從嘴唇呼出,產(chǎn)生聲音。 ? 不同子頻帶作不同的 ADPCM編碼處理,然后再復(fù)合在一起。 ? ADPCM應(yīng)用: ? 數(shù)字語音通信 ? 多媒體應(yīng)用中的語音(解說詞) 2020/11/4 南京大學(xué)多媒體研究所 23 3. Subband coding (子帶編碼 ) ? 基本原理: ? 利用帶通濾波器 (BPF)把聲音信號按頻率范圍劃分成幾個組成部分 (子頻帶,子帶 ) ? 低頻部分能量較集中,量化精度要高,取樣頻率可稍低。 ? 可以是瞬時自適應(yīng),即量化階的大小每隔幾個樣本就改變,也可以是音節(jié)自適應(yīng),即量化階的大小在較長時間周期里發(fā)生變化。 ) 實際樣本值 線性預(yù)測公式: Xn = A1*Xn1 + A2*Xn2 + ... + Am*Xnm _ 線性預(yù)測器 逆量化器 Q 1 + 預(yù)測值 差值 重建信號 DPCM 編碼輸出 ? 利用樣本與樣本之間存在的相關(guān)性進行編碼,即根據(jù)前面的樣本估算當(dāng)前樣本的大小,然后對預(yù)測誤差進行量化編碼。)(2139。 nnn ffe 39。 2. 利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階 (stepsize)去編碼小的差值,使用大的量化階去編碼大的差值, ? 效果:量化位數(shù)可以顯著減少,從而降低了總的碼率。 碼率= 104 kbps 碼率= 8位 x 8k= 64 kbps 2020/11/4 南京大學(xué)多媒體研究所 12 對數(shù)變換 F=ln(x) ? 目的 : 適應(yīng)聽覺的非線性特性;壓縮數(shù)據(jù)。第 3章 聲音 (2) — 數(shù)字語音的壓縮編碼 2020/11/4 南京大學(xué)多媒體研究所 2 內(nèi)容 一、引言 二、數(shù)字語音的波形編碼 三、數(shù)字語音的參數(shù)編碼 四、數(shù)字語音的混合編碼 一、引 言 2020/11/4 南京大學(xué)多媒體研究所 4 數(shù)字語音壓縮編碼的必要性 ? 碼率 = 取樣頻率 x 量化位數(shù) x 通道數(shù)目 例 : 電話語音 =8k x 8b x 1 = 64kbps =8kB/s=28MB/h ? 對數(shù)字語音進行數(shù)據(jù)壓縮的目的 : ? 提高通信 /存儲效率 ? 降低通信 /存儲成本 2020/11/4 南京大學(xué)多媒體研究所 5 數(shù)字語音壓縮編碼的可能性 ? 聲音信號中包含有大量的冗余信息 ? 鄰近樣本之間有很大的相關(guān)性 ? 周期之間的相關(guān)性 ? 基音之間的相關(guān)性 ? 長時 ( 幾十秒 ) 自相關(guān)性 ? 話音間歇 ( 靜音 ) ? 可以利用人的聽覺感知特性進行壓縮 , ? 可以利用語音信號的生成機理進行數(shù)據(jù)壓縮 。 2020/11/4 南京大學(xué)多媒體研究所 6 對語音數(shù)據(jù)壓縮的要求 ? 碼率低( bitrate) ? 質(zhì)量高( quality : excel
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1