正文內(nèi)容

音頻技術(shù)ppt課件-展示頁

2025-01-27 16:40本頁面

　　

【正文】關(guān)，又與發(fā)聲器官的發(fā)聲范圍有關(guān)，因此，對于語音的本質(zhì)分析相當(dāng)重要。例如，采用 16位采樣精度時，數(shù)字化后需要的存貯容量為： 16/8 2 60= 采樣頻率 kHz 采樣精度 bit 存儲容量 MB 數(shù)據(jù)速率kb/s 常用編碼方式質(zhì)量 16 PCM 激光唱片級質(zhì)量 16 ADPCM 調(diào)頻廣播級質(zhì)量常用于伴音 8 ADPCM 16 ADPCM 調(diào)頻廣播級質(zhì)量常用于伴音或解說 8 ADPCM 表52 幾種數(shù)字化聲音的信息為了減少數(shù)據(jù)量，采樣且量化后的數(shù)據(jù)常要進行壓縮。而能夠進一步進行處理的首要問題，那就是大量采樣數(shù)據(jù)文件的存儲。由于立體聲聲音具有多聲道、多方向的特征，因此，聲音的播放在時間和空間性能方面都能顯示更好的效果，但相應(yīng)數(shù)據(jù)量將成倍增加。聲音的采樣數(shù)據(jù)還與聲道數(shù)有關(guān)。流行的采樣頻率主要為、、 48KHz 采樣速率越高，采樣周期越短，單位時間內(nèi)得到的數(shù)據(jù)越多，對聲音的表示越精確，音質(zhì)越真實。對于以 11kHz的頻率的采樣系統(tǒng)，只能恢復(fù)的最高音頻是。采樣速率，即采樣頻率，指每秒鐘采樣的次數(shù)，單位為 Hz（赫茲）。 8位的數(shù)字系統(tǒng)其信噪比只有 48分貝， 16位的數(shù)字系統(tǒng)的信噪比可達 96分貝，信噪比低會出現(xiàn)背景噪聲以及失真。國際標(biāo)準(zhǔn)的語音采用 8位二進制位編碼。但是位數(shù)越多，聲音質(zhì)量越高，所占的空間就越大。換句話說，采樣位數(shù)可表示采樣點的等級數(shù)，若用 8bit二進制描述采樣點的幅值，則可以將幅值等量分割為 256個區(qū)，若用 16bit二進制分割，則分為 65536個區(qū)。 3. 編碼數(shù)字聲音質(zhì)量的主要因素影響數(shù)字化聲音質(zhì)量的因素主要有三個，即采樣頻率，采樣精度和通道個數(shù) 。編碼的形式比較多，常用的編碼方式是 PCM—— 脈沖調(diào)制。所謂編碼，就是按照一定的格式把經(jīng)過采樣和量化得到的離散數(shù)據(jù)記錄下來，并在有用的數(shù)據(jù)中加入一些用于糾錯、同步和控制的數(shù)據(jù) 。模擬信號量經(jīng)過采樣和量化以后，形成一系列的離散信號 ——脈沖數(shù)字信號。在下圖（右）中，采樣率和量化等級再提高了一倍，分別達到 4000次 /秒和 40個量化等級。同時，增加量化精度，以得到更高的量化等級，即可減少失真的程度。這意味著重構(gòu)后的信號波形有較大的失真。 D/A轉(zhuǎn)換器從上圖得到的數(shù)值中重構(gòu)原來信號時，得到下圖中藍色 (直線段 )線段所示的波形。假設(shè)采樣頻率為1000次 /秒，即每 1/1000秒 A/D轉(zhuǎn)換器采樣一次，其幅度被劃分成 0到 9共 10個量化等級，并將其采樣的幅度值取最接近 0~ 9之間的一個數(shù)來表示，如下圖所示。也就是說在一個以 8位為記錄模式的音效中，其縱軸將會被劃分為個量化等級，用以記錄其幅度大小。量化的過程是先將采樣后的信號按整個聲波的幅度劃分成有限個區(qū)段的集合，把落入某個區(qū)段內(nèi)的樣值歸為一類，并賦于相同的量化值。該值的大小影響音量的高低。 1. 采樣采樣頻率與聲音頻率之間有一定的關(guān)系，根據(jù)奈奎斯特（ Nyquist）理論，只有采樣頻率高于聲音信號最高頻率的兩倍時，才能把數(shù)字信號表示的聲音還原成為原來的聲音。該時間間隔稱為采樣周期，其倒數(shù)為采樣頻率。為實現(xiàn) A/D轉(zhuǎn)換，需要把模擬音頻信號波形進行分割，這種方法稱為采樣 (Sampling)。經(jīng)采樣和量化后聲音信號經(jīng)編碼后就成為數(shù)字音頻信號，可以將其以文件形式保存在計算機的存儲介質(zhì)中，這樣的文件一般稱為數(shù)字聲波文件。采樣和量化的過程可由 A/D轉(zhuǎn)換器實現(xiàn) 。模擬音頻的數(shù)字化過程數(shù)字化的聲音易于用計算機軟件處理，現(xiàn)在幾乎所有的專業(yè)化聲音錄制、編輯器都是數(shù)字方式。音頻系統(tǒng)是將聲波波形轉(zhuǎn)換成的連續(xù)的二進制數(shù)據(jù)來還原聲音的。實現(xiàn)這個過程的裝置就被稱為模 /數(shù)轉(zhuǎn)換器。聲音的模 /數(shù)轉(zhuǎn)換（ ADC），首先需對聲波采樣，用數(shù)字方式記錄聲音。聲音的數(shù)字原理模擬聲音的信號是個連續(xù)量，由許多具有不同振幅和頻率的正弦波組成。表 51列出的是在 20Hz～ 16kHz范圍內(nèi)，通常可分出的 24個子臨界頻帶。但在有聲音屏蔽的情況下，一個臨界頻帶之內(nèi)的聲音感知程度與表中跨越多個臨界頻帶的聲音感知程度是不相同的。因為屏蔽純音的噪音實際上是由多種純音組成的，具有無限寬的頻譜。屏蔽如果同時存在的是兩個純音實驗表明存在兩種有效的屏蔽，一種是中等強度的純音最有效的屏蔽出現(xiàn)在其頻率附近，另一種是低頻的純音可以有效地掩蔽高頻的純音。當(dāng)兩個聲音在時間和頻率上很接近的時候，屏蔽效應(yīng)就會較很強。當(dāng)強、弱聲音同時存在時，就將發(fā)生聲音屏蔽現(xiàn)象。由于對于 2KHZ以上的高頻聲音信號，人耳很難判斷其方向性，因而在數(shù)字處理時，就可以不必重復(fù)存貯立體聲廣播的高頻部分。聽覺的掩蔽效應(yīng) 是一個較為復(fù)雜的心理和生理現(xiàn)象，包括人耳的頻域掩蔽效應(yīng)和時域掩蔽效應(yīng)。 ★ 在較低的聲壓級上，等響上曲線各頻率聲音的聲壓級相差很大，較高的聲壓級上，等響曲線較為平坦，說明各頻率的聲壓級基本相同。所謂 “ 等響 ” 就是對于 1kHz以外的可聽聲，在同一級等響度曲線上有無數(shù)個等效的聲壓 —頻率值，例如， 200Hz的 30dB的聲音和 1kHz的 10dB的聲音在人耳聽起來具有相同的響度。聲壓級可聞閾的分貝值頻率Hz 就是說，小于 0dB聞閾和大于 140dB痛閾時為不可聽聲。實驗表明，聲音的可聞閾和痛感閾是隨著頻率而變化的。響度與人耳的可聞程度有關(guān)，當(dāng)超出人耳的可聽頻率范圍時，聲音的響度再大，人耳也無法察覺。等響曲線響度表示人們所感覺到的聲音能量的強弱，主要取決于聲波振幅的大小，物理上聲壓級的值一般不等于響度級的值。音強與聲波的振幅成正比，振幅越大，強度越大。各種聲源都具有自己獨特的音色，例如各種樂器的聲音、每個人的聲音、各種生物的聲音等，人們就是依據(jù)音色來辨別聲源種類的。其他頻率的聲音稱為 “ 諧音 ” ，也叫泛音。大自然中的聲音絕大部分是復(fù)音。聲音分純音和復(fù)音兩種類型。各種不同的聲源具有自己特定的音調(diào)，如果改變了某種聲源的音調(diào)，則聲音會發(fā)生質(zhì)的轉(zhuǎn)變，使人們無法辨別聲源本來的面目。當(dāng)提高磁帶錄音機的轉(zhuǎn)速時，其旋轉(zhuǎn)加快，聲音信號的頻率提高，其喇叭放出來聲音的音調(diào)提高了。 1）音調(diào)：代表了聲音的高低。聽覺心理的主觀感受主要有：響度、音高、音色、音量、密度、諧和、噪聲、掩蔽效應(yīng)、高頻定位。因聲波是在時間和幅度上都連續(xù)變化的量，我們稱之為模擬量。右圖所示的，就是一段多波形混合而成的聲音實際播放時所顯示的波形。瞬時 T 是波形的變化方向，如果是多個波形組合，起始相位可以相同或不同。我們聽到的聲音都是物體振動后會產(chǎn)生聲波不同的振動頻率將會產(chǎn)生不同的聲波。這個頻率區(qū)域稱為可聞聲段，大致可分為低頻、中頻和高頻低頻的頻率約在 250～ 500 Hz（如鼓聲）中頻的頻率約在 1000～ 2022 Hz，高頻的頻率約在 3000～ 4000 Hz（如哨子聲）。 A0是基準(zhǔn)量如果那么在特別安靜的環(huán)境中，單獨檢測：動物的呼吸聲大約 20 dB，人們正常的談話聲約 60dB，汽車的喇叭聲約100dB，飛機起飛的聲音約 120 dB 120dB以上的強度可使人產(chǎn)生痛苦的感覺。這也被稱為聲壓級。 N = 10lg(A1/A0) 分貝符號為 “ dB”。在 1kHz頻率的正弦波中，能被人耳察覺的最弱聲壓大約是 104dyn（達因） /cm2，這個最弱音已經(jīng)作為國際標(biāo)準(zhǔn)的參照聲。幅度越大，聲音越強。信號的幅度是從信號的基線到當(dāng)前波峰的距離。決定聲波的物理特性有振幅、頻率和相位。要模擬出符合現(xiàn)實世界的數(shù)字聲音，我們首先得了解聲音的基本特性 : 包括聲音的物理特性和人們在聽覺方面的心理特性 .以便創(chuàng)建出一定格式的數(shù)字聲音編碼，滿足人們對模擬聲音在采集、處理、質(zhì)量等各方面的需求。在計算機中創(chuàng)建音頻時，所能模擬的聲音還必須要符合人類的聽覺特征和聽力范圍。第 5 章音頻技術(shù) 音頻也是多媒體應(yīng)用的重要組成部分。現(xiàn)實世界的聲音來源是相當(dāng)復(fù)雜的，聲音不僅與時間和空間有關(guān)，還與強度、方向等很多因素有關(guān)。數(shù)字音頻主要分為聲波、語音和音樂三類。聲音聲音的物理特征聲音是縱波。一個聲源每秒鐘可產(chǎn)生成百上千個波，我們把每秒鐘波峰所發(fā)生的數(shù)目稱之為信號的頻率，單位用赫茲 (Hz)或千赫茲 (kHz)表示。幅度決定了信號音量的強弱程度。對音頻信號，聲音的強度用分貝 (dB)表示，分貝的幅度就是音量。描述聲音強度的量值是采用分貝表示 : 分貝是指兩個相同的物理量（例 A1和 A0）之比，取以 10為底的對數(shù)并乘以 10（或 20）。 N是被量度量的“ 級 ” 。 A1是被量度量。一般人的聽力范圍是 20Hz～ 20kHz。是指物體每秒鐘振動的次數(shù)。低于 20Hz和高于 20kHz的頻率段分別稱為次聲和超聲。在某一個瞬時 T，不同波形的相位都可以是不同的。規(guī)則音頻是一種連續(xù)變化的模擬信號 ,可用一條連續(xù)的曲線來表示，稱為聲波。聲音的聽覺心理特性對于復(fù)雜的人耳聽覺系統(tǒng)特性的研究，目前僅限于在心理聲學(xué)和語言聲學(xué)內(nèi)。響度、音度、音色：可以在主觀上用來描述任何復(fù)雜的聲音而對于多種音源場合：人的耳掩蔽效應(yīng)等特性尤為重要。音調(diào)與頻率有關(guān) ，頻率越高，音調(diào)越高，反之亦然。同樣，在使用音頻處理軟件對聲音的頻率進行調(diào)整時，也可明顯感到音調(diào)隨之而產(chǎn)生的變化。 2）音色：即特色的聲音。所謂純音，是指振幅和周期均為常數(shù)的聲音；復(fù)音則是具有不同頻率和不同振幅的混合聲音。在復(fù)音中，最低頻率的聲音是 “ 基音 ” ，它是聲音的基調(diào) ?；艉椭C音是構(gòu)成聲音音色的重要因素。 3）音強：聲音的強度，也被稱為聲音的響度，常說的 “ 音量 ” 也是指音強。唱盤、 CD激光盤以及其他形式聲音載體中的聲音強度是一定的，通過播放設(shè)備的音量控制，可改變聆聽時的響度。聲音的感知響度 1 sone 相當(dāng)于 40分貝的音調(diào)在 1kHz下的響度。但在人耳的可聽頻域范圍內(nèi)，當(dāng)聲音弱或強到一定程度，人耳都無法聽到。如圖所示，聞閾和痛閾隨頻率變化的等響度曲線之間的區(qū)域就是人耳的聽覺范圍。這些等響度曲線表明了聽覺在有些頻率下較為靈敏。 ★ 高頻段的響度變化與聲壓級增量基本一致，低頻段聲壓級的微小變化會導(dǎo)致響度的較大變化。這說明：在響度級較小時，高、低頻聲音靈敏度降低較明顯，而低頻段比高頻段靈敏度降低更加劇烈，一般應(yīng)特別重視加強低頻音量。而且人耳對聲音源

點擊復(fù)制文檔內(nèi)容

教學(xué)課件相關(guān)推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

音頻技術(shù)ppt課件-展示頁

音頻技術(shù)基礎(chǔ)知識ppt課件-展示頁

音頻技術(shù)的應(yīng)用講ppt課件-展示頁

數(shù)字音頻技術(shù)概述ppt課件-展示頁

音頻處理技術(shù)-展示頁

音頻媒體ppt課件-展示頁

圖像、視頻、音頻制作技術(shù)-展示頁

音頻基本測量介紹ppt課件-展示頁

多軌音頻波形處理ppt課件-展示頁

音頻信號傳輸技術(shù)實驗-展示頁

音頻設(shè)備和制作技術(shù)-展示頁

音頻放大器ppt課件-展示頁

音頻數(shù)字化ppt課件-展示頁

音頻信號光纖傳輸技術(shù)實驗-展示頁

數(shù)字音頻制作處理技術(shù)-展示頁

音頻信號分析儀ppt課件-展示頁

音頻技術(shù)ppt課件(已改無錯字)

音頻技術(shù)ppt課件-資料下載頁

音頻技術(shù)ppt課件(參考版)

音頻技術(shù)ppt課件-文庫吧資料