freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

音頻技術(shù)ppt課件(已修改)

2025-01-30 16:40 本頁面
 

【正文】 第 5 章 音頻技術(shù) 音頻也是多媒體應(yīng)用的重要組成部分。 現(xiàn)實世界的聲音來源是相當(dāng)復(fù)雜的,聲音不僅與時間和空間有關(guān),還與強(qiáng)度、方向等很多因素有關(guān)。在計算機(jī)中創(chuàng)建音頻時,所能模擬的聲音還必須要符合人類的聽覺特征和聽力范圍。 數(shù)字音頻主要分為聲波、語音和音樂三類。 要模擬出符合現(xiàn)實世界的數(shù)字聲音,我們首先得了解聲音的基本特性 : 包括聲音的物理特性和人們在聽覺方面的心理特性 .以便創(chuàng)建出一定格式的數(shù)字聲音編碼,滿足人們對模擬聲音在采集、處理、質(zhì)量等各方面的需求。 聲音 聲音的物理特征 聲音是 縱波 。決定聲波的物理特性有振幅、頻率和相位。 一個聲源每秒鐘可產(chǎn)生成百上千個波,我們把每秒鐘波峰所發(fā)生的數(shù)目稱之為信號的頻率,單位用赫茲 (Hz)或千赫茲 (kHz)表示。信號的幅度是從信號的基線到當(dāng)前波峰的距離。幅度決定了信號音量的強(qiáng)弱程度。幅度越大,聲音越強(qiáng)。對音頻信號,聲音的強(qiáng)度用分貝 (dB)表示,分貝的幅度就是音量。 在 1kHz頻率的正弦波中,能被人耳察覺的最弱聲壓大約是 104dyn(達(dá)因) /cm2,這個最弱音已經(jīng)作為國際標(biāo)準(zhǔn)的參照聲。 描述聲音強(qiáng)度的量值是采用分貝表示 : 分貝 是指兩個相同的物理量(例 A1和 A0)之比,取以 10為底的對數(shù)并乘以 10(或 20)。 N = 10lg(A1/A0) 分貝符號為 “ dB”。 N是被量度量的“ 級 ” 。,這也被稱為聲壓級。 A1是被量度量。 A0是基準(zhǔn)量 如果 那么在特別安靜的環(huán)境中,單獨檢測:動物的呼吸聲大約 20 dB,人們正常的談話聲約 60dB,汽車的喇叭聲約100dB,飛機(jī)起飛的聲音約 120 dB 120dB以上的強(qiáng)度可使人產(chǎn)生痛苦的感覺。 一般人的聽力范圍是 20Hz~ 20kHz。這個頻率區(qū)域稱為可聞聲段,大致可分為低頻、中頻和高頻 低頻的頻率約在 250~ 500 Hz(如鼓聲) 中頻的頻率約在 1000~ 2022 Hz, 高頻的頻率約在 3000~ 4000 Hz(如哨子聲)。 是指物體每秒鐘振動的次數(shù)。 我們聽到的聲音都是物體振動后會產(chǎn)生聲波 不同的振動頻率將會產(chǎn)生不同的聲波。 低于 20Hz和高于 20kHz的頻率段分別稱為次聲和超聲。 瞬時 T 是波形的變化方向,如果是多個波形組合,起始相位可以相同或不同。 在某一個瞬時 T,不同波形的相位都可以是不同的。 右圖所示的,就是一段多波形混合而成的聲音實際播放時所顯示的波形。 規(guī)則音頻 是一種連續(xù)變化的模擬信號 ,可用一條連續(xù)的曲線來表示,稱為 聲波 。因聲波是在時間和幅度上都連續(xù)變化的量,我們稱之為 模擬量 。 聲音的聽覺心理特性 對于復(fù)雜的人耳聽覺系統(tǒng)特性的研究,目前僅限于在心理聲學(xué)和語言聲學(xué)內(nèi)。 聽覺心理的主觀感受主要有: 響度、音高、音色、音量、密度、諧和、噪聲、掩蔽效應(yīng)、高頻定位。 響度、音度、音色: 可以在主觀上用來描述任何復(fù)雜的聲音 而對于多種音源場合: 人的耳掩蔽效應(yīng)等特性尤為重要。 1) 音調(diào):代表了聲音的高低 。 音調(diào)與頻率有關(guān) , 頻率越高 , 音調(diào)越高 ,反之亦然 。 當(dāng)提高磁帶錄音機(jī)的轉(zhuǎn)速時,其旋轉(zhuǎn)加快,聲音信號的頻率提高,其喇叭放出來聲音的音調(diào)提高了。同樣,在使用音頻處理軟件對聲音的頻率進(jìn)行調(diào)整時,也可明顯感到音調(diào)隨之而產(chǎn)生的變化。各種不同的聲源具有自己特定的音調(diào),如果改變了某種聲源的音調(diào),則聲音會發(fā)生質(zhì)的轉(zhuǎn)變,使人們無法辨別聲源本來的面目。 2) 音色:即特色的聲音 。 聲音分 純音 和 復(fù)音 兩種類型 。 所謂純音 , 是指振幅和周期均為常數(shù)的聲音;復(fù)音則是具有不同頻率和不同振幅的混合聲音 。 大自然中的聲音絕大部分是復(fù)音 。 在復(fù)音中 , 最低頻率的聲音是 “ 基音 ” , 它是聲音的基調(diào) 。 其他頻率的聲音稱為 “ 諧音 ” , 也叫 泛音 。基音和諧音是構(gòu)成聲音音色的重要因素 。 各種聲源都具有自己獨特的音色 , 例如各種樂器的聲音 、 每個人的聲音 、 各種生物的聲音等 , 人們就是依據(jù)音色來辨別聲源種類的 。 3)音強(qiáng):聲音的強(qiáng)度,也被稱為聲音的響度,常說的 “ 音量 ” 也是指音強(qiáng)。 音強(qiáng)與聲波的振幅成正比,振幅越大,強(qiáng)度越大。唱盤、 CD激光盤以及其他形式聲音載體中的聲音強(qiáng)度是一定的,通過播放設(shè)備的音量控制,可改變聆聽時的響度。 等響曲線 響度 表示人們所感覺到的聲音能量的強(qiáng)弱,主要取決于聲波振幅的大小,物理上聲壓級的值一般不等于響度級的值。 聲音的感知響度 1 sone 相當(dāng)于 40分貝的音調(diào)在 1kHz下的響度。 響度與人耳的可聞程度有關(guān),當(dāng)超出人耳的可聽頻率范圍時,聲音的響度再大,人耳也無法察覺。但在人耳的可聽頻域范圍內(nèi),當(dāng)聲音弱或強(qiáng)到一定程度,人耳都無法聽到。 實驗表明,聲音的可聞閾和痛感閾是隨著頻率而變化的。如圖所示,聞閾和痛閾隨頻率變化的等響度曲線之間的區(qū)域就是人耳的聽覺范圍。 聲壓級 可聞閾的分貝值 頻率Hz 就是說,小于 0dB聞閾和大于 140dB痛閾時為不可聽聲。 這些等響度曲線表明了聽覺在有些頻率下較為靈敏。 所謂 “ 等響 ” 就是對于 1kHz以外的可聽聲,在同一級等響度曲線上有無數(shù)個等效的聲壓 —頻率值, 例如, 200Hz的 30dB的聲音和 1kHz的 10dB的聲音在人耳聽起來具有相同的響度。 ★ 高頻段的響度變化與聲壓級增量基本一致,低頻段聲壓級的微小變化會導(dǎo)致響度的較大變化。 ★ 在較低的聲壓級上,等響上曲線各頻率聲音的聲壓級相差很大, 較高的聲壓級上,等響曲線較為平坦,說明各頻率的聲壓級基本相同。 這說明:在響度級較小時,高、低頻聲音靈敏度降低較明顯,而低頻段比高頻段靈敏度降低更加劇烈,一般應(yīng)特別重視加強(qiáng)低頻音量。 聽覺的 掩蔽效應(yīng) 是一個較為復(fù)雜的心理和生理現(xiàn)象,包括人耳的 頻域掩蔽 效應(yīng)和 時域掩蔽 效應(yīng)。而且人耳對聲音源方向的辨別能力,也與頻率的高低有關(guān)。 由于對于 2KHZ以上的高頻聲音信號,人耳很難判斷其方向性,因而在數(shù)字處理時,就可以不必重復(fù)存貯立體聲廣播的高頻部分。 屏蔽 是指 一個弱聲音被另一個強(qiáng)聲音所遮蓋 。 當(dāng)強(qiáng)、弱聲音同時存在時,就將發(fā)生聲音屏蔽現(xiàn)象。例如,說話聲會被火車聲所遮蓋。當(dāng)兩個聲音在時間和頻率上很接近的時候,屏蔽效應(yīng)就會較很強(qiáng)。當(dāng)強(qiáng)聲音的頻率與弱聲音相同或更高時,屏蔽效應(yīng)最有效。 屏蔽 如果同時存在的是兩個純音 實驗表明存在兩種有效的屏蔽,一種是中等強(qiáng)度的純音最有效的屏蔽出現(xiàn)在其頻率附近,另一種是低頻的純音可以有效地掩蔽高頻的純音。 如果同時存在的是噪音和純音 情況較復(fù)雜。因為屏蔽純音的噪音實際上是由多種純音組成的,具有無限寬的頻譜。 臨界頻帶 當(dāng)某個純音被 以它為中心頻率且具有一定帶寬的連續(xù)噪聲 所屏蔽時,如果該純音剛好能被聽到時的 功率等于這一頻帶內(nèi)噪聲的功率 ,那么這個帶寬就稱為臨界頻帶寬度。 但在有聲音屏蔽的情況下,一個臨界頻帶之內(nèi)的聲音感知程度與表中跨越多個臨界頻帶的聲音感知程度是不相同的。 可以說明人類的聽覺對聲音的感知特性。 表 51列出的是在 20Hz~ 16kHz范圍內(nèi),通??煞殖龅?24個子臨界頻帶。 人耳對同一個臨界頻段內(nèi)頻率的聽覺和感知是較接近的。 聲音的數(shù)字原理 模擬聲音的信號是個連續(xù)量,由許多具有不同振幅和頻率的正弦波組成。實際聲音信號的計算機(jī)獲取過程就是聲音的數(shù)字化的處理過程。 聲音的模 /數(shù)轉(zhuǎn)換( ADC) ,首先需對聲波采樣,用數(shù)字方式記錄聲音。圖中橫軸表示時間,縱軸表示振幅,按時間對聲波分割從而提取波形的樣本。實現(xiàn)這個過程的裝置就被稱為模 /數(shù)轉(zhuǎn)換器。 聲音的數(shù) /模轉(zhuǎn)換( DAC) 即由數(shù)字聲音變成模擬的波形。 音頻系統(tǒng)是將聲波波形轉(zhuǎn)換成的連續(xù)的二進(jìn)制數(shù)據(jù)來還原聲音的。實現(xiàn)這個過程的裝置被稱為數(shù) /模轉(zhuǎn)換器。 模擬音頻的數(shù)字化過程 數(shù)字化的聲音易于用計算機(jī)軟件處理,現(xiàn)在幾乎所有的專業(yè)化聲音錄制、編輯器都是數(shù)字方式。對模擬音頻數(shù)字化過程涉及到 音頻的采樣、量化和編碼。 采樣和量化的過程可由 A/D轉(zhuǎn)換器 實現(xiàn) 。 A/D轉(zhuǎn)換器以固定的頻率去采樣,即每個周期測量和量化信號一次。經(jīng)采樣和量化后聲音信號經(jīng)編碼后就成為數(shù)字音頻信號,可以將其以文件形式保存在計算機(jī)的存儲介質(zhì)中,這樣的文件一般稱為 數(shù)字聲波文件 。 模擬信號的數(shù)字化過程 100 101 100 01 1 101 信息論的奠基者香農(nóng)( Shannon)指出: 在一定條件下,用離散的序列可以完全代表一個連續(xù)函數(shù) ,這是采樣定理的基本內(nèi)容。 為實現(xiàn) A/D轉(zhuǎn)換,需要 把模擬音頻信號波形進(jìn)行分割 , 這種方法稱為采樣 (Sampling)。 采樣的過程是每隔一個時間間隔在模擬聲音的波形上取一個幅度值 ,把時間上的連續(xù)信號變成時間上的離散信號。該時間間隔稱為采樣周期,其倒數(shù)為采樣頻率。 采樣頻率 是指計算機(jī)每秒鐘采集多少個聲音樣本。 1. 采樣 采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特( Nyquist)理論, 只有采樣頻率高于聲音信號最高頻率的兩倍時,才能把數(shù)字信號表示的聲音還原成為原來的聲音 。 2ffs ? 采樣只解決了音頻波形信號在 時間坐標(biāo) (即橫軸 )上把一個波形切成若干個等分的數(shù)字化問題,但是還需要用某種數(shù)字化的方法來反映某一瞬間聲波幅度的電壓值大小。該值的大小影響音量的高低。我們把 對聲波波形幅度的數(shù)字化表示稱之為 “ 量化 ” 。 量化的過程 是先將采樣后的信號按整個聲波的幅度劃分成有限個區(qū)段的集合,把落入某個區(qū)段內(nèi)的樣值歸為一類,并賦于相同的量化值。如何分割采樣信號的幅度呢 ? 我們還是采取二進(jìn)制的方式,以8位 (bit)或 16位 (bit)的方式來劃分縱軸 。也就是說在一個以 8位為記錄模式的音效中,其縱軸將會被劃分為個量化等級,用以記錄其幅度大小。 2. 量化 以下圖所示的原始模擬波形為例進(jìn)行采樣和量化。假設(shè)采樣頻率為1000次 /秒,即每 1/1000秒 A/D轉(zhuǎn)換器采樣一次,其幅度被劃分成 0到 9共 10個量化等級,并將其采樣的幅度值取最接近 0~ 9之間的一個數(shù)來表示,如下圖所示。圖中每個正方形表示一次采樣。 D/A轉(zhuǎn)換器 從上圖得到的數(shù)值中重構(gòu)原來信號時,得到下圖中藍(lán)色 (直線段 )線段所示的波形。從圖中可以看出,藍(lán)色線與原波形(紅色線 )相比,其波形的細(xì)節(jié)部分丟失了很多。這意味著重構(gòu)后的信號波形有較大的失真。 失真 在采樣過程中是不可避免的, 如何減少失真呢 ?可以直觀地看出,我們可以把上圖中的波形劃分成更為細(xì)小的區(qū)間,即 采用更高的采樣頻率。同時,增加量化精度 ,以得到更高的量化等級,即可減少失真的程度。在下圖(左)中,采樣率和量化等級均提高了一倍,分別為 2022次 /秒和 20個量化等級。在下圖(右)中,采樣率和量化等級再提高了一倍,分別達(dá)到 4000次 /秒和 40個量化等級。從圖中可以看出,當(dāng)用 D/A轉(zhuǎn)換器重構(gòu)原來信號時(圖中的輪廓線),信號的失真明顯減少,信號質(zhì)量得到了提高。 模擬信號量經(jīng)過采樣和量化以后,形成一系列的離散信號 ——
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1