正文內(nèi)容

音頻信息的獲取與處理-全文預覽

2025-06-02 22:33 上一頁面

下一頁面

　　

【正文】用的標準音頻文件格式，也是聲霸卡（ Sound Blaster）所使用的音頻文件格式。 WAV 聲音文件是使用 RIFF（ Resource Interchange File Format資源交換文件）的格式描述的， RIFF格式文件是一種帶有標記的文件結(jié)構(gòu) ，它由文件頭和波形音頻文件數(shù)據(jù)塊組成。 ? WAV文件 WAV文件又稱波形文件，是 Microsoft公司的音頻文件格式。 MPEG音頻壓縮技術(shù)的傳輸速率為每聲道 32kb/s?448kb/s。輸入音頻信號的采樣頻率為 48kHz、 32kHz，經(jīng)過濾波器組分成 32個子帶。雖然 MPEG聲音標準是 MPEG標準的一部分，但它同時也完全可以獨立應用。另外，還有歐洲數(shù)字移動通信（ GSM）制定了數(shù)字移動通信網(wǎng)的 13kb/s長時預測規(guī)則碼激勵（ RPELTP）語音編碼標準。用此標準編碼，可在 ISDN（綜合業(yè)務數(shù)據(jù)網(wǎng)）的 B通道上傳輸音頻數(shù)據(jù) 。在 1972年制定了，采用的是 ?律或 A律的 PCM編碼技術(shù)，數(shù)據(jù)速率為 64kb/s。這個數(shù)據(jù)就是 CCITT ,（國際電話與電報顧問委員會）推薦的：話音頻率脈沖編碼調(diào)制。由于 ? 律壓擴的輸入和輸出關(guān)系是對數(shù)函數(shù)關(guān)系，所以這種編碼又稱為對數(shù)PCM。在非均勻量化中，采樣輸入信號幅度和量化輸出數(shù)據(jù)之間定義了兩種對應關(guān)系，一種稱為 ? 律（ ?Law）壓（縮）擴（展）算法，另一種稱為 A律(ALaw) 壓（縮）擴（展）算法。圖 2 － 6 均勻量化圖 2 7 ? 律的壓縮特性改進 PCM編碼技術(shù)的一個方法是采用非均勻量化，即讓量化級高度隨信號振幅而變化。只要采樣頻率足夠大，量化位數(shù)也適當，便能獲得較高的聲音信號數(shù)字化效果。如果采用相等的量化間隔對采樣得到的信號作量化，那么這種量化稱為均勻量化。ＰＣＭ首先開始應用于電話系統(tǒng)，但一直到１９６２年美國 Bell實驗室才為ＡＴ＆Ｔ制成了國際上第一套商用ＰＣＭ電話系統(tǒng)（Ｔ１系統(tǒng)），這標志了通信開始步入數(shù)字化。混合編碼充分利用了線性預測技術(shù)和綜合分析技術(shù) ，其典型算法有：碼本激勵線性預測（ CELP）、多脈沖線性預測（ MPLPC）及矢量和激勵線性預測（ VSELP）等。語音的基本參數(shù)是基音周期、共振峰、語音譜、聲強等，如能得到這些語音基本參數(shù) ，就可以不對語音的波形進行編碼，而只要記錄和傳輸這些參數(shù)就能實現(xiàn)聲音數(shù)據(jù)的壓縮。波形編碼的編碼信息是聲音的波形。音頻數(shù)據(jù)壓縮和編碼與圖像壓縮編碼有著很大的不同。例如，人耳聽覺中有一個重要的特點，即聽覺的 “ 掩蔽 ” 。在多媒體系統(tǒng)中，一般是對數(shù)字化聲音信息進行壓縮和編碼后再存入計算機，以減少音頻的數(shù)據(jù)量。在 CDDA中，數(shù)據(jù)、控制碼和糾錯碼分別記錄在不同的光道上。除此之外，還可以規(guī)定動態(tài)范圍和頻率響應，在有關(guān)的國際標準中都有具體規(guī)定。脈沖編碼調(diào)制（ PCM）是把模擬信號變換為數(shù)字信號的一種調(diào)制方式，既把連續(xù)輸入的模擬信號變換為在時域和振幅上都離散的量，然后將其轉(zhuǎn)化為代碼形式傳輸或存儲。這種脈沖數(shù)字信號可以一定的方式進行編碼，形成計算機內(nèi)部運行的數(shù)據(jù)。在圖 24中，采樣率和量化等級均提高了一倍，分別為 2022次 /秒和 20個量化等級。從圖中可以看出，藍色線與原波形 (紅色線 )相比，其波形的細節(jié)部分丟失了很多。信號類型頻率范圍 (Hz) 采樣率 (kHz) 量化精度 (位 ) 電話話音 2003400 8 8 寬帶音頻 507000 16 16 調(diào)頻廣播 2015k 378 16 高質(zhì)量音頻 2022k 441 16 ? 采樣與量化過程示例以圖 21所示的原始模擬波形為例進行采樣和量化。在相同的采樣頻率之下，量化位數(shù)愈高，聲音的質(zhì)量越好。量化的過程是先將采樣后的信號按整個聲波的幅度劃分成有限個區(qū)段的集合，把落入某個區(qū)段內(nèi)的樣值歸為一類，并賦于相同的量化值。 CD唱片存儲的是數(shù)字信息，要想獲得 CD音質(zhì)的效果，則要保證采樣頻率為，也就是能夠捕獲頻率高達 22050Hz的信號。采樣頻率與聲音頻率之間有一定的關(guān)系，根據(jù)奈奎斯特（ Nyquist）理論，只有采樣頻率高于聲音信號最高頻率的兩倍時，才能把數(shù)字信號表示的聲音還原成為原來的聲音。該時間間隔稱為采樣周期，其倒數(shù)為采樣頻率。模擬信號的數(shù)字化過程1 0 0 1 0 1 1 0 0 0 1 1 1 0 1? 早在 40年代，信息論的奠基者香農(nóng)（ Shannon）指出：在一定條件下，用離散的序列可以完全代表一個連續(xù)函數(shù)，這是采樣定理的基本內(nèi)容。對模擬音頻數(shù)字化過程涉及到音頻的采樣、量化和編碼。 ?電話 (Telephone)質(zhì)量。 MOS 質(zhì)量級別失真級別 5 優(yōu) (Excellent) 不察覺 4 良 (Good) 剛察覺但不可厭 3 中 (Fair) 察覺及稍微可厭 2 差 (Poor) 可厭 (但不令人反感 ) 1 劣 (Unacceptable) 極可厭 (令人反感 ) ? 聲音質(zhì)量分級與帶寬聲音的質(zhì)量與它所占用的頻帶寬度有關(guān)，頻帶越寬，信號強度的相對變化范圍就越大大，音響效果也就越好。通常是對某編碼器的輸出的聲音質(zhì)量進行評價，例如播放一段音樂，記錄一段話，然后重放給實驗者聽，再由實驗者進行綜合評定。因此，聲測量是不可少的。聲測量的基本儀器是聲級計。由于計算技術(shù)的發(fā)展，使許多計算和測量工作都使用了計算機或程序?qū)崿F(xiàn)。 ? 聲音質(zhì)量的評價我們經(jīng)常會對某一位歌手的歌聲發(fā)表意見，并與其他歌手進行比較，這其實是在對聲音的質(zhì)量進行評價。語音由元音和輔音所構(gòu)成。音色是聲波波形的主觀屬性。這樣做的好處是顯而易見的，聲音存儲質(zhì)量得到了加強，數(shù)字化的聲音信息使計算機能夠進行識別、處理和壓縮，這也就是為什么如今磁帶逐漸被淘汰， CD唱片卻趨于流行的原因。幅度越大，聲音越強。它是指信號在兩個峰點或谷底之間的相對時間。例如一個聲波信號在一秒鐘內(nèi)有 5000個波峰，則可將它的頻率表示為5000Hz或 5kHz。因聲波是在時間和幅度上都連續(xù)變化的量，我們稱之為模擬量。我們之所以能聽到日常生活中的各種聲音信息，其實就是不同頻率的聲波通過空氣產(chǎn)生震動，刺激人耳的結(jié)果。 ? 音頻信號的形式在日常生活中，音頻 (Audio)信號可分為兩類：語音信號和非語音信號。隨著計算機技術(shù)的發(fā)展，特別是海量存儲設備和大容量內(nèi)存在計算機上的實現(xiàn)，對音頻媒體進行數(shù)字化處理便成為可能。傳統(tǒng)的聲音記錄方式就是將模擬信號直接記錄下來，例如磁帶錄音和密紋唱片就是將聲音拾取處理后以磁記錄或機械刻度的方式記錄下來，此時磁帶上磁極的變化或密紋唱片音槽內(nèi)的紋路起伏變化都是與聲音信號的變化相對應、成正比的。隨著電學、電子學的發(fā)展，人們開始嘗試記錄下這些真實的聲音，利用把聲的振動轉(zhuǎn)換成電信號的原理，使聲音的記錄成為可能?？墒菐浊陙?，人類只能憑耳朵來辨別聲音的高低、強弱，而不能把聲音記錄和儲存起來。在多媒體系統(tǒng)中，音頻可被用作輸入或輸出。無論其應用目的是什么，聲音的合理使用可以使多媒體應用系統(tǒng)變得更加豐富多彩。人類很早就開始研究聲音，并利用當時已掌握了的聲音的某些規(guī)律來制造樂器、進行建筑設計或傳聲裝置設計，使發(fā)出的聲音傳得更遠?？墒锹曇?、機械振動不容易傳遞，也不容易放大，機械方法很不方便。顧名思義，電聲技術(shù)是依靠 “ 電 ” 來記錄并播放聲音的，其基本原理是通過電壓來產(chǎn)生模擬聲波變化的電流信號，并記錄下來，灌錄成早期的唱片或磁帶，這種電流信號便被稱之為 “ 模擬信號 ” 。電聲轉(zhuǎn)換、音頻信號的存儲、重放技術(shù)、加工處理技術(shù)以及數(shù)字化音頻信號的編碼、壓縮、傳輸、存取、糾錯等技術(shù)，是音頻技術(shù)的主要對象。靜態(tài)或動態(tài)圖像配以解說和背景音樂，可使圖像充滿生氣；立體聲音樂可增加空間感，使人身臨其境；語音電子郵件，聽聲如見其人，游戲中的音響效果對于渲染氣氛則為顯得更為重要；此外，在多媒體通信中，可視電話、電視會議、這些都離不開數(shù)字化音頻處理技術(shù)。非語音信號的特點是不具有復雜的語義和語法信息，信息量低、識別簡單。規(guī)則音頻是一種連續(xù)變化的模擬信號 ,可用一條連續(xù)的曲線來表示，稱為聲波。一個聲源每秒鐘可產(chǎn)生成百上千個波，我們把每秒鐘波峰所發(fā)生的數(shù)目稱之為信號的頻率，單位用赫茲 (Hz)或千赫茲 (kHz)表示。與頻率相關(guān)的另一個參數(shù)是信號的周期。幅度決定了信號音量的強弱程度。這里， A代表Analog”（類比、模擬）， D代表“ Digital ” （數(shù)字、數(shù)碼）， A/D轉(zhuǎn)換就是把模擬信號轉(zhuǎn)換成數(shù)字信號的過程，模擬電信號變?yōu)榱擞伞?0”和“ 1”組成的 Bit信號。聲波的振動頻率高，我們聽到的聲音就高，反之亦然，但它們之間并非線性關(guān)系。語音是特殊的復合音。振幅越大則響度越大，但它們之間也不是線性關(guān)系。 ?聲音客觀質(zhì)量的度量方法聲波的測量與分析傳統(tǒng)的方法是先用機電換能器把聲波轉(zhuǎn)換為相應的電信號，然后用電子儀表放大到一定的電壓級進行測量與分析。 ?音質(zhì)的測量混響時間，隔音量，吸音量。聲級測量還能明確地告訴我們什么聲音會引起聽力損害，并提醒人們采用適當?shù)穆犃ΡＷo措施。 ?聲音主觀質(zhì)量的度量采用客觀標準方法很難真正評定某種編碼器的質(zhì)量，在實際評價中，主觀的質(zhì)量度量比客觀質(zhì)量的度量更為恰當和合理。平均判分（ Mean Opnion ScoseMOS）過程是召集一批實驗者，請每個實驗者對某個編解碼器的輸出進行質(zhì)量判分，采用類似于考試的五級分制，不同的 MOS分對應的質(zhì)量級別和失真級別見表 2１。 ?調(diào)幅無線電廣播，簡稱 AM(Amplitude Modulation)質(zhì)量。數(shù)字化的聲音易于用計算機軟件處理，現(xiàn)在幾乎所有的專業(yè)化聲音錄制、編輯器都是數(shù)字方式。經(jīng)采樣和量化后聲音信號經(jīng)編碼后就成為數(shù)字音頻信號，可以將其以文件形式保存在計算機的存儲介質(zhì)中，這樣的文件一般稱為數(shù)字聲波文件。采樣的過程是每隔一個時間間隔在模擬聲音的波形上取一個幅度值，把時間上的連續(xù)信號，變成時間上的離散信號。這和測定每天 24小時氣溫變化是一樣的，每小時測定 1次氣溫比每兩小時測定 1次氣溫的精度要高一倍。 PCM提供的數(shù)據(jù)傳輸率是56kb/s(b/s表示 b/s)或 64kb/s。我們把對聲波波形幅度的數(shù)字化表示稱之為 “ 量化 ” 。而一個以 16位為采樣模式的音效中，它在每一個固定采樣的區(qū)間內(nèi)所被采集的聲音幅度，將以個不同的量化等級加以記錄。下表給出了不同信號類型的采樣率和量化精度。當 D/A轉(zhuǎn)換器從圖 22得到的數(shù)值中重構(gòu)原來信號時，得到圖 23中藍色 (直線段 )線段所示的波形。同時，增加量化精度，以得到更高的量化等級，即可減少失真的程度。圖 24 采樣率為 2022Hz，量化等級為 20的采樣量化過程圖 25 采樣率為 4000Hz，量化等級為 40的采樣量化過程 ? 編碼模擬信號量經(jīng)過采樣和量化以后，形成一系列的離散信號 ——脈沖數(shù)字信號。編碼的形式比較多，常用的編碼方式是 PCM——脈沖調(diào)制。在比特率較高的波形編碼中可以用客觀指標如信噪比來衡量編碼的質(zhì)量，例如現(xiàn)在電話中普遍使用的Ａ律標準（ ITU ），要求信噪比優(yōu)于 35dB。其格式如表 23所示。幀同步子碼音頻數(shù)據(jù) （左聲道） Q校驗音頻數(shù)據(jù) （右聲道） P校驗 4 1 12 4 12 4 ? 音頻信號的壓縮編碼與標準將量化后的數(shù)字聲音信息直接存入計算機將會占用大量的存儲空間。音頻信號處理過程聲音信號能進行壓縮編碼的基本依據(jù)是： ? 聲音信號中存在著很大的冗余度，通過識別和去除這些冗余度，便能達到壓縮的目的； ?音頻信息的最終接收者是人，人的聽覺器官 (包括視覺器器官 )都具有某種不敏感性，舍去人的感官所不敏感的信息對聲音質(zhì)量的影響很小，在有些情況下，甚至可以忽略不計。 ?.對聲音波形取樣后，相鄰樣值之間存在著很強的相關(guān)性。從方法上看，聲音信號的編碼方式大致可分為三類，即波形編碼、參數(shù)編碼和混合編碼。參數(shù)編碼是一種對語音參數(shù)進行分析合成的方法。混合型編碼方法是一種在保留參數(shù)編碼技術(shù)的基礎上，引用波型編碼準則去優(yōu)化激勵源信號的方案。 ? PCM編碼 1939年法國工程師 Alec Reeves發(fā)明了將連續(xù)的模擬信號變換成時間和幅度都離散的二進制碼代表的脈沖編碼調(diào)制信號（ Pulse Code Modu

點擊復制文檔內(nèi)容

環(huán)評公示相關(guān)推薦

freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

音頻信息的獲取與處理-全文預覽

因特網(wǎng)上信息的瀏覽與獲取-資料下載頁

獲取信息的過程與方法-資料下載頁

音頻信號紅外發(fā)射與接收系統(tǒng)論文-資料下載頁

信息的獲取ppt課件-資料下載頁

音頻信號紅外轉(zhuǎn)發(fā)設計-資料下載頁

基于聲卡的音頻信號分析儀的設計-資料下載頁

信息的瀏覽與獲取-資料下載頁

第5章多媒體視頻信息處理-資料下載頁

信息的獲取和應用-資料下載頁

外文學術(shù)信息的檢索與獲取-資料下載頁

雷運發(fā)第5章視頻信息處理-資料下載頁

數(shù)字城市的信息獲取-資料下載頁

信息的獲取和應用-資料下載頁

音頻信號分析儀設計報告-資料下載頁

文獻信息的獲取ppt課件-資料下載頁

音頻信息的獲取與處理(編輯修改稿)

音頻信息的獲取與處理-wenkub.com

音頻信息的獲取與處理(已改無錯字)

音頻信息的獲取與處理-資料下載頁

音頻信息的獲取與處理(參考版)