【正文】
杜比AC3技術(shù)及其應(yīng)用摘 要音頻編解碼技術(shù)是多媒體信息處理領(lǐng)域的一個(gè)重要研究方向。AC3 是第一個(gè)專門為編碼多聲道數(shù)字音頻信號(hào)而設(shè)計(jì)的感知編碼系統(tǒng),具有較高的音質(zhì)和較低的復(fù)雜度,現(xiàn)已廣泛應(yīng)用于各個(gè)領(lǐng)域,如DVD、高清電視 HDTV、衛(wèi)星數(shù)字廣播 DBS、數(shù)字視頻廣播 DVB,ATSC 等。杜比 AC 3 提供的數(shù)字音頻壓縮編碼技術(shù)具有較高的編碼效率。 而由 5 個(gè)全頻域聲道和 1 個(gè)超低音聲道組成的 AC 3 環(huán)繞聲系統(tǒng)能完美再現(xiàn)高質(zhì)量的立體聲。,分別是左、中、右、左環(huán)繞、這里的左、右環(huán)繞聲道是分別制作的獨(dú)立聲道,更具有現(xiàn)場(chǎng)感和真實(shí)感。由于 AC3 系統(tǒng)編碼靈活,在消費(fèi)電子領(lǐng)域,目前大多數(shù)的電影制作都使用了該技術(shù),美國(guó)等國(guó)家的數(shù)字電視系統(tǒng)也采用該技術(shù)作為音頻編碼標(biāo)準(zhǔn)。本文主要研究了AC3技術(shù),其心理聲學(xué)特性,以及AC3技術(shù)在家庭影音中的應(yīng)用。關(guān)鍵詞:杜比AC3;編解碼;心理聲學(xué);家庭影音Dolby AC3 technology and its applicationABSTRACTAudio decoding technology is multimedia information processing in one of the important research direction. AC3 is the first to specifically for coding much channel digital audio signals and the perception of the coding system design, it is of high quality and low plexity, has been widely used in many fields, such as DVD, high definition television HDTV, satellite radio DBS, digital video digital radio DVB, ATSC, etc.Dolby AC3 provides the digital audio pression technology has high coding efficiency。 And by the five whole frequency domain track and a low sound track of AC3 surround system can perfect representation of high quality stereo. AC3 has channel, respectively is left, right, left, right around and around channel sound less effect, the left and right surround sound channel is made separately independent track and has more annotating and realism.Because AC3 system code flexible, in the consumer area now, most of the movie making use of this technology, the United States and other countries digital TV system also USES the technology as audio coding standard.This paper mainly studies the AC3 technology, the psychological acoustic properties and AC3 technology in the family of the application of the video.Key words: DolbyAC3。Coding and Decoding。 Psychoacoustics。 Family video 目 錄第一章緒論 1 1 1 2 2第二章音頻編碼解碼基本概念 3 3 3 5 5 6 6 6第三章AC3編解碼技術(shù) 8 8 8 9 AC3 編碼流程 9 AC3 解碼流程 12 14 14 16 AC3音頻幀結(jié)構(gòu) 17 18第四章AC3心理聲學(xué)的研究 19 19 19 19 20 21第五章基于家庭影院中AC3的研究 23 23 23 23 24 25 26 26 27第六章總結(jié) 29致謝 30參考文獻(xiàn) 31第一章 緒論數(shù)字技術(shù)的出現(xiàn)與應(yīng)用為人類帶來(lái)了深遠(yuǎn)的影響,人們?nèi)缃褚焉钤谝粋€(gè)幾乎數(shù)字化的世界之中,而數(shù)字音頻技術(shù)則稱得上是應(yīng)用最為廣泛的數(shù)字技術(shù)之一,CD、VCD等早已走進(jìn)千家萬(wàn)戶,數(shù)字化廣播正在全球范圍內(nèi)逐步得到開(kāi)展[1]。隨著技術(shù)的不斷進(jìn)步和生活水準(zhǔn)的不斷提高,原有的立體聲形式已不能滿足受眾對(duì)聲音節(jié)目的欣賞要求,具有更強(qiáng)定位能力和空間效果的三維聲音技術(shù)得到蓬勃發(fā)展。而在三維聲音技術(shù)中最具代表性的就是多聲道環(huán)繞聲技術(shù)[2]。杜比AC3技術(shù)是由美國(guó)杜比實(shí)驗(yàn)室主要針對(duì)環(huán)繞聲開(kāi)發(fā)的一種音頻壓縮技術(shù)。,可將碼率壓縮至384kbps,壓縮比約為10:1。杜比AC3最初是針對(duì)影院系統(tǒng)開(kāi)發(fā)的,但目前已成為應(yīng)用最為廣泛的環(huán)繞聲壓縮技術(shù)之一[3]。在杜比AC3中使用了許多先進(jìn)的、行之有效的壓縮技術(shù)如前/后向混合自適應(yīng)比特分配、公共比特池、TDAC濾波、頻譜包絡(luò)編碼、及低碼率條件下使用的多聲道高頻耦合等。而其中許多技術(shù)對(duì)其它的多聲道環(huán)繞聲壓縮技術(shù)的發(fā)展都產(chǎn)生了一定的影響[9]??梢哉f(shuō),AC3的出現(xiàn)是杜比公司幾十年來(lái)在聲音降噪及編碼技術(shù)方面的結(jié)晶(從一定的角度來(lái)看,編碼技術(shù)實(shí)際上就是降低編碼噪聲影響的技術(shù)),在技術(shù)上它具有很強(qiáng)的優(yōu)勢(shì)。因而即使作為一項(xiàng)專利技術(shù),DolbyAC3仍然在影院系統(tǒng)、HDTV、消費(fèi)類電子產(chǎn)品(如LD、DVD)及直播衛(wèi)星等方面獲得了廣泛的應(yīng)用,得到了眾多廠商的支持,成為業(yè)界事實(shí)上的標(biāo)準(zhǔn)[11]。AC3 技術(shù)起源于為高清晰度電視(High Definition TeleVision,HDTV)提供高質(zhì)量聲音。美國(guó)聯(lián)邦通信委員會(huì)(Federal Communication Committee,F(xiàn)CC)的高級(jí)電視咨詢委員會(huì)(Advisory Committee on Advanced Television Service,ACATS)于 1987 年開(kāi)始美國(guó) HDTV 制式的研究。最初的 HDTV 系統(tǒng)方案是模擬圖象和數(shù)字聲音傳輸,其中聲音編碼采用 DolbyAC1 數(shù)字音頻編碼算法。AC1通過(guò) 424 多聲道矩陣方式把聲道數(shù)減少一半(這樣就可以降低傳輸信道的帶寬),然后采用增量調(diào)制技術(shù)進(jìn)行數(shù)字編碼。因此,AC1 的壓縮比為 2:1。到1989 年,隨著聲音編碼技術(shù)和數(shù)字信號(hào)處理器(Digital Signal Processor,DSP)的進(jìn)步,AC1 系統(tǒng)發(fā)展成為基于變換編碼技術(shù)的 AC2 系統(tǒng),在提高質(zhì)量的同時(shí),壓縮比提高為4:1,但是多聲道矩陣處理技術(shù)仍然保留著[6]。為了最大限度地發(fā)揮矩陣方式的優(yōu)勢(shì),必須把編碼的信號(hào)再解碼,而且要邊監(jiān)聽(tīng)效果邊加以確認(rèn),對(duì)于電視現(xiàn)場(chǎng)節(jié)目,有時(shí)一次解碼很難確認(rèn)其效果,所以用兩聲道碼率提供多聲道編碼性能的 AC3 系統(tǒng)由此誕生。到了1991 年中期,AC3 逐漸被公眾所知,并被美國(guó) HDTV 組織所接受。1993 年 11 月,ACATS 正式批準(zhǔn)大聯(lián)盟(Great Alliance,GA)HDTV 系統(tǒng)采用AC3 編碼方案。1994 年 ATSC 的建議草案的聲音部分采用 AC3 算法,1996 年底美國(guó) FCC 采納 ATSC DTV 標(biāo)準(zhǔn),將 AC3 作為未來(lái)高清晰度電視的伴音標(biāo)準(zhǔn)。北美及日本這些采用 NTSC 制式的國(guó)家將 Dolby AC3 作為新一代影碟 DVD 的音頻標(biāo)準(zhǔn)。事實(shí)上,AC3 很快被其它國(guó)家接受為多聲道音頻編碼標(biāo)準(zhǔn)。DVDROM、個(gè)人計(jì)算機(jī)產(chǎn)品、家庭影院、數(shù)字有線電視系統(tǒng)以及一些直播衛(wèi)星系統(tǒng)都采用 AC3 作為音頻編解碼器。隨著我國(guó)經(jīng)濟(jì)的高速發(fā)展,人民消費(fèi)水平進(jìn)一步提高,我國(guó)必將會(huì)形成一個(gè)龐大的數(shù)字家庭影院系統(tǒng)市場(chǎng)。在這個(gè)大市場(chǎng)中,Dolby AC3 是廣泛使用的家庭影院環(huán)繞聲系統(tǒng),通過(guò)采用 AC3 寬帶音頻壓縮技術(shù),在數(shù)字家庭影院系統(tǒng)中實(shí)現(xiàn)了用十分之一的標(biāo)準(zhǔn)數(shù)字音頻空間來(lái)存儲(chǔ)高質(zhì)量的多聲道聲音數(shù)據(jù)。并且Dolby AC3 在美國(guó)的 HDTV,衛(wèi)星數(shù)字廣播,數(shù)字演播室等領(lǐng)域也廣泛應(yīng)用,潛力很大。但我國(guó)具有自主知識(shí)產(chǎn)權(quán)的 Dolby AC3 編碼器還極少,而且需求量較大的國(guó)產(chǎn) DVD 機(jī)中的解碼芯片也幾乎全為美國(guó)及日本的廠家所壟斷,它限制著國(guó)內(nèi) DVD 產(chǎn)業(yè)及音響產(chǎn)業(yè)的迅速發(fā)展。因此研究 AC3 編解碼技術(shù)對(duì)我國(guó)有著重大的現(xiàn)實(shí)意義,它既可以改變依賴進(jìn)口的馗尬局面,也可以增強(qiáng)開(kāi)發(fā)各種數(shù)字多媒體編解碼器的能力[12]。本論文的結(jié)構(gòu)安排如下:第一章 緒論簡(jiǎn)要的介紹了AC3的發(fā)展前景,研究背景及意義。第二章 音頻編碼解碼基本概念本章對(duì)音頻編解碼的格式,壓縮編解碼,音頻編碼的分類和目的以及在音頻編解碼的過(guò)程中碰到的一些問(wèn)題做了詳細(xì)的介紹。第三章 AC3編解碼技術(shù)本章對(duì)AC3及其原理做了深入的闡述,并詳細(xì)的分析了AC3具體編解碼流程和AC3編碼器的具體編解碼流程。并簡(jiǎn)單的概述了AC3的一些特點(diǎn)。 第四章AC3心理聲學(xué)的研究本章對(duì)AC3與心理聲學(xué)的關(guān)系進(jìn)行了深入的剖析。了解心理學(xué)的特點(diǎn)以及AC3的心理特性,為研究基于家庭影院中AC3做鋪墊。第五章基于家庭影院中AC3的研究本章簡(jiǎn)單的介紹了家庭影院的發(fā)展前景。對(duì)AC3在家庭影院中的環(huán)繞聲系統(tǒng)做了深入的闡述。并了解了AC3在家庭影院中的一些特殊功能。第六章 結(jié)束語(yǔ)本章概括總結(jié)了本文所作的工作,并給出下一步研究工作的方向。第二章 音頻編碼解碼基本概念目前數(shù)字音頻領(lǐng)域流行的音頻編碼技術(shù)以數(shù)據(jù)量的壓縮性能分為非壓縮音頻(如波形音頻、MIDI 音頻和 CD 音頻)和壓縮音頻(MPEG、ACDTS 等)兩類。以下是幾中常用的音頻編碼技術(shù)簡(jiǎn)介[13]。(1)波形音頻波形音頻編碼是一種用于 PC 機(jī)之間交換聲音信息的常用音頻編碼技術(shù)。波形音頻是一種電子數(shù)字聲音,一般用于存儲(chǔ)各種非樂(lè)曲的音頻數(shù)據(jù),包括語(yǔ)音和音效。播放波形文件時(shí),不論音響設(shè)備是何種類型,都會(huì)聽(tīng)到相似的聲音,唯一的差別是聲音的質(zhì)量。波形音頻文件的格式為 RIFF 文件的一種。(2)MIDI 音頻MIDI 音頻也是一種重要的多媒體組成元素。MIDI 即樂(lè)器數(shù)字化接口,它是一種通信形式,提供了將電子樂(lè)器連結(jié)起來(lái)的手段和控制樂(lè)器所用的軟硬件設(shè)備的規(guī)范,是電子音樂(lè)領(lǐng)域中相當(dāng)重要的標(biāo)準(zhǔn)。MIDI 音頻格式文件的數(shù)據(jù)結(jié)構(gòu)幾乎都是位結(jié)構(gòu), 為擴(kuò)展名。(3)CD 音頻CD 音頻通常被稱為紅皮書(shū)音頻標(biāo)準(zhǔn),即通過(guò)計(jì)算機(jī)的 CDROM 驅(qū)動(dòng)器來(lái)播放的 CD 音樂(lè)。CD 音頻代表著高質(zhì)量的數(shù)字音頻信息,但其所需存儲(chǔ)空間也最大。(4)AC3杜比數(shù)碼(又稱作杜比環(huán)繞影音),是由美國(guó)杜比實(shí)驗(yàn)室開(kāi)發(fā)的性能卓越的數(shù)字音頻編碼系統(tǒng)。其中,AC1 用于衛(wèi)星通信和數(shù)碼有線廣播,AC2 用于專業(yè)音頻的傳輸和存儲(chǔ)。AC3 采用了第三代 ATC 技術(shù),被成為感覺(jué)編碼系統(tǒng),它將特殊的心理音響知識(shí)、人耳效應(yīng)的最新研究成果與先進(jìn)的數(shù)碼信號(hào)處理技術(shù)很好地結(jié)合起來(lái),形成了這種數(shù)字多聲道音頻處理技術(shù)。AC3 系統(tǒng)開(kāi)發(fā)的目的就是為了改善和提高三唯聲場(chǎng)的重現(xiàn)能力。(5)DTSDTS 是美國(guó) DTS 公司開(kāi)發(fā)成功的一種數(shù)字環(huán)繞聲音響制式。這種數(shù)字影院系統(tǒng)采用相干聲學(xué)編碼(CAC)方式,在聲像定位和現(xiàn)場(chǎng)感等音響效果上明顯優(yōu)于傳統(tǒng)環(huán)繞立體聲。和 AC3 一樣也是基于多聲道的編碼技術(shù),即通用 聲道(三組全頻立體聲)。與傳統(tǒng)的模擬技術(shù)相比,數(shù)字技術(shù)具有無(wú)法比擬的優(yōu)點(diǎn)。例如傳輸質(zhì)量高;易于采用糾錯(cuò)編碼技術(shù)提高抗干擾能力,易于大規(guī)模集成等。由于模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)后占用的帶寬加寬,因此數(shù)字信號(hào)的帶寬很寬。這給傳輸和存儲(chǔ)帶來(lái)了不方便。為此,數(shù)字壓縮技術(shù)應(yīng)運(yùn)而生,避免了帶寬的限制,使數(shù)字音頻技術(shù)進(jìn)入了一個(gè)更高的領(lǐng)域[15] 。所謂的數(shù)據(jù)壓縮就是用最少的數(shù)碼來(lái)表示多媒體信號(hào)。多媒體數(shù)據(jù)壓縮的方法本質(zhì)上只有兩類:無(wú)損壓縮和有損壓縮。數(shù)據(jù)壓縮的技術(shù)衡量標(biāo)準(zhǔn)主要有三點(diǎn):壓縮比要大、恢復(fù)后失真要小、壓縮算法要簡(jiǎn)單,解壓速度要快。(1)無(wú)損壓縮算法無(wú)損壓縮是指能不失真地將數(shù)據(jù)信息恢復(fù),其基本原理是統(tǒng)計(jì)壓縮數(shù)據(jù)中的冗余(重復(fù)的數(shù)據(jù)部分)。常用的無(wú)損壓縮算法有 RLE 行程編碼、Hufmman 編碼、算術(shù)編碼、LZW 編碼等。(2)有損壓縮算法有損壓縮是指不能將原始數(shù)據(jù)進(jìn)行完全恢復(fù)的壓縮技術(shù)。有損壓縮是壓縮技術(shù)的重要方法。其原理為人類視覺(jué)和聽(tīng)覺(jué)器官對(duì)圖像和聲音的某些頻率成分不太敏感,有損壓縮以犧牲這部分信息為代價(jià)換取了較高的壓縮比。研究表明,音頻信號(hào)的頻譜幾乎都集中在中頻段和低頻段,在 10kHz 以上的高頻段中是很少的。而音頻數(shù)據(jù)壓縮技術(shù)就是通過(guò)對(duì)音頻信號(hào)進(jìn)行實(shí)時(shí)的頻譜分析去掉不存在頻譜分量的那一段,或者,對(duì)頻譜分量少的地方分配以較少的比特?cái)?shù)。另外,音頻數(shù)據(jù)壓縮技術(shù)積極地利用了人耳的聽(tīng)覺(jué)特性,在嘈雜環(huán)境中聽(tīng)不到耳語(yǔ)聲的現(xiàn)象是掩蔽效應(yīng),利用這一效應(yīng)就可以在存在幅度很大的聲音時(shí)對(duì)其相鄰頻段分配較少的比特?cái)?shù),而對(duì)電平在掩蔽門限以下的信號(hào)根本就不分配比特?cái)?shù)[7] 。迄今為止產(chǎn)生了許多開(kāi)發(fā)音頻信號(hào)的高效率編碼。其中具有代表性的就有根據(jù)尤利卡計(jì)劃之一的 1986 年數(shù)字音響地面廣播系統(tǒng)開(kāi)發(fā)計(jì)劃開(kāi)發(fā)的 MUSICAM,