【正文】
圖 15 MPEG4的視頻功能擴(kuò)充 場(chǎng)景描述及其它 場(chǎng)景 描 述 主 要用 于 描述以上單個(gè)的 AV對(duì)象如何在一具體 AV場(chǎng)景座標(biāo)下的組織與同步等問(wèn)題。因而,編碼后的碼流結(jié)構(gòu)見(jiàn)圖 14: 圖 14 類 的 VLBV 核編碼 可見(jiàn), MPEG4 采取了向前兼容 ,同時(shí),也提供了一些高層特性,如基于 內(nèi)容的編碼。為了支持高效壓縮, MPEG4 仍然采用了 MPEGl ,MPEG2中的變換、預(yù)測(cè) 混 合編碼框架。 對(duì) 于 運(yùn)動(dòng)視頻對(duì)象的編碼, MPEG4 采用了 如 圖 12 所示的編碼框圖,以支持圖 像 的編 碼。 對(duì)自然視 頻 對(duì)象的編碼,也是 MPEG4 的 重 點(diǎn)。 視頻對(duì)象編碼 同樣 ,MPEG4 也支持對(duì)自然和合成的視 頻 對(duì)象編碼??梢?jiàn),MPEG4 不是提供一組 角 MIDI 音樂(lè)標(biāo)準(zhǔn)中的“樂(lè)器”。其中的“管弦樂(lè)團(tuán)”是由不同的“樂(lè)器”組成的。事實(shí)上,合成聲音編碼技術(shù)即是一種基 于 知識(shí)庫(kù)的參數(shù)編碼。 圖 11 通用 MPEG4 音頻編碼方框圖 b. 合成聲音 在合成聲 音編碼當(dāng)中, MPEG4 引入了兩個(gè)極有吸 引 力的編碼技術(shù) : 文本到語(yǔ)音 (TexttoSpeech)編碼和樂(lè)譜驅(qū)動(dòng)合成編碼技術(shù)。這些技術(shù)實(shí)質(zhì)上借鑒了己有的音頻編碼標(biāo)準(zhǔn)如 、 以及 MPEGI 和 MPEG2 等。 a. 自然聲音編碼 MPEG4研究比較了現(xiàn)有的各種音頻編碼算法,支持 264 K 的自然聲音編碼。而 且 ,支持音頻的對(duì)象特征。 音頻對(duì)象編碼 視頻音頻的壓縮編碼自然仍是 MPEG4 的核心所在。這個(gè)句法描述語(yǔ)言是對(duì) C++的擴(kuò)展,不僅易 于 表達(dá)其 AV 對(duì)象特性,而 且 也易 于 軟件仿真實(shí)現(xiàn)與模型驗(yàn)證。傳輸接 口 層對(duì)媒體不透明,而對(duì)傳輸是透明的。對(duì)客戶與服務(wù)器之間的控制是通過(guò) DMIF 應(yīng)用接 口 (DAI)。對(duì)信道的處理是由 DMIF 所 產(chǎn) 生的信道標(biāo)識(shí)器決定的,即告訴用戶在哪里能得到所需的信息。傳輸接 口 層在 MPEG4中使用 DMIF 傳輸基本流, 面 向應(yīng)用將網(wǎng)絡(luò)實(shí)現(xiàn)的細(xì) 節(jié) 包裝。 NBit Visual Profile 在 Core Profile 基礎(chǔ)上增加了具有不同像素深度視頻對(duì)象編碼功能,適于監(jiān)控應(yīng)用。 Core Visual Profile 在 Simple Visual Profile 基礎(chǔ)上增加了任意形狀對(duì)象編碼和時(shí)域擴(kuò)展編碼功能,適用于相對(duì)簡(jiǎn)單的內(nèi)容交互應(yīng)用,如 Inter 多媒體應(yīng)用。其中視頻框架又包括 5個(gè)級(jí)別,如下 : Simple Visual Profile 提供矩形視頻對(duì)象高效有容錯(cuò)能力的編碼功能,適合用于移動(dòng)網(wǎng)絡(luò)。每一個(gè)框架又有一個(gè)或多個(gè)級(jí)別 (Level)來(lái)限制計(jì)算的復(fù)雜度 。對(duì)于某一特定的應(yīng)用,只有一部分系統(tǒng)。 靈活的可擴(kuò)展性 可根據(jù)現(xiàn)場(chǎng)帶寬和誤碼率的客觀條件在時(shí)域和空域進(jìn)行擴(kuò)展,時(shí)域擴(kuò)展是在帶寬允 許時(shí)在基本層上的增強(qiáng)層中增加幀率,在帶寬窄時(shí)在基本層中減少幀率 ;空域擴(kuò)展是指對(duì)基本層中的圖像進(jìn)行插值,增加或減少空間分辨率,以達(dá)到充分利用帶寬,使圖像質(zhì)量更好。此外 , MPEG4 還支持基 于 內(nèi)容的可分級(jí)性 。例如在誤碼達(dá)到 1%時(shí) , MPEG1 己無(wú)法播放 ,而 MPEG4 只會(huì)有輕微的邊緣模糊。 通用的訪問(wèn)性 MPEG4 提供了易出錯(cuò)環(huán)境的魯棒性 ,來(lái)保證其在許多無(wú)線和有線網(wǎng)絡(luò)以及存儲(chǔ)介質(zhì)中的應(yīng)用。 采用 MPEG4的視音頻同步錄像所需的硬盤空間約為相同質(zhì)量的 MPEG1 所需空間的 1/10。 MPEG4 的壓縮倍數(shù)高達(dá) 100 倍 , 可以用最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量 , 因此滿足了低碼率的應(yīng)用要求。 良好的魯棒性 MPEG4 具有出色的壓縮效率。視音頻對(duì)象可以是平 面 的或二維立體的。 MPEG4標(biāo)準(zhǔn)的 SNHC 部分允許不同來(lái)源的視音頻對(duì)象集成到一起。又如 , 在一個(gè)大型的交響音樂(lè)會(huì)的現(xiàn)場(chǎng)轉(zhuǎn)播中 , 發(fā)現(xiàn)了一陌生的樂(lè)器 , 它奏出的旋律被其他樂(lè)器的聲音所淹沒(méi) , 通過(guò)對(duì)音頻對(duì)象的操縱 .可以讓這場(chǎng)大型交響音樂(lè)會(huì)變成這個(gè)陌生樂(lè)器的獨(dú)奏音樂(lè)會(huì) , 從 而 好好欣賞它的音色。這是對(duì)今 天 模擬和數(shù)字系統(tǒng)中具有交互 功能的視頻播放器的很好的擴(kuò)展 , 例如它允許信 息 和場(chǎng)景中的運(yùn)動(dòng)對(duì)象相連接 , 可將資源定位器 (URL)關(guān)聯(lián)上場(chǎng)景中的足球運(yùn)動(dòng)員 ,當(dāng)用戶在足球運(yùn)動(dòng)員上 點(diǎn) 擊鼠標(biāo)時(shí)即可啟動(dòng) URL, 從 而 得到關(guān) 于 這個(gè)運(yùn)動(dòng)員的詳細(xì)信 息 。它把一個(gè)視聽(tīng)場(chǎng)景定義成了一系列可再現(xiàn)的視聽(tīng)對(duì)象 , 這些視聽(tīng)對(duì)象在時(shí)間和空間上具有某些相關(guān)聯(lián)的成分。 MPEG4 標(biāo)準(zhǔn)的 特點(diǎn) 及優(yōu)勢(shì) MPEG4 與 MPEG1 和 MPEG2 相比 , 在交互性、抗誤碼性和高效壓縮上都有 巨大的優(yōu)勢(shì)。 而 MPEG4 是對(duì)一幅圖像按內(nèi)容切分塊 ,即在編碼時(shí)將一幅景物分成若干在時(shí)間和空間上相互聯(lián)系的視頻音頻對(duì)象分別編碼后 ,再經(jīng)過(guò)復(fù)用傳輸?shù)浇邮斩?,然后對(duì)不同的對(duì)象分別解碼 ,從 而 組合成所需要的視頻和音頻。 MPEG4 在 MPEG2 基礎(chǔ)上作了很大 的擴(kuò)充 .主要 目 標(biāo)是多媒體應(yīng)用。第一代壓縮編碼方案把視頻序列按時(shí)間先后分為一系列幀, 每 一幀圖像又分成宏塊以進(jìn)行運(yùn)動(dòng)補(bǔ)償和編碼。為此,國(guó)際標(biāo)準(zhǔn)化組織先后 于 1993 年和 1995 年制定了視頻、音頻編碼的國(guó)際標(biāo)準(zhǔn) MPEG1和 MPEG2。 基于 MPEG4 的技術(shù)正在蓬勃發(fā)展,代表著未來(lái)多媒體數(shù)據(jù)壓縮編碼的發(fā)展趨勢(shì),及時(shí)跟蹤和了解 MPEG4 的發(fā)展動(dòng)態(tài),掌握其核心技術(shù),并結(jié)合實(shí)際應(yīng)用在某些關(guān)鍵方向上有所創(chuàng)新和發(fā)展,是一項(xiàng)很有意義的工作。 MPEG4 利用很窄的帶寬,通過(guò)幀重建技術(shù)壓縮和傳輸數(shù)據(jù),以最少的數(shù)據(jù)獲得最佳的圖像質(zhì)量。 在網(wǎng)絡(luò)視頻通信中具有廣闊的應(yīng)用前景。 MPEG4要實(shí)現(xiàn)的目標(biāo)有 : (1)再現(xiàn)被稱為“媒體目標(biāo)”的聽(tīng)覺(jué)、視覺(jué)或視聽(tīng)內(nèi)容單元,這些媒體目標(biāo)可以是自然的或人造的 ; (2)能夠把音效、視覺(jué)、自然合成的對(duì)象組合成音頻、視頻場(chǎng)景 ; 且能允許單獨(dú)對(duì)這些對(duì)象進(jìn)行訪問(wèn)、控制和重用 ; (3)切 換和同步媒體目標(biāo)的數(shù)據(jù),以便它們能在網(wǎng)絡(luò)通道上傳送,提供適合特定媒體目標(biāo)的 QoS ; (4)在接收端產(chǎn)生交互的視聽(tīng)景物,滿足多種業(yè)務(wù)的需要。 從結(jié)構(gòu)上看, MPEG4 標(biāo)準(zhǔn)分為十個(gè)部分 : 系統(tǒng)層、 視頻、音頻、 DMIF、一致性測(cè)試、參考軟件、優(yōu)化的視頻編碼參考軟件、用 IP 網(wǎng)絡(luò)承載 MPEG4 內(nèi)容、參考硬件描述和高級(jí)視頻編碼,前四個(gè)模塊為 MPEG4 的核心模塊 ; 從層次上來(lái)講,可劃分成三個(gè)層次 : 壓縮層,同步層,傳輸層。較之 MPEG 前兩個(gè)圖像壓縮標(biāo)準(zhǔn)而言, MPEG4 為多媒體數(shù)據(jù)壓縮提供了一個(gè)更為廣闊的平臺(tái),它更多定義的是一種格式和框架,而不是具體的算法。這使得 MPEG 組織不得不修改計(jì)劃,針對(duì)應(yīng)用定義一種新編碼概念 —— 基于內(nèi)容的壓縮編碼方法,將基于內(nèi)容的檢索與編碼結(jié)合起來(lái)考慮,在壓縮數(shù)據(jù)中加入描述視頻內(nèi)容的信息,從而使對(duì)多媒體信息的內(nèi)容的訪問(wèn) 可以直接針對(duì)壓縮數(shù)據(jù)進(jìn)行。 ISO的 MPEG4標(biāo)準(zhǔn)的第一版于 1999年 1月正式公布,標(biāo)準(zhǔn)的第二版于 1999年 12 月公布。 MPEG4 就是在這種背景下應(yīng)運(yùn)而生的。 第一章 MPEG4 標(biāo)準(zhǔn) 簡(jiǎn)介 概述 近年來(lái),多媒體技術(shù)飛速發(fā)展,在社會(huì)生活的許多領(lǐng)域得到了廣泛的應(yīng)用。 實(shí)驗(yàn)基礎(chǔ)的硬件環(huán)境是微機(jī)環(huán)境,軟件環(huán)境為 WindowsXP 操作系統(tǒng)平臺(tái),MATLAB 程序開(kāi)發(fā)環(huán)境 。 MPEG4 正在蓬勃發(fā)展,及時(shí)了解和跟蹤它的發(fā)展動(dòng)向,掌握其核心技術(shù),結(jié)合實(shí)際應(yīng)用,是一項(xiàng)很有意義的事情。它定義了音頻、視頻等多媒體數(shù)據(jù)的碼流語(yǔ)法和解碼過(guò)程、互聯(lián)網(wǎng)上的傳輸以及人與媒體交互的一整套框架,覆蓋了多媒體的絕大部分應(yīng)用領(lǐng)域。目前在商業(yè)界發(fā)展最迅速、影響最大、技術(shù)較成熟的多媒體數(shù)據(jù)壓縮編碼國(guó)際標(biāo)準(zhǔn)是 MPEG4。從 、 MPEG 到 MPEG2再到現(xiàn)在的 MPEG MPEG MPEG2 ,標(biāo)準(zhǔn)越來(lái)越成熟,覆蓋的應(yīng)用領(lǐng)域愈來(lái)愈廣泛,尤其是 MPEG4和 等面向低碼率高質(zhì)量的標(biāo)準(zhǔn)對(duì)于實(shí)時(shí)視頻傳輸處理有著非 常 重要的意義。因此,研究如何去除冗余數(shù)據(jù)、高效地表示圖像、進(jìn)行數(shù)據(jù)壓縮,具有重大的實(shí)用價(jià)值。然而,圖像視頻信號(hào)經(jīng)過(guò)數(shù)字化處理之后形成的數(shù)據(jù)量非常龐大,如此龐大的數(shù)據(jù)量不僅存儲(chǔ)開(kāi)銷很大,而且在傳輸中使得通訊設(shè)備的負(fù)荷量很重,甚至承受不了。 關(guān)鍵 詞: MPEG4, 數(shù)字視頻,視頻編碼 ABSTRACT With the development of information technology in 21st century, the munication contents do not only have simple aural and literal information, and people also hope to be provided indubitable, intuitionistic and effective visual information. But the digital video and audio is too huge to store and transmit it. As one of the multimedia pression and coding standards, MPEG4 plays an important role in multimedia field. MPEG4 standard is officially called the general coding of audio and video objects. MPEG4 defines a set of frameworks including syntax and decoding of multimedia dada, transmission on Inter and interaction between human and media. Due to its objectbased idea, it has the virtues of high pression ratio, scalability, interactivity with users and so on. For this reason, it is applied in many fields such as mobile wireless munication. MPEG4 is one of the most significant muftimedium pressions of data coding and decoding international standard, there is the wide application foreground in the territorys such as the industry control and building up of national defense and household amuse and so on. MPEG