【正文】
第1章 多媒體技術(shù)基本概念 多媒體的定義媒體●所謂媒體(medius)就是指表示和傳播信息的載體文字、數(shù)據(jù)、聲音、圖形、圖像等都屬于媒體。媒體分類●感覺媒體(Perception medium)感覺媒體指的是能直接作用于人們的感覺器官,從而能使人產(chǎn)生直接感覺的媒體。如文字、數(shù)據(jù)、聲音、圖形、圖像等。在多媒體計(jì)算機(jī)技術(shù)中,我們所說的媒體一般指的是感覺媒體?!癖硎久襟w(Representation medium)表示媒體指的是為了傳輸感覺媒體而人為研究出來的媒體,借助于此種媒體,能有效地存儲(chǔ)感覺媒體或?qū)⒏杏X媒體從一個(gè)地方傳送到另一個(gè)地方。如語言編碼、電報(bào)碼、條形碼等?!耧@示媒體(Presentation medium)顯示媒體指的是用于通信中使電信號(hào)和感覺媒體之間產(chǎn)生轉(zhuǎn)換用的媒體。如輸入、輸出設(shè)備,包括鍵盤、鼠標(biāo)器、顯示器、打印機(jī)等?!翊鎯?chǔ)媒體(Storage medium)存儲(chǔ)媒體指的是用于存放表示媒體的媒體。如紙張、磁帶、磁盤、光盤等。●傳輸媒體(Transmission medium)傳輸媒體指的用于傳輸某種媒體的物理媒體。如雙絞線、電纜、光纖等。多媒體“多媒體(Multimedia)”實(shí)際是“多媒體技術(shù)”的同義詞,在這里,“多媒體技術(shù)”又是指“多媒體計(jì)算機(jī)技術(shù)(Multimedia Computer Technology)”?!穸嗝襟w計(jì)算機(jī)技術(shù)的定義:計(jì)算機(jī)綜合處理多種媒體信息,使多種信息建立邏輯連接,集成為一個(gè)系統(tǒng)并具有交互性。多媒體計(jì)算機(jī)技術(shù)的主要特性●多樣性●集成性●交互性 多媒體計(jì)算機(jī)的基本技術(shù)和關(guān)鍵技術(shù) 視頻和音頻數(shù)據(jù)壓縮和解壓縮技術(shù)多媒體數(shù)據(jù)壓縮及編碼技術(shù)是多媒體系統(tǒng)的關(guān)鍵技術(shù)。數(shù)字化的聲音和圖像數(shù)據(jù)量非常大,例如,一分鐘的聲音信號(hào)約為:660KB~10MB;一幅800*;一秒鐘全活動(dòng)視頻畫面約為22MB。在未壓縮的情況下,實(shí)現(xiàn)動(dòng)態(tài)視頻及立體聲的實(shí)時(shí)處理,對(duì)目前的微機(jī)來說是無法實(shí)現(xiàn)的。因此,必須對(duì)多媒體信息進(jìn)行實(shí)時(shí)壓縮和解壓縮。數(shù)據(jù)壓縮技術(shù)與多媒體技術(shù)的發(fā)展是相輔相成的。研究結(jié)果表明,選用合適的數(shù)據(jù)壓縮技術(shù),有可能將原始文字量數(shù)據(jù)壓縮到原來的1/2左右,語音數(shù)據(jù)量壓縮到原來的1/2~1/10,圖像數(shù)據(jù)量壓縮到原來的1/2~1/60。對(duì)聲音數(shù)據(jù)的壓縮一般采用去掉重復(fù)代碼和去掉聲音數(shù)據(jù)中的無聲音信號(hào)序列兩種方法。對(duì)靜止圖像壓縮廣泛采用JPEG算法標(biāo)準(zhǔn)。由于用計(jì)算機(jī)的中央處理器CPU來完成JPEG算法花費(fèi)的時(shí)間太長,所以都是用專門的JPEG算法信號(hào)處理器來完成運(yùn)算。對(duì)視頻圖像壓縮算法有MPEG、DVI、。這些算法是由相應(yīng)的算法信號(hào)處理器來 超文本與超媒體技術(shù)超文本(Hypertext)是一種新穎的文本信息管理技術(shù),是一種典型的數(shù)據(jù)庫技術(shù)。它是一個(gè)非線性的結(jié)構(gòu),以結(jié)點(diǎn)為單位組織信息,在結(jié)點(diǎn)與結(jié)點(diǎn)之間通過表示它們之間關(guān)系的鏈加以連接,構(gòu)成表達(dá)特定內(nèi)容的信息網(wǎng)絡(luò),用戶可以有選擇地查閱自己感興趣的文本。若這種表達(dá)信息方式不僅是文本,還包括圖像、聲音等形式則稱為超媒體(Hypermedia)系統(tǒng)。 多媒體的發(fā)展多媒體技術(shù)的發(fā)展歷程:●1984年美國Apple公司推出被認(rèn)為是代表多媒體技術(shù)興起的Machintosh系列機(jī)?!?985年美國Commodore公司的Amiga計(jì)算機(jī)問世,成為多媒體技術(shù)先驅(qū)產(chǎn)品之一?!?986年3月飛利浦和索尼兩家公司宣布發(fā)明了交互式光盤系統(tǒng)(CDI),這是集文字、圖像和聲音于一體的多媒體系統(tǒng)。●1987年3月,美國RCA公司的薩諾夫研究實(shí)驗(yàn)室展示了交互式數(shù)字影像系統(tǒng)(DVI),這是以PC技術(shù)為基礎(chǔ),用標(biāo)準(zhǔn)光盤來存儲(chǔ)和檢索活動(dòng)影像、靜止圖像、聲音和其他數(shù)據(jù)。多媒體個(gè)人計(jì)算機(jī)(MPC)標(biāo)準(zhǔn):;;。練習(xí)題:媒體中的()指的是能直接作用于人們的感覺器官,從而能使人產(chǎn)生直接感覺的媒體。A 感覺媒體 B 表示媒體 C 顯示媒體 D 存儲(chǔ)媒體多媒體技術(shù)的主要特性有:(1)多樣性、(2)集成性、(3)交互性、(4)實(shí)時(shí)性A 僅(1) B (1)、(2) C (1)、(2)、(3) D 全部下列哪種說法不正確?A 有格式的數(shù)據(jù)才能表達(dá)信息的含義B 不同的媒體所表達(dá)信息的程序不同C 媒體之間的關(guān)系也代表著信息D 任何媒體之間都可以直接進(jìn)行相互轉(zhuǎn)換媒體中的()指的是為了傳送感覺媒體而人為研究出來的媒體。借助于此種媒體,便能更有效地存儲(chǔ)感覺媒體或?qū)⒏杏X媒體從一個(gè)地方傳送到遙遠(yuǎn)的另一個(gè)地方。A 感覺媒體 B 表示媒體 C 顯示媒體 D 存儲(chǔ)媒體請根據(jù)多媒體的特性判斷以下哪些屬于多媒體的范疇?(1)交互式視頻游戲、(2)有聲圖書、(3)彩色畫報(bào)、(4)彩色電視A 僅(1) B (1)、(2) C (1)、(2)、(3) D 全部下列哪些媒體屬于感覺媒體?(1)語音、(2)圖像、(3)語音編碼、(4)文本A (1)、(2) B (1)、(3)C (1)、(2)、(4) D (2)、(3)、(4)目前的研究表明,選用合適的數(shù)據(jù)壓縮技術(shù),可將語音數(shù)據(jù)量壓縮到原來的()。A 1/2 B 1/2~1/10 C 1/2~1/20 D 1/2~1/40下列哪些不是多媒體核心軟件?(1)AVSS、(2)AVK、(3)DOS、(4)Amiga VisionA (3) B (4) C (3)、(4) D (1)、(3)1985年,美國Commodore公司的()是多媒體技術(shù)的先驅(qū)產(chǎn)品之一。A Macintosh B CDI C Amiga D DVI11987年展示的()用標(biāo)準(zhǔn)光盤來存儲(chǔ)和檢索活動(dòng)影像、靜止圖像、聲音和其他數(shù)據(jù)。A CDI B MPC C CDROM D DVI1下列哪些是多媒體技術(shù)的發(fā)展方向?(1)高分辯率,提高顯示質(zhì)量、(2)高速度化,縮短處理時(shí)間、(3)簡單化,便于操作、(4)智能化,提高信息識(shí)別能力A (1)、(2)、(3) B (1)、(2)、(4)C (1)、(3)、(4) D 全部1下列哪些特征不是多媒體技術(shù)的主要特性:(1)實(shí)時(shí)性、(2)多樣性、(3)集成性、(4)交互性A 僅(1) B (1)、(2) C (1)、(2)、(3) D 全部1媒體中的()指的是用于通信中使電信號(hào)和感覺媒體之間產(chǎn)生轉(zhuǎn)換用的媒體。A 感覺媒體 B 表示媒體 C 顯示媒體 D 存儲(chǔ)媒體1下列哪些是多媒體計(jì)算機(jī)的發(fā)展趨勢?(1)CSCW、(2)文字識(shí)別和輸入、(3)自然語言理解和機(jī)器翻譯、(4)機(jī)器人視覺和計(jì)算機(jī)視覺A (1)、(2)、(3) B (1)、(2)、(4) C (1)、(3)、(4) D 全部 第2章 音頻、視頻信息獲取和處理 聲音卡和音頻信息聲音是一種波,它有兩個(gè)基本參數(shù):頻率和幅度。凡是通過聲音形式傳遞的信息媒體,都屬于聽覺媒體,主要包括波形聲音、語音和音樂?,F(xiàn)在公認(rèn)的聲音質(zhì)量分為四級(jí):●數(shù)字激光唱盤(CDDA)質(zhì)量:10Hz~20000Hz●調(diào)頻無線電廣播(FM)質(zhì)量:20Hz~15000Hz●調(diào)幅無線電廣播(AM)質(zhì)量:50Hz~7000Hz●電話質(zhì)量:200Hz~3400Hz在多媒體計(jì)算機(jī)中只有經(jīng)過數(shù)字化后的聲音才能播放與處理。音頻數(shù)字化主要涉及到音頻信號(hào)的采樣、量化和編碼。聲音卡正是完成音頻數(shù)字化處理的主要多媒體計(jì)算機(jī)硬件設(shè)備。多媒體涉及到以下幾個(gè)方面的音頻處理技術(shù):●音頻采集●文語轉(zhuǎn)換●聲音編碼/解碼●語音識(shí)別●音樂合成 聲音卡的功能和分類處理音頻信號(hào)的PC插卡是音頻卡(Audio Card),又稱聲音卡,聲音卡處理的音頻媒體有數(shù)字化聲音(WAVE)、合成音樂(MIDI)、CD音頻。聲音卡通常帶有自己的CPU,具有較高的智能性和靈活性。聲音卡的分類聲音卡的分類主要是根據(jù)其采樣量化的位數(shù)來確定的,通常分為8位、16位和32位聲卡。聲音卡的主要功能●錄制、編輯和回放數(shù)字聲音文件●控制、混合各聲源的音量●在錄制和回放數(shù)字聲音文件時(shí)執(zhí)行壓縮/解壓縮●采用語音合成技術(shù)讓電腦朗讀英文文本●具有MIDI接口,支持通用MIDI●具備內(nèi)部FM合成器或波表合成器●具備CDROM驅(qū)動(dòng)器接口(IDE或SCSI)●支持至少一種主要的聲卡軟件標(biāo)準(zhǔn)(Adlib,Sound Blaster Pro,Microsoft Sound System,Roland MPU401和MT32等)●支持全雙工功能,即能同時(shí)錄音和放音,該功能主要用于可視電話和會(huì)議系統(tǒng) 聲音卡的選擇及應(yīng)用聲音卡的基本技術(shù)指標(biāo)●采樣頻率●量化位數(shù)●聲道數(shù)●內(nèi)部聲音混合調(diào)節(jié)器●合成器 音樂合成和MIDIMIDI(Musical Instrument Digital Interface)是指樂器數(shù)字接口,是數(shù)字音樂的國際標(biāo)準(zhǔn)。任何電子樂器,只要有處理MIDI消息的微處理器,并有合適的硬件接口,都可以成為一個(gè)MIDI設(shè)備。 視頻卡和視頻信息處理●模擬視頻●數(shù)字視頻●視頻數(shù)字化:在一段時(shí)間內(nèi)以一定的速度對(duì)視頻信號(hào)進(jìn)行捕獲并加以采樣后形成數(shù)字化數(shù)據(jù)的處理過程。影像視頻(又稱數(shù)字視頻、數(shù)字電影),簡稱視頻,由一幅幅幀序列組成,這些幀以一定的速率播放,使觀察者得到連續(xù)運(yùn)動(dòng)的感覺。模擬視頻成本低、還原度好;數(shù)字視頻長時(shí)間保存質(zhì)量不降低、可以進(jìn)行創(chuàng)造性編輯?!袢聊灰曨l●全運(yùn)動(dòng)視頻視頻在處理過程中與電視技術(shù)有非常密切的關(guān)系。電視主要有三大制式,即NTSC、PAL、SECAM。NTSC是1953年美國研制成功的一種兼容彩電制式,主要在美國、日本、臺(tái)灣等地區(qū)使用,此制式規(guī)定:每秒30幀視頻畫面,水平掃描線為525條,水平分辨率為240~400個(gè)像素點(diǎn),采用隔行掃描方式,場頻為60Hz,行頻為15634Hz。PAL是1962年在西德誕生,主要在中國及歐洲大多數(shù)地區(qū)使用,此制式規(guī)定:每秒25幀,每幀625行,每行240~400個(gè)像素點(diǎn),隔行掃描方式,場頻為50Hz,行頻為15625Hz。SECAM是由法國人提出,主要在法國、俄羅斯、非洲地區(qū)使用,此制式規(guī)定:每秒25幀,每幀625行,每行625個(gè)像素點(diǎn),場頻為50Hz,行頻為15625Hz?!褚曨l信號(hào)的采集:將視頻信號(hào)經(jīng)硬件(視頻捕捉卡)數(shù)字化后,再將數(shù)字化數(shù)據(jù)加以存儲(chǔ)。動(dòng)態(tài)視頻對(duì)于顏色空間的表示有多種情況,最常見的是R,G,B三維彩色空間。也還有其他彩色空間表示,如Y,U,V(Y為亮度,U,V為色差),H,S,I(色調(diào),飽和度,強(qiáng)度)等,并且還可以通過坐標(biāo)變換而相互變換。 視頻卡的功能和種類視頻卡是基于PC機(jī)的一種多媒體視頻信號(hào)處理平臺(tái),它可以匯集視頻源、聲頻源和激光視盤機(jī)(Laser Video Disc Player)、錄像機(jī)(VCR)、攝像機(jī)(Camera)等的信息,經(jīng)過編輯或特技處理而產(chǎn)生非常漂亮的畫面,這些畫面可以被捕捉、數(shù)字化、凍結(jié)、存儲(chǔ)、輸出及進(jìn)行其他的操作。對(duì)畫面的修正、像素顯示調(diào)整、縮放功能等都是視頻卡支持的標(biāo)準(zhǔn)功能。視頻卡的分類●視頻捕捉卡(Video Capture Card)將視頻信號(hào)連續(xù)轉(zhuǎn)換成計(jì)算機(jī)存儲(chǔ)的數(shù)字信號(hào)保存在計(jì)算機(jī)中或在VGA顯示器上顯示。又稱為視頻采集卡●視頻壓縮卡(JPEG/MPEG Compression Card)能夠?qū)崟r(shí)完成壓縮的視頻捕捉卡。價(jià)格較高●視頻播放卡實(shí)現(xiàn)將壓縮保存在計(jì)算機(jī)中的視頻信號(hào)在計(jì)算機(jī)的顯示器上播放出來。又稱為電影回放卡、MPEG解壓縮卡●電視卡將標(biāo)準(zhǔn)的NTSC、PAL、SECAM電視信號(hào)轉(zhuǎn)換成VGA信號(hào)在計(jì)算機(jī)屏幕上顯示。這類卡也稱為TVVGA卡或電視調(diào)諧卡(TV Turner),與下面的TV編碼器又合稱為電視轉(zhuǎn)換卡(Video Conversion Card)?!馮V編碼器(TV Coder)將計(jì)算機(jī)的VGA信號(hào)轉(zhuǎn)換為NTSC、PAL、SECAM等標(biāo)準(zhǔn)的信號(hào)在電視上播放或進(jìn)行錄像,這類卡也稱為P