【正文】
第1章 多媒體技術基本概念 多媒體的定義媒體●所謂媒體(medius)就是指表示和傳播信息的載體文字、數據、聲音、圖形、圖像等都屬于媒體。媒體分類●感覺媒體(Perception medium)感覺媒體指的是能直接作用于人們的感覺器官,從而能使人產生直接感覺的媒體。如文字、數據、聲音、圖形、圖像等。在多媒體計算機技術中,我們所說的媒體一般指的是感覺媒體?!癖硎久襟w(Representation medium)表示媒體指的是為了傳輸感覺媒體而人為研究出來的媒體,借助于此種媒體,能有效地存儲感覺媒體或將感覺媒體從一個地方傳送到另一個地方。如語言編碼、電報碼、條形碼等?!耧@示媒體(Presentation medium)顯示媒體指的是用于通信中使電信號和感覺媒體之間產生轉換用的媒體。如輸入、輸出設備,包括鍵盤、鼠標器、顯示器、打印機等。●存儲媒體(Storage medium)存儲媒體指的是用于存放表示媒體的媒體。如紙張、磁帶、磁盤、光盤等?!駛鬏斆襟w(Transmission medium)傳輸媒體指的用于傳輸某種媒體的物理媒體。如雙絞線、電纜、光纖等。多媒體“多媒體(Multimedia)”實際是“多媒體技術”的同義詞,在這里,“多媒體技術”又是指“多媒體計算機技術(Multimedia Computer Technology)”?!穸嗝襟w計算機技術的定義:計算機綜合處理多種媒體信息,使多種信息建立邏輯連接,集成為一個系統(tǒng)并具有交互性。多媒體計算機技術的主要特性●多樣性●集成性●交互性 多媒體計算機的基本技術和關鍵技術 視頻和音頻數據壓縮和解壓縮技術多媒體數據壓縮及編碼技術是多媒體系統(tǒng)的關鍵技術。數字化的聲音和圖像數據量非常大,例如,一分鐘的聲音信號約為:660KB~10MB;一幅800*;一秒鐘全活動視頻畫面約為22MB。在未壓縮的情況下,實現動態(tài)視頻及立體聲的實時處理,對目前的微機來說是無法實現的。因此,必須對多媒體信息進行實時壓縮和解壓縮。數據壓縮技術與多媒體技術的發(fā)展是相輔相成的。研究結果表明,選用合適的數據壓縮技術,有可能將原始文字量數據壓縮到原來的1/2左右,語音數據量壓縮到原來的1/2~1/10,圖像數據量壓縮到原來的1/2~1/60。對聲音數據的壓縮一般采用去掉重復代碼和去掉聲音數據中的無聲音信號序列兩種方法。對靜止圖像壓縮廣泛采用JPEG算法標準。由于用計算機的中央處理器CPU來完成JPEG算法花費的時間太長,所以都是用專門的JPEG算法信號處理器來完成運算。對視頻圖像壓縮算法有MPEG、DVI、。這些算法是由相應的算法信號處理器來 超文本與超媒體技術超文本(Hypertext)是一種新穎的文本信息管理技術,是一種典型的數據庫技術。它是一個非線性的結構,以結點為單位組織信息,在結點與結點之間通過表示它們之間關系的鏈加以連接,構成表達特定內容的信息網絡,用戶可以有選擇地查閱自己感興趣的文本。若這種表達信息方式不僅是文本,還包括圖像、聲音等形式則稱為超媒體(Hypermedia)系統(tǒng)。 多媒體的發(fā)展多媒體技術的發(fā)展歷程:●1984年美國Apple公司推出被認為是代表多媒體技術興起的Machintosh系列機。●1985年美國Commodore公司的Amiga計算機問世,成為多媒體技術先驅產品之一?!?986年3月飛利浦和索尼兩家公司宣布發(fā)明了交互式光盤系統(tǒng)(CDI),這是集文字、圖像和聲音于一體的多媒體系統(tǒng)。●1987年3月,美國RCA公司的薩諾夫研究實驗室展示了交互式數字影像系統(tǒng)(DVI),這是以PC技術為基礎,用標準光盤來存儲和檢索活動影像、靜止圖像、聲音和其他數據。多媒體個人計算機(MPC)標準:;;。練習題:媒體中的()指的是能直接作用于人們的感覺器官,從而能使人產生直接感覺的媒體。A 感覺媒體 B 表示媒體 C 顯示媒體 D 存儲媒體多媒體技術的主要特性有:(1)多樣性、(2)集成性、(3)交互性、(4)實時性A 僅(1) B (1)、(2) C (1)、(2)、(3) D 全部下列哪種說法不正確?A 有格式的數據才能表達信息的含義B 不同的媒體所表達信息的程序不同C 媒體之間的關系也代表著信息D 任何媒體之間都可以直接進行相互轉換媒體中的()指的是為了傳送感覺媒體而人為研究出來的媒體。借助于此種媒體,便能更有效地存儲感覺媒體或將感覺媒體從一個地方傳送到遙遠的另一個地方。A 感覺媒體 B 表示媒體 C 顯示媒體 D 存儲媒體請根據多媒體的特性判斷以下哪些屬于多媒體的范疇?(1)交互式視頻游戲、(2)有聲圖書、(3)彩色畫報、(4)彩色電視A 僅(1) B (1)、(2) C (1)、(2)、(3) D 全部下列哪些媒體屬于感覺媒體?(1)語音、(2)圖像、(3)語音編碼、(4)文本A (1)、(2) B (1)、(3)C (1)、(2)、(4) D (2)、(3)、(4)目前的研究表明,選用合適的數據壓縮技術,可將語音數據量壓縮到原來的()。A 1/2 B 1/2~1/10 C 1/2~1/20 D 1/2~1/40下列哪些不是多媒體核心軟件?(1)AVSS、(2)AVK、(3)DOS、(4)Amiga VisionA (3) B (4) C (3)、(4) D (1)、(3)1985年,美國Commodore公司的()是多媒體技術的先驅產品之一。A Macintosh B CDI C Amiga D DVI11987年展示的()用標準光盤來存儲和檢索活動影像、靜止圖像、聲音和其他數據。A CDI B MPC C CDROM D DVI1下列哪些是多媒體技術的發(fā)展方向?(1)高分辯率,提高顯示質量、(2)高速度化,縮短處理時間、(3)簡單化,便于操作、(4)智能化,提高信息識別能力A (1)、(2)、(3) B (1)、(2)、(4)C (1)、(3)、(4) D 全部1下列哪些特征不是多媒體技術的主要特性:(1)實時性、(2)多樣性、(3)集成性、(4)交互性A 僅(1) B (1)、(2) C (1)、(2)、(3) D 全部1媒體中的()指的是用于通信中使電信號和感覺媒體之間產生轉換用的媒體。A 感覺媒體 B 表示媒體 C 顯示媒體 D 存儲媒體1下列哪些是多媒體計算機的發(fā)展趨勢?(1)CSCW、(2)文字識別和輸入、(3)自然語言理解和機器翻譯、(4)機器人視覺和計算機視覺A (1)、(2)、(3) B (1)、(2)、(4) C (1)、(3)、(4) D 全部 第2章 音頻、視頻信息獲取和處理 聲音卡和音頻信息聲音是一種波,它有兩個基本參數:頻率和幅度。凡是通過聲音形式傳遞的信息媒體,都屬于聽覺媒體,主要包括波形聲音、語音和音樂。現在公認的聲音質量分為四級:●數字激光唱盤(CDDA)質量:10Hz~20000Hz●調頻無線電廣播(FM)質量:20Hz~15000Hz●調幅無線電廣播(AM)質量:50Hz~7000Hz●電話質量:200Hz~3400Hz在多媒體計算機中只有經過數字化后的聲音才能播放與處理。音頻數字化主要涉及到音頻信號的采樣、量化和編碼。聲音卡正是完成音頻數字化處理的主要多媒體計算機硬件設備。多媒體涉及到以下幾個方面的音頻處理技術:●音頻采集●文語轉換●聲音編碼/解碼●語音識別●音樂合成 聲音卡的功能和分類處理音頻信號的PC插卡是音頻卡(Audio Card),又稱聲音卡,聲音卡處理的音頻媒體有數字化聲音(WAVE)、合成音樂(MIDI)、CD音頻。聲音卡通常帶有自己的CPU,具有較高的智能性和靈活性。聲音卡的分類聲音卡的分類主要是根據其采樣量化的位數來確定的,通常分為8位、16位和32位聲卡。聲音卡的主要功能●錄制、編輯和回放數字聲音文件●控制、混合各聲源的音量●在錄制和回放數字聲音文件時執(zhí)行壓縮/解壓縮●采用語音合成技術讓電腦朗讀英文文本●具有MIDI接口,支持通用MIDI●具備內部FM合成器或波表合成器●具備CDROM驅動器接口(IDE或SCSI)●支持至少一種主要的聲卡軟件標準(Adlib,Sound Blaster Pro,Microsoft Sound System,Roland MPU401和MT32等)●支持全雙工功能,即能同時錄音和放音,該功能主要用于可視電話和會議系統(tǒng) 聲音卡的選擇及應用聲音卡的基本技術指標●采樣頻率●量化位數●聲道數●內部聲音混合調節(jié)器●合成器 音樂合成和MIDIMIDI(Musical Instrument Digital Interface)是指樂器數字接口,是數字音樂的國際標準。任何電子樂器,只要有處理MIDI消息的微處理器,并有合適的硬件接口,都可以成為一個MIDI設備。 視頻卡和視頻信息處理●模擬視頻●數字視頻●視頻數字化:在一段時間內以一定的速度對視頻信號進行捕獲并加以采樣后形成數字化數據的處理過程。影像視頻(又稱數字視頻、數字電影),簡稱視頻,由一幅幅幀序列組成,這些幀以一定的速率播放,使觀察者得到連續(xù)運動的感覺。模擬視頻成本低、還原度好;數字視頻長時間保存質量不降低、可以進行創(chuàng)造性編輯。●全屏幕視頻●全運動視頻視頻在處理過程中與電視技術有非常密切的關系。電視主要有三大制式,即NTSC、PAL、SECAM。NTSC是1953年美國研制成功的一種兼容彩電制式,主要在美國、日本、臺灣等地區(qū)使用,此制式規(guī)定:每秒30幀視頻畫面,水平掃描線為525條,水平分辨率為240~400個像素點,采用隔行掃描方式,場頻為60Hz,行頻為15634Hz。PAL是1962年在西德誕生,主要在中國及歐洲大多數地區(qū)使用,此制式規(guī)定:每秒25幀,每幀625行,每行240~400個像素點,隔行掃描方式,場頻為50Hz,行頻為15625Hz。SECAM是由法國人提出,主要在法國、俄羅斯、非洲地區(qū)使用,此制式規(guī)定:每秒25幀,每幀625行,每行625個像素點,場頻為50Hz,行頻為15625Hz?!褚曨l信號的采集:將視頻信號經硬件(視頻捕捉卡)數字化后,再將數字化數據加以存儲。動態(tài)視頻對于顏色空間的表示有多種情況,最常見的是R,G,B三維彩色空間。也還有其他彩色空間表示,如Y,U,V(Y為亮度,U,V為色差),H,S,I(色調,飽和度,強度)等,并且還可以通過坐標變換而相互變換。 視頻卡的功能和種類視頻卡是基于PC機的一種多媒體視頻信號處理平臺,它可以匯集視頻源、聲頻源和激光視盤機(Laser Video Disc Player)、錄像機(VCR)、攝像機(Camera)等的信息,經過編輯或特技處理而產生非常漂亮的畫面,這些畫面可以被捕捉、數字化、凍結、存儲、輸出及進行其他的操作。對畫面的修正、像素顯示調整、縮放功能等都是視頻卡支持的標準功能。視頻卡的分類●視頻捕捉卡(Video Capture Card)將視頻信號連續(xù)轉換成計算機存儲的數字信號保存在計算機中或在VGA顯示器上顯示。又稱為視頻采集卡●視頻壓縮卡(JPEG/MPEG Compression Card)能夠實時完成壓縮的視頻捕捉卡。價格較高●視頻播放卡實現將壓縮保存在計算機中的視頻信號在計算機的顯示器上播放出來。又稱為電影回放卡、MPEG解壓縮卡●電視卡將標準的NTSC、PAL、SECAM電視信號轉換成VGA信號在計算機屏幕上顯示。這類卡也稱為TVVGA卡或電視調諧卡(TV Turner),與下面的TV編碼器又合稱為電視轉換卡(Video Conversion Card)?!馮V編碼器(TV Coder)將計算機的VGA信號轉換為NTSC、PAL、SECAM等標準的信號在電視上播放或進行錄像,這類卡也稱為P