【正文】
mage must be pressed when it is stored or discrete cosine transform (DCT) is rising mathematical tool. The technology of image pression based on discrete cosine transform has drawn much attention and has been researched broadly. When a image is transformed by the discrete cosine transform,it has favorable localize characteristic in both timedomain and in the rebuild image the connatural diamonds affection of the discrete cosine transform can be overcame. Furthermore,the WT is identical to Human Visual System .This paper is mainly about the image pression algorithm based on MATLAB, and plete these work:Introduced the theory and technique of image pression,Enumerated the prevalent image pressional evaluation criteria and technical standards, based on the theoretical analysis I understanding the image pression algorithm profoundly. The paper discusses the basic principles and implementation steps of image DCT transform technique. carries research on the algorithm of image pression based on DCT. At the same time, Then the algorithm is simulated by MATLAB,using MATLAB program designed the graphical user interface vividly. Intuitive image to see the image in sharp contrast to before and after pression,and achieved better results.Keywords: Image pression ,DCT transform ,Simulation by MATLAB目 錄摘 要 IABSTRACT II第1章 緒論 1 論文研究背景及意義 1 圖像壓縮技術(shù)的歷史與現(xiàn)狀 1 離散余弦變換及其在圖象壓縮中的應(yīng)用 2 論文研究的主要內(nèi)容 2第2章 圖像壓縮的基本原理 4 圖象壓縮評(píng)價(jià)標(biāo)準(zhǔn) 4 客觀標(biāo)準(zhǔn) 4 主觀標(biāo)準(zhǔn) 5 圖像壓縮技術(shù)標(biāo)準(zhǔn) 5 圖像壓縮的分類 8 圖像壓縮處理技術(shù)基本理論 9 圖像壓縮的基本原理 9 圖像壓縮的基本模型 10第3章 離散余弦變換的MATLAB實(shí)現(xiàn) 12 MATLAB圖像處理工具箱 12 離散余弦變換的定義 12 離散余弦變換的基本原理與算法 13 離散余弦變換的基本原理 13 離散余弦變換算法 15 離散余弦算法的實(shí)現(xiàn) 15第4章 離散余弦變換的界面實(shí)現(xiàn) 17 圖形用戶界面簡(jiǎn)介 17 界面設(shè)計(jì)的MATLAB實(shí)現(xiàn) 17 界面設(shè)計(jì)總體概述 17 界面設(shè)計(jì)具體實(shí)現(xiàn) 18第5章 運(yùn)行結(jié)果顯示及分析 20 離散余弦變換的算法實(shí)現(xiàn) 20 離散余弦變換的界面實(shí)現(xiàn) 20 設(shè)計(jì)過(guò)程中的疑難及改進(jìn) 22結(jié) 論 23參考文獻(xiàn) 24附 錄 25致 謝 27第1章 緒論人們?cè)谧匀唤缰懈惺艿降淖钪匾男畔⒕褪菆D像信息,隨著多媒體技術(shù)和通訊技術(shù)的日益發(fā)展,圖像也成為了信息技術(shù)所處理的重要對(duì)象。圖像信息的數(shù)據(jù)量非常的大,隨著各種成像設(shè)備的分辨率的不斷提高,單幅圖像所包含的數(shù)據(jù)量也越來(lái)越大,大數(shù)據(jù)量的圖像信息會(huì)給存儲(chǔ)器的存儲(chǔ)容量、通信信道的帶寬以及計(jì)算機(jī)的處理速度增加極大的壓力。數(shù)字圖像壓縮編碼的目的就是要以盡可能少的比特?cái)?shù)來(lái)表征圖像,同時(shí)保持恢復(fù)圖像的質(zhì)量,對(duì)圖像編碼和解碼算法的研究,己經(jīng)受到人們?cè)絹?lái)越多的關(guān)注,成為近些年信息技術(shù)中的熱點(diǎn)。在這幾十年的時(shí)間內(nèi),:傳統(tǒng)的壓縮編碼方法和新型圖像編碼方法。然而隨著人們對(duì)這些傳統(tǒng)編碼方法的深入應(yīng)用,也逐漸發(fā)現(xiàn)了這些方法的許多缺點(diǎn):比如在傳統(tǒng)的編碼方法中由于正交變換時(shí)頻局域性很差,變換后的系數(shù)失去了對(duì)原圖像精細(xì)結(jié)構(gòu)的描述,從變換圖像得不到原圖像邊緣輪廓等局部信息,因此,在量化編碼時(shí)無(wú)法采用特殊方法;高壓縮比時(shí)它還導(dǎo)致圖像的邊緣輪廓模糊顯現(xiàn)和出現(xiàn)嚴(yán)重的方塊效應(yīng);而且人類視覺(jué)系統(tǒng)(Humna Visual Sysetm,即HVS)的特性也不易被引入到壓縮算法中。80年代中后期,人們結(jié)合模式識(shí)別、計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺(jué)、神經(jīng)網(wǎng)絡(luò)、小波分析和分形幾何等理論,開始探索圖像信號(hào)壓縮編碼的新途徑。其中離散余弦變換不僅是現(xiàn)在研究的熱點(diǎn),而且這方面的編碼也取得了一些引人注目的成功。離散余弦變換(DCT for Discrete Cosine Transform)是與傅里葉變換相關(guān)的一種變換,它類似于離散傅里葉變換(DFT for Discrete Fourier Transform),但是只使用實(shí)數(shù)。有兩個(gè)相關(guān)的變換,一個(gè)是離散正弦變換(DST for Discrete Sine Transform),它相當(dāng)于一個(gè)長(zhǎng)度大概是它兩倍的實(shí)奇函數(shù)的離散傅里葉變換;另一個(gè)是改進(jìn)的離散余弦變換(MDCT for Modified Discrete Cosine Transform),它相當(dāng)于對(duì)交疊的數(shù)據(jù)進(jìn)行離散余弦變換。這是由于離散余弦變換具有很強(qiáng)的“能量集中”特性:大多數(shù)的自然信號(hào)(包括聲音和圖像)的能量都集中在離散余弦變換后的低頻部分,而且當(dāng)信號(hào)具有接近馬爾科夫過(guò)程(Markov processes)的統(tǒng)計(jì)特性時(shí),離散余弦變換的去相關(guān)性接近于KL變換(KarhunenLo232。例如,在靜止圖像編碼標(biāo)準(zhǔn)JPEG中,在運(yùn)動(dòng)圖像編碼標(biāo)準(zhǔn)JPEG和MPEG的各個(gè)標(biāo)準(zhǔn)中都使用了離散余弦變換。這時(shí)對(duì)應(yīng)第二種類型離散余弦變換中的n通常是8,并用該公式對(duì)每個(gè)88塊的每行進(jìn)行變換,然后每列進(jìn)行變換,得到的是一個(gè)88的變換系數(shù)矩陣。 本文主要研究如何利用MATLAB軟件開發(fā)一個(gè)基于離散余弦算法的圖像壓縮處理界面,為初學(xué)者提供一個(gè)圖像壓縮處理技術(shù)的DCT算法演示及模擬開發(fā)的Graphical User Interface(圖形用戶界面)平臺(tái),供大家學(xué)習(xí)并研究圖像壓縮處理的技術(shù)方法。第2章 圖像壓縮的基本原理數(shù)字圖像從表面上看可以表達(dá)豐富多彩的內(nèi)容,但實(shí)質(zhì)上可以看作在視覺(jué)空間靈敏度范圍內(nèi)對(duì)圖像進(jìn)行空間采樣的一個(gè)個(gè)像素組成,每個(gè)象素點(diǎn)都可以用一組一維或多維的數(shù)字來(lái)表示,如nbit的灰度圖像的每個(gè)象素由0~2n~l之間的某個(gè)數(shù)值來(lái)表示,而真彩色圖像的象素值則由紅(R),綠(G),藍(lán)(B)三種顏色的值來(lái)聯(lián)合表示。直接存儲(chǔ)和傳輸如此龐大的數(shù)據(jù),不僅要消耗巨大的磁盤空間和網(wǎng)絡(luò)帶寬而且還會(huì)極大地增加處理器的負(fù)擔(dān),因此對(duì)圖像進(jìn)行大幅度的數(shù)據(jù)壓縮就顯得尤為重要[3]。我們要做的就是在圖像信號(hào)的最終用戶覺(jué)察不出或能夠忍受這些失真的前提下,進(jìn)一步提高壓縮比,以換取更高的編碼效率。重建圖像的質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)可分為客觀標(biāo)準(zhǔn)和主觀標(biāo)準(zhǔn)兩種。假設(shè)原始圖像表示A=f(i,j),其中i=l,2,…M;j=1,2,…N,經(jīng)壓縮解壓后的圖像為A’=f’(i,j),i=1,2,…M;j=1,2,…N,可以用下列指標(biāo)進(jìn)行評(píng)價(jià):(1)均方誤差MSN ()(2)規(guī)范化均方誤差NMSN ()其中 (3)對(duì)數(shù)信噪比SNR () (4)峰值信噪比PSNR ()評(píng)價(jià)圖像壓縮效果的另外一個(gè)重要指標(biāo)是壓縮比C,它指的是表示原始圖像每象素的比特?cái)?shù)同壓縮后平均每象素的比特?cái)?shù)的比值,也常用每象素比特值(bpp)來(lái)表示壓縮效果。主觀標(biāo)準(zhǔn)采用平均判分MOS(mean opinion score)或多維計(jì)分等方法進(jìn)行測(cè)試,即組織一群足夠多的實(shí)驗(yàn)人員(一般10人以上),通過(guò)觀察來(lái)評(píng)定圖像的質(zhì)量,觀察者給判定圖像打上一定的質(zhì)量等級(jí)比較損傷程度給予圖像進(jìn)行比較等方法,根據(jù)不同的質(zhì)量打上5級(jí)、6級(jí)或7級(jí)的評(píng)分制,最后用平均的辦法得到圖像的分?jǐn)?shù),這樣的評(píng)分雖然很花時(shí)間,但比較符合實(shí)際。圖像質(zhì)量評(píng)分評(píng)價(jià)尺度非常好的圖像5分絲毫看不出圖像質(zhì)量變壞好的圖像4分能看出質(zhì)量變壞,但不妨礙觀看中等的圖像3分清楚看出圖像質(zhì)量變壞,稍妨礙觀看差的圖像2分對(duì)觀看較有影響非常差的圖像1分非常嚴(yán)重的質(zhì)量變壞,基本不能觀看主觀評(píng)價(jià)和客觀評(píng)價(jià)之間有一定聯(lián)系,但不能完全等同,由于客觀評(píng)價(jià)比較便,很有說(shuō)服力,故在一般的圖像壓縮研究中被采用。信息技術(shù)的突出特點(diǎn)是互操作性和全球聯(lián)網(wǎng)。統(tǒng)一的國(guó)際標(biāo)準(zhǔn)是不同國(guó)家地區(qū)和廠商的產(chǎn)品能夠相互兼容和協(xié)調(diào)的基礎(chǔ)。這些標(biāo)準(zhǔn)圖像編碼算法融合了各種性能優(yōu)良的傳統(tǒng)圖像編碼方法,是對(duì)傳統(tǒng)編碼技術(shù)的總結(jié),代表了目前圖像編碼的發(fā)展水平。有關(guān)圖像編碼的若干國(guó)際標(biāo)準(zhǔn)(建議)的名稱、主要目標(biāo)和內(nèi)容以及應(yīng)用范圍如下[4]:(1) (視頻)壓縮編碼的第一個(gè)國(guó)際標(biāo)準(zhǔn)化建議,其全稱為“p64kbit/s(p=1~30)視聽業(yè)務(wù)的視頻編解碼器”。其應(yīng)用目標(biāo)是可視電話和會(huì)議電視,其對(duì)圖像質(zhì)量的要求不很高。1992年作為靜止圖像壓縮算法的國(guó)際標(biāo)準(zhǔn)正式推出。主要應(yīng)用于彩色產(chǎn)值、靜止圖像、可視通訊、印刷出版、新聞圖片、醫(yī)學(xué)和衛(wèi)星圖像的傳輸、檢索和存儲(chǔ)。JPEG2000的主要特征如下:ⅰ.高壓縮率:由于采用離散小波變換,圖像可以轉(zhuǎn)換成一系列“小波”,壓縮比可比JPEG提高10%~30%,而且壓縮后的圖像顯得更加細(xì)膩平滑。ⅲ.漸進(jìn)傳輸:采用JPEG2000格式的圖像支持漸進(jìn)傳輸。ⅳ.感興趣區(qū)域壓縮:可以指定圖片上感興趣的區(qū)域(Region of Interest),然后在壓縮時(shí)對(duì)這些區(qū)域指定壓縮質(zhì)量,或在恢復(fù)時(shí)指定某些區(qū)域的解壓縮要求。ⅵ.容錯(cuò)性。ⅷ.基于內(nèi)容的描述。(4) MPEG1標(biāo)準(zhǔn)MPEG是活動(dòng)圖像專家組Moving Pictuer Experts Group的簡(jiǎn)稱。它是MPEG專家組的第一階段成果,1993年正式通過(guò)為國(guó)際標(biāo)準(zhǔn)。MPEG1主要面向數(shù)字存儲(chǔ)媒體,應(yīng)用于多媒體計(jì)算機(jī)、教育與訓(xùn)練、演示與咨詢服務(wù)、創(chuàng)作與娛樂(lè)、電子出版物、數(shù)字視聽系統(tǒng)VCD以及VOD、交互式電視ITV等領(lǐng)域。MPEG2包括系統(tǒng)、視頻、音頻和測(cè)試,與MPEG1后向兼容。MPEG2在技術(shù)、功能、語(yǔ)法結(jié)構(gòu)、選擇項(xiàng)、可分級(jí)性和應(yīng)用范圍等方面比MPEGMPEG2從技術(shù)上促進(jìn)了計(jì)算機(jī)、廣播電視、數(shù)字通信三大領(lǐng)域的交匯融合,并發(fā)揮出了巨大的作用?!癟erminal for Low Bitrate Multimedia Communation”的主要組成部分。由于低碼率下實(shí)現(xiàn)多媒體通信在技術(shù)上更為困難和復(fù)雜,提供各種業(yè)務(wù),+++。其特點(diǎn)有:ⅰ.基于內(nèi)容的交互性:基于內(nèi)容的多媒體數(shù)據(jù)訪問(wèn)、基于內(nèi)容的碼流操作和編輯。ⅲ.自然的與合成的圖像編碼及其混合編碼。圖像壓縮的效果好與不好,關(guān)鍵要看三樣指標(biāo):一是壓縮比要大,二是壓縮算法簡(jiǎn)單、速度快,三是恢復(fù)效果好。無(wú)損、冗余壓縮:可逆,壓縮比較高,信息保持型數(shù)據(jù)壓縮。圖像編碼也可以按照編碼所在數(shù)據(jù)域主要分為空間域編碼和變換域編碼兩大類,此外還有模型編碼、矢量量化編碼和神經(jīng)網(wǎng)絡(luò)編碼等眾多方法。對(duì)預(yù)測(cè)的要求是必須較為準(zhǔn)確。屬于這類編碼的主要有DPCM、ADPCM等。變換編碼可以消除空間冗余和時(shí)間冗余。(3) 統(tǒng)計(jì)編碼:主要用于對(duì)相互獨(dú)立、無(wú)相關(guān)性的消息序列構(gòu)成的無(wú)記憶信源進(jìn)行壓縮。統(tǒng)計(jì)編碼消除的是信息熵冗余。(4) 模型編碼:利用模型的方法,對(duì)需傳輸?shù)膱D像進(jìn)行參數(shù)估測(cè)。屬于這類編碼方法的如分形編碼等。[6]。大類,前者在解碼時(shí)可以精確地恢復(fù)原圖像,沒(méi)有任何損失;后者在解碼時(shí)只能近似原圖像壓縮是通過(guò)刪除圖像數(shù)據(jù)中冗余的或者不必要的部分來(lái)減小圖像數(shù)據(jù)量的技術(shù),壓縮過(guò)程就是編碼過(guò)程,解壓縮過(guò)程就是解碼過(guò)程?! 〖僭O(shè)有一個(gè)無(wú)記憶的信源,它產(chǎn)生的消息為{ai},1≤i≤N,其出現(xiàn)的概率是已知的,記為P(ai)。信源的平均信息量稱為“熵”(entropy),可以表示為: () 對(duì)上式取以2為底的對(duì)數(shù)時(shí),單位為比特(bits): ()根據(jù)香農(nóng)(Shannon)無(wú)噪聲編碼