freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

圖像有損壓縮技術(shù)的研究畢業(yè)論文-wenkub

2022-11-03 08:28:38 本頁面
 

【正文】 5 日 主 要 研 究 內(nèi) 容 、 方 法 和 要 求 研究內(nèi)容: 論文研究的主要內(nèi)容是 圖像有損壓縮技術(shù)。 進 度 計 劃 ~:收集查閱資料,了解課題研究背景; ~:完成開題報告,確定論文結(jié)構(gòu)安排; ~:撰寫論文并完成初稿; ~:按照學校要求對論文進行修改,完成終稿; ~: 準備答辯的相關(guān)工作。在多媒體應(yīng)用中,常見的壓縮方法有:預(yù)測編碼,變換編碼,矢量量化 編碼 , 分形編碼 等,混合編碼是近年來廣泛采用的方法。根據(jù)各種格式設(shè)計的不同,有損數(shù)據(jù)壓縮都 會產(chǎn)生丟失 :壓縮與解壓文件都會帶來漸進的質(zhì)量下降。并得出圖像有損壓縮技術(shù)的特點和優(yōu)勢,以及在未來壓縮領(lǐng)域中的應(yīng)用方向。而對大量圖像數(shù)據(jù)進行傳輸要保證其傳輸?shù)馁|(zhì)量、速度等,對其進行存儲也要考慮其大小 容量等。圖像數(shù)據(jù)之所以可以進行壓縮,主要是因為一般原始圖像數(shù)據(jù)是高度相關(guān)的,都含有大量的冗余信息。有損壓縮經(jīng)常用于壓縮音頻、灰度或彩色圖像和視頻對象等,因為它們并不要求精確的數(shù)據(jù)。 2 第 一 章 圖像壓縮技術(shù)的研究及進展 第一節(jié) 圖像壓縮技術(shù)概述 圖像壓縮就是減少表示數(shù)字圖像時需要的數(shù)據(jù)量。但是每種技術(shù)出現(xiàn)的同時,都 有制約其發(fā)展的一面。 圖像數(shù)據(jù)之所以可以進行壓縮,主要是因為一般原始圖像數(shù)據(jù)是高度相關(guān)的,都含有大量的冗余信息。它在較低的計算復(fù)雜度下,能提供較高的壓縮比與保真度 [3]。因此,更高壓縮率以及更多功能的新一代靜止影像壓縮技術(shù) JPEG2020就誕生了。 JPEG2020的新特征有: JPEG2020 作為 JPEG 的升級版,具有良好的低比特率性能,特別是對細節(jié)豐富的圖像以 的比特率進行壓縮時,總體上其壓縮率比 JPEG 高約 30%左右 ; JPEG2020 同時支持有損和無損壓縮;而 JPEG 只支持有損壓縮 ; JPEG2020 能實現(xiàn)漸進傳送。 MPEG 最初的三個任務(wù)是制定 , 10Mb/s, 40Mb/s 的壓縮編碼標準,即 MPEG MPEG MPEG3,后因 MPEG2 的功能使 MPEG3 多余,故MPEG3 被撤消。 MPEG1 追求高的壓縮比,去除圖像序列的時間冗余度,同時滿足多媒體等隨機存取的要求。 MPEG2 所能提供的傳輸率在 3~10Mb/s 間,在 NTSC 制下的分辨率可達720486;可提供廣播級的視像和 CD 級的音質(zhì);向下兼容 MPEG1,使得大多數(shù) MPEG2解碼器可播放 MPEG1 格式的數(shù)據(jù),如 VCD; MPEG2 除了作為 DVD 的指定標準外,還可以用于為廣播 、有線電視網(wǎng)、電纜網(wǎng)絡(luò)以及衛(wèi)星直播提供廣播級的數(shù)字視頻; MPEG2可提供一個較廣范圍的壓縮比,以適應(yīng)不同畫面質(zhì)量、存儲容量以及帶寬的要求。由于 MPEG4 的中心是基于內(nèi)容與交互性的,它就不再對低碼率范圍做出特別要求。 MPEG4 利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最少數(shù)據(jù)獲得最佳圖像質(zhì)量。 MPEG7 的應(yīng)用范圍廣泛,既可以應(yīng)用于存儲,也可用于流式應(yīng)用(如廣播、將模型加入 Inter 等)。 5 MPEG21的基本框架要素包括數(shù)字項目說明、內(nèi)容表示、數(shù)字項目的識別和描述、內(nèi)容管理和使用、知識產(chǎn)權(quán)管理和保護、終端和網(wǎng)絡(luò)、事件報告等。經(jīng)過研究與努力, 1988 年形成草案, 1990 年 12 月通過 ITUT 的 [7]建議。它建議采用中間格式 CIF( Common Intermediate Format)和 QCIF( Quarter CIF)解決不同制式通信的矛盾;解決了編碼算法問題。之后, ITUT 又對其進行了補充,以提高編碼效率,增強編碼功能。另外, 還在 基本編碼算法的基礎(chǔ)上提供了四種可選編碼模式:非限制運動矢量模式、基于語法的算術(shù)編碼模式、高級預(yù)測模式以及 PB 幀模式。通 6 過使用去方塊效應(yīng)濾波器,降低分辨率更新模式和修正量化模式等新技術(shù),重建圖像的主觀質(zhì)量顯著提高。該標準于 2020 年 3 月完成,在 ITUT 中被稱為 Remendation H .264 而在ISO/IEC 中成為 MPEG4 標準的第 10 部分( ISO/IEC 1449610 AVC,簡稱 MPEG410)。數(shù)字圖像數(shù)據(jù)量的壓縮按應(yīng)用不同可分為以下三類: ① 信息保持型數(shù)據(jù)壓縮 ( 無損壓縮 ): 它要求壓縮圖像的比特數(shù)而不丟失任何信息。 ② 保真度型數(shù)據(jù)壓縮 : 傳送的圖像應(yīng)該能夠適應(yīng)通信的通道限制,若接收端是人觀看的情況,由于人眼的生理特性不需要過高的空間分辨率和灰度分辨率,因此在壓縮過程中允許丟失一些人感覺不到的信息,這就是一種允許微量失真的圖像壓縮。例如識別軍艦類型、巡航導(dǎo)彈地形識別等只要輪廓信息就可以了。 第四節(jié) 圖像壓縮技術(shù)的發(fā)展趨勢 從國際數(shù)據(jù)壓縮技術(shù)的發(fā)展尤其是 MPEG 的發(fā)展可以看出,基于內(nèi)容的圖像壓縮編碼方法是未來編碼的發(fā)展趨勢。元數(shù)據(jù)是指詳細的描述音 /視頻信息的基本元素,利用元數(shù)據(jù)來描述音視頻對象的同時也就完成了編碼,因為此時編碼的對象是圖像的一種描述而不再是圖像本身。 本章重點對現(xiàn)代圖像壓縮技術(shù)進行概括性介紹。最后分別介紹了圖像壓縮技術(shù)的分類。 第一節(jié) 有損壓縮概述 有損壓縮 [10]是對利用了人類是絕對圖像或聲波中的某些頻率成分不敏感的特性,允許壓縮過程中損失一定的信息;雖然不能完全回復(fù)原始數(shù)據(jù),但是所損失的部分對理解原始圖像的影響縮小有損壓縮, 卻換來了大得多的壓縮比。因為人的眼睛對光線比較敏感,光線對景物的作用比顏色的作用更為重要,這就是有損壓縮技術(shù)的基本依據(jù)。當在 如果使用了有損壓縮的圖像僅在屏幕上顯示,可能對圖像質(zhì)量影響不太大,至少對于人類眼睛的識別程度來說區(qū)別不大。有損數(shù)據(jù)壓縮方法是經(jīng)過壓縮、解壓的數(shù)據(jù)與原始數(shù)據(jù)不同但是非常接近的壓縮方法。它是與無損數(shù)據(jù)壓縮對應(yīng)的壓縮方法。所謂冗余度是由于一副圖像的各像素之間存在著很大的相關(guān)性,可利用一些編碼的方法刪去它們,從而達到減少冗余壓縮數(shù)據(jù)的目的。在圖像的同一行相鄰像素之間,相鄰像素之間,活動圖像的相鄰幀的對應(yīng)像素之間往往存在很強的相關(guān)性,去除或減少這些相關(guān)性,也即去除或減少圖像信息中的冗余度也就實現(xiàn)了對數(shù)字圖像的有損壓縮。人的視覺對于邊緣急劇變化不敏感 ( 視覺掩蓋效應(yīng) ) ,對顏色分辨力弱,利用這些特征可以在相應(yīng)部分 , 適當降低編碼精度而使人從視覺上并不感覺到 10 圖像質(zhì)量的下降,從而達到對數(shù)字圖像有損壓縮的目的。 第三節(jié) 本章小結(jié) 在上一章的基礎(chǔ)上,本章則是介紹了圖像壓縮技術(shù)中的一個重要成員,圖像有損壓縮技術(shù)。 11 第 三 章 圖像有損壓縮的主要編碼技術(shù) 雖然人們總是期望無損壓縮,但冗余度很少的信息對象用無損壓縮技術(shù)并不能得到可接受的結(jié)果。有損壓縮編碼不具有可恢復(fù)性和可逆性,該編碼在壓縮時舍棄 冗余的數(shù)據(jù)。在同等精度要求的條件下,就可以用比較少的比特進行編碼,達到壓縮數(shù)據(jù)的目的。PCM的編碼原理比較直觀和簡單,原理框圖如圖 。最簡單的是只應(yīng)用于數(shù)值,稱為標量量化,另一種是對矢量(又稱為向量)量化。因此,可以說量化也是一 種壓縮數(shù)據(jù)的方法。 DPCM的 組成如圖 ,其中編碼器和解碼器分別完成對預(yù)測誤差量化值的熵編碼和解碼。這樣,將使圖像質(zhì)量大大下降。它的核心想法是 : 利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階 (stepsize)去編碼小的差值,使用大的量化階去編碼大的差值。 自適應(yīng)量化必須有對輸入信號的幅值進行估值的能力,有了估值才能確定相應(yīng)的改變量。而采用固定的預(yù)測參數(shù)往往又得不到較好的性能。為了自適應(yīng)地選擇最佳參數(shù),通常將信源數(shù)據(jù)分區(qū)間編碼,編碼時自動地選擇一組預(yù)測參數(shù),使該實際值與預(yù)測值的均方誤差最小。 20世紀 70年代后,科學家們開始探索比預(yù)測編碼效率更高的編碼方法。小波變換是繼 DCT之后科學家們找到的又一個可以實用的正交變換,它與 DCT各有千秋,因而分別被不同的研究群體所 推崇。變換本身并不進行數(shù)據(jù)壓縮,它只把信號映射到另一個域,使信號在變換域里容易進行壓縮,變換后的樣值更獨立和有序。變換編碼是一種間接編碼方法。當經(jīng)過正交變換后的協(xié)方差矩陣為一對角矩陣,且具有最小均方誤差時,該變換稱為最佳變換,也 稱 KarhunenLoeve變換 [18]( KL變換)。 ,壓縮編碼的極限結(jié)果原則上 可通過那些能夠反映信號產(chǎn)生過程最早階段的模型而得到。 基于模型圖像編碼首先由瑞典 Forchheimer等人于 1983年提出。只有這樣,在發(fā)送端才能獲得與接收端相同的綜合后的重建圖像,正變 換 量化器 編碼器 編碼信號 輸出 原始信號輸 入 解碼信號輸入 編碼信號輸入 反變 換 解碼器 16 并將后者與原始圖像進行 “ 比較 ” ,以確定圖像失真是否低于 “ 某種閾 值 ” ,以便修正模型參數(shù)。傳統(tǒng)的以像素為單位計算原始圖像與重建圖像之間 “ 逼真度 ”(如均方誤差、信噪比)不能測量幾何失真和物理失真等,從原理上講根本不適用于基于模型編碼。由于物體模型的有效性,景物中的物體能夠在語義水平描述。 3D線框模型由 頂點在 3D空間運動的互連多角形復(fù)合而成,將色彩信息映射到該模型上就能實現(xiàn)合成。把許多 AU按照不同的組合方式一起發(fā)生,就形成了臉上的豐富表情。系統(tǒng)的關(guān)鍵技術(shù)是:人物頭、臉及肩部(簡稱人臉) 3D 模型的建立;運動參數(shù)和表情參數(shù)的估計;圖像綜合。目前,基于模型法還是多應(yīng)用于特定的場合,如上述的視頻電話。對于分割后得到的每個實際三維物體,分別用一個物體模型來描述,并用該模型物體在二 18 維圖像平面上的投影(模型圖像)來逼近真實圖像。根據(jù)所假設(shè)的物體模型不同,參數(shù)集會有些變化。但因未能充分利用景物的知識,或只能在低層次上運用物體知識,編碼效率不如基于語義方法。分形編碼法 ( Fractal Coding) 的目的是發(fā)掘自然物體(比如天空、云霧、森林等)在結(jié)構(gòu)上的自相似形,這種自相似形是圖像整體與局部相關(guān)性的表現(xiàn)。分形編碼以其獨特新穎的思想,成為目前數(shù)據(jù)壓縮領(lǐng)域的研究熱點之一。在總圖像的分割中,常常把同類或者相近的物體放在同一子圖中,而把不同的景物,如山脈、河流、沙漠、云霧、森林、草地等,分別置于不同的子圖中。 三、分 形編碼的特點 分形編碼的最顯著的特點是自相似性( selfsimilarity)。這是由于對每塊確定仿射變換時,要對整幅圖像進行相似性搜索,因而較慢。取樣后的信號經(jīng)過量化編碼 ,并合并成一個總的碼流傳送給接收端。對每個子帶分別編碼的好處是: 分 接 譯碼 譯碼 譯碼 頻率搬移 頻率搬移 頻率搬移 帶通濾波 帶通濾波 帶通濾波 ? 1W? 2 Wm? 1fs 2fs fsm 頻率搬移 頻率搬移 頻率搬移 量化編碼 量化編碼 量化編碼 帶通濾波 帶通濾波 帶通濾波 Wm? 2W? 121s WF ?? 221s WF ?? WmF ??22s 復(fù) 用 1? 21 可以利用人耳(或人眼)對不同頻率信號的感知靈敏度不同的特性,在人的 聽覺(或視覺)不敏感的頻段采用較粗糙的量化,從而達到數(shù)據(jù)壓縮的目的。 通過頻帶分裂,各個子帶的取樣頻率可以成倍下降。在傳統(tǒng)的預(yù)測和變換編碼中,首先將信號經(jīng)某種映射變換變成一個數(shù)的序列,然后對其一個一個地進行標量量化編碼。圖 編碼的原理框圖。衡量兩個矢量之間接近程度的度量標準可以用均方誤差準則: ?? ?? kj ijji yxYXd 1 2)(),( ( ) 也可以用其他準則,如: ?? ?? kj ijji yxYXd 1),( ( ) 傳輸時,只需傳輸碼字 Yi的下標 i 在接收端解碼器中,有一個與發(fā)送端相同的碼本 C,根據(jù)下標 i 可簡單地用查表法找到 Yi 作為對應(yīng) X 的近似??梢宰C明,當信源是矢量平衡且遍歷時,若訓(xùn)練序列充分長則兩種算法是等價的。在給定速率下其復(fù)雜度隨矢量維數(shù) K 以指數(shù)形式增長,全搜索矢量量化器性能好但設(shè)備較復(fù)雜。 三、感知編碼 感知編碼將感知知識應(yīng)用于編碼中。大多數(shù)人的聽覺系統(tǒng)對 2kHz~ 5kHz之間的聲音最敏感。例如,同時有兩種頻率的聲音存在,一種是 1000Hz的聲音,另一種是 1100Hz的聲音,但它的強度比前者低 18分貝,在這種情況下, 1100Hz的聲音就聽不到。方框圖的大部分功能都是基于頻域的,因為人的聽覺過程很容易用頻域法理解。方法的選擇要視復(fù)雜度和精度而定。聽覺閾值和掩蔽門限的計算 , 需要對輸入信號進行頻域分解。聲音壓縮算法也同樣可以根據(jù)這種特性 , 去掉更多的冗余數(shù)據(jù)。顯然,低于聽覺閾值的信號在聲音壓縮時可以去掉。心理聲學模型中一個基本的概念就是聽覺系統(tǒng)中存在一個
點擊復(fù)制文檔內(nèi)容
公司管理相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1