【正文】
,都充分體現(xiàn)了三維人臉建模技術(shù)的非凡魅力。人們所期待的人機(jī)界面是比圖形用戶界面具有更簡單、更自然、更友好、更一致的界面設(shè)計(jì)風(fēng)格。Automatic 3D Face Authentication [J]. In Image and Vision Computing,PP 315321,Mar 2000.]。(3)游戲娛樂 自出現(xiàn)三維游戲以來,三維人臉建模技術(shù)就在游戲制作中占有重要的地位。這一切將歸功于三維人臉建模技術(shù)。如果說普通電話是“順風(fēng)耳”的話,那么可視電話既是“順風(fēng)耳”又是“千里眼”了,它是一種語音通信和多媒體通信相結(jié)合的產(chǎn)物。(5)醫(yī)學(xué)領(lǐng)域 在醫(yī)學(xué)領(lǐng)域中,三維人臉建模技術(shù)主要適用于心理與行為研究和面部美容手術(shù)整形治療等方面。心理學(xué)家能夠在計(jì)算機(jī)上利用三維模型來完成他們的實(shí)驗(yàn),這比用真人進(jìn)行研究更加方便快捷;在進(jìn)行面部整形手術(shù)之前,可以利用三維模型來模擬手術(shù)過程和手術(shù)結(jié)果,以得出合理的手術(shù)方案,以最大程度的降低手術(shù)風(fēng)險(xiǎn)。學(xué)生可以隨時(shí)隨地與類似真人的虛擬老師進(jìn)行互動(dòng)學(xué)習(xí),營造良好的學(xué)習(xí)氛圍,增強(qiáng)了學(xué)生的學(xué)習(xí)積極性。 (7)人臉識(shí)別 人臉識(shí)別技術(shù)屬于生物特征識(shí)別技術(shù),是對生物體本身的特征來區(qū)分生物個(gè)體。特別是近些年來,三維人臉識(shí)別技術(shù)已經(jīng)逐漸成熟,與二維人臉識(shí)別相比,它具有更高的精確性和魯棒性,而且也具有更廣闊的應(yīng)用前景和更大的市場潛力,因而它必定會(huì)成為研究的熱點(diǎn)方向。 國內(nèi)外研究現(xiàn)狀1972年P(guān)arke[[] Park F I. Computer generated animation of faces [A], In: Proceedings of ACM annual conference[C], boston Massachusetts, United States,1999:451457.]制作了世界上第一個(gè)人臉參數(shù)模型,人臉參數(shù)模型的基本原理是利用不同參數(shù)來描繪不同的人臉表情特征。Parke首次利用計(jì)算機(jī)來模擬三維人臉模型,他使用將近400個(gè)頂點(diǎn)組成的250個(gè)多邊形來表示人臉皮膚,采用余弦插值算法計(jì)算連續(xù)表情的中間圖像,從而實(shí)現(xiàn)人臉表情動(dòng)畫。當(dāng)前,使用最為廣泛的三維人臉模型是統(tǒng)計(jì)模型和網(wǎng)格模型。對這些測量數(shù)據(jù)利用變分技術(shù)進(jìn)行處理,最后利用B樣條曲面表示三維模型。微軟研究院Zhang和Liu[[] Liu Z, Zhan Z, JaCobs C, et al. Rapid modeling, of animated faces from video[R] Technical Report M5RTR 200011 Microsoft Research, Microsoft Corporation, WA, 2000. ]等人在藝術(shù)家的幫助下,構(gòu)造了一種中性人臉網(wǎng)格模型。三維數(shù)據(jù)信息可以通過物理設(shè)備激光掃描儀獲取。德國學(xué)者Blanz和Vette[[] Blanz V, Vetter T. A morphahle model for the synthesis of 3D face [A]. In: SIGGRAPH Proceedings[C], Orlando,FL :7178.]創(chuàng)建了一個(gè)包含三維距離信息和表面紋理信息的頭部數(shù)據(jù);康柏劍橋研究所的Waters[[]Waters K, Terzopoulos D. Modeling。多倫多大學(xué)的Lee[[] Lee Y C,Terzopoulos D,Waters K. Realistic face modeling for animation[A].In: SIGGRAPH Proceeding[C],Los Angeles,:5562.]等人利用激光掃描儀獲取的三維幾何數(shù)據(jù)信息和紋理信息,通過變換通用人臉網(wǎng)格模型構(gòu)建特定人臉模型?;诙S圖像的三維人臉建模,利用普通相機(jī)拍攝的二維圖像為基礎(chǔ)進(jìn)行三維人臉建模。 SIGGRAPH Procceeding[c],Orlando,FL,USA,1998:7584.]等人采用多幅圖像變形三維通用人臉模型,他們使用的通用模型是Toronto大學(xué)的線框模型。整個(gè)調(diào)整過程包括三部分:首先利用計(jì)算機(jī)視覺技術(shù)標(biāo)定相機(jī)的定標(biāo)參數(shù)和各個(gè)圖像的變形參數(shù),并且計(jì)算出各個(gè)特征點(diǎn)的三維空間坐標(biāo);然后,利用散亂數(shù)據(jù)插值技術(shù),根據(jù)特征點(diǎn)的位置來調(diào)整非特征點(diǎn)的位移;最后,對模型進(jìn)行微調(diào),在模型的頂點(diǎn)之間和圖像的對應(yīng)點(diǎn)之間插入附加點(diǎn),得到具有真實(shí)感的三維人臉模型?,F(xiàn)有的技術(shù)多處于理論研究的探索階段。 國內(nèi)研究現(xiàn)狀國內(nèi)在該領(lǐng)域起步較晚,最早的三維人臉建模研究始于上世紀(jì)90年代末,經(jīng)過近些年的研究,國內(nèi)不少研究者也對人臉建模和動(dòng)畫技術(shù)抱有濃厚的興趣,不同的研究機(jī)構(gòu)在該領(lǐng)域作了許多研究工作。中國科技大學(xué)根據(jù)正側(cè)面人臉圖像構(gòu)建了三維人臉模型并建造了基本的面部表情動(dòng)畫[[] 王奎武,董蘭芳, [J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2002,14(1):2125.];中科院計(jì)算技術(shù)研究所在表情分析與識(shí)別研究中獲得不錯(cuò)的效果[[] 金輝, [J].計(jì)算機(jī)學(xué)報(bào),2000,23(6):602608.];清華大學(xué)采用三角樣條曲面進(jìn)行面部建模和動(dòng)畫研究,取得了一些成果[[] [D].北京:清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系, 2002: 25.];中科院自動(dòng)化研究所使用激光掃描儀獲取三維數(shù)據(jù),為后續(xù)建模工作奠定了基礎(chǔ)[[] [D].北京:中國科學(xué)院自動(dòng)化研所,2000:5865.]。CG國家重點(diǎn)實(shí)驗(yàn)室在曲線/曲面建模、真實(shí)感圖形繪制、計(jì)算機(jī)動(dòng)畫等方面取得了很大成就。所以現(xiàn)在越來越趨向于綜合多種技術(shù)構(gòu)建三維人臉模型。這一特性使很多研究者熱衷于使用二維人臉照片重建三維人臉模型,本文就是以正交照片為基礎(chǔ),提出一種改進(jìn)的構(gòu)造三維人臉模型算法。 本文研究內(nèi)容本文研究基于二維正、側(cè)面人臉照片的三維人臉建模,研究內(nèi)容包括以下幾個(gè)方面:(1),導(dǎo)出通用人臉模型,對該模型的數(shù)據(jù)信息根據(jù)建模要求進(jìn)行分類提取,并把它轉(zhuǎn)化為適合本實(shí)驗(yàn)研究的數(shù)據(jù)格式進(jìn)行保存,為后續(xù)的建模工作做好數(shù)據(jù)準(zhǔn)備。(3)根據(jù)MPEG4的FDP標(biāo)準(zhǔn)選擇特征點(diǎn)。(4)對通用人臉模型進(jìn)行整體變換,使通用人臉模型與特定人臉在外部輪廓和五官位置上大致相一致。(5)合成全視角人臉紋理圖像,使用基于列特征的匹配方法,確定出圖像的重疊區(qū)域,然后采用直方圖匹配的方法進(jìn)行灰度調(diào)整,使用加權(quán)平滑算法完成圖像的無縫拼接。(6)采用微軟公司的Visual C++ ,實(shí)現(xiàn)特定人臉模型的紋理貼圖,得到具有真實(shí)感的三維人臉。介紹三維人臉建模技術(shù)的研究背景和研究意義,分析近年來國內(nèi)外對該技術(shù)的研究現(xiàn)狀。第2章,基于圖像的三維人臉建模方法回顧。第3章,通用人臉模型的建立與人臉特征點(diǎn)的提取。然后,參照FDP標(biāo)準(zhǔn),根據(jù)人臉特征點(diǎn)分布情況,從正側(cè)面人臉照片中交互提取人臉特征點(diǎn)。采用徑向基函數(shù)插值方法對通用人臉模型進(jìn)行變形。第5章,真實(shí)感人臉紋理圖映射。最后利用金字塔方法進(jìn)行圖像二次融合,最終得到自然平滑的人臉全景紋理圖,為后續(xù)工作做好準(zhǔn)備。第6章,總結(jié)與展望。第二章 基于圖像的三維人臉建模方法回顧特定三維人臉模型的構(gòu)建過程分為三個(gè)階段:三維通用人臉模型的選擇、特定三維人臉模型的變換、真實(shí)感紋理映射。因而,采用二維人臉圖像構(gòu)建三維人臉模型的技術(shù)研究近些年來成為人們關(guān)注的熱點(diǎn)。雖然構(gòu)造具有真實(shí)感的三維人臉存在一定的困難,但在該領(lǐng)域己經(jīng)取得了一些成果?,F(xiàn)有的建模方法主要集中在人臉的建模和渲染兩部分,據(jù)此我們把三維人臉模型構(gòu)建的方法大致分為兩種類型:基于的幾何的方法和基于圖像的方法[[] 徐琳,袁保宗, [J].軟件學(xué)報(bào), 2003, 14(4): 804810.]。其包含的主要的方法如圖21所示。 圖22 基于圖像的人臉造型方法每種方法都是根據(jù)一些具體的實(shí)際問題提出來的,是對各種方法的綜合結(jié)果 ,因而上述的各種三維建模方法之間存在密切的聯(lián)系,在具體進(jìn)行特定三維人臉建模過程中,應(yīng)該根據(jù)實(shí)際情況將幾種不同的建模方法綜合運(yùn)用,特別是假如基于圖像的方法能夠結(jié)合人臉的幾何數(shù)據(jù),將會(huì)使模型更具真實(shí)感。 基于幾何的人臉建模方法Parke首次把基于幾何的構(gòu)建模型方法應(yīng)用在計(jì)算機(jī)中生成虛擬三維人臉模型。Automatic interpretation and coding of face images using flexible models [J]Parke設(shè)定人臉模型的差別可以利用拓?fù)鋷缀谓Y(jié)構(gòu)上的變換來區(qū)分,他通過變換通用人臉模型的參數(shù)構(gòu)造幾個(gè)不同形狀的人臉模型,使用雙線性插值來構(gòu)造不同的人臉形狀。隨后Parke據(jù)此方法原理有創(chuàng)造性的提出一些實(shí)現(xiàn)人臉動(dòng)畫的方法,下面主要介紹一些比較有代表性的建模方法及其思想原理。很多面部表情都可以由參數(shù)的組合來提供。而且參數(shù)化方法的另一個(gè)局限是如果用兩個(gè)跟同一個(gè)頂點(diǎn)相關(guān)的參數(shù)去調(diào)整模型的話,無法用一個(gè)合理的方案來解決問題。(2)向量肌肉方法 向量肌肉方法是在形變變量可以波及到的范圍內(nèi),用模擬肌肉運(yùn)動(dòng)的方式來改變面部形狀,從而達(dá)到模型形變的目的。通過肌肉控制來實(shí)現(xiàn)模型的參數(shù)化調(diào)整,但這些參數(shù)只是一種抽象的表示方法。(3)樣條偽肌肉方法 阿爾伯特多邊形人臉模型被廣泛應(yīng)用在很多領(lǐng)域,然而它無法詳細(xì)刻畫人臉的柔韌性和光滑性,難以在任意區(qū)域內(nèi)平滑地變形具有固定拓?fù)浣Y(jié)構(gòu)的人臉多邊形模型。利用樣條肌肉模型可以據(jù)此達(dá)到建模的目的。(4)多層彈性網(wǎng)格方法 一個(gè)多層彈性網(wǎng)格是為了達(dá)到更可靠地模擬人臉物理行為的目的而將一個(gè)質(zhì)點(diǎn)彈簧結(jié)構(gòu)拓展為三個(gè)緊密相連的網(wǎng)格層。Lee等人根據(jù)Waters和Terzopoulos早期的研究成果構(gòu)建了一個(gè)基于物理的皮膚和肌肉層的綜合模型[[] , face modeling for animation [J]. Siggraph proceedings,1995:4550.]。該綜合體造型用三棱柱體元素來實(shí)現(xiàn),它分為表皮、筋膜和顱骨曲面,影響肌肉拉力的彈簧元素連接筋膜和頭蓋骨層,皮膚的彈性是由連接表皮和筋膜的彈簧元素模擬。(5)人類學(xué)方法 在構(gòu)造特定的人臉模型時(shí),立體圖像和激光掃描被用于獲取全視角紋理和幾何細(xì)節(jié)。并且由于現(xiàn)在還沒有完全有效的對應(yīng)點(diǎn)自動(dòng)匹配方法,如果在得到的數(shù)據(jù)上特征點(diǎn)信息比較隱蔽,就需要人工干預(yù)調(diào)節(jié)[[] ., Kalra,P., MagnenatThalmann, with the Ballamp。 Metaphor, Proc [C]. Graphics Interface’,Canada,2003:152159.]。該算法首先需要構(gòu)建一個(gè)包含測試人臉參數(shù)數(shù)據(jù)信息的數(shù)據(jù)庫,并此作為先驗(yàn)知識(shí);然后,通過將最小中值二次誤差估計(jì)的原理算法應(yīng)用于數(shù)據(jù)庫中,根據(jù)正面的人臉參數(shù)信息估計(jì)出側(cè)面人臉的參數(shù)信息,通常通過幾個(gè)正面的人臉參數(shù)線性組合可以得到側(cè)面人臉的深度參數(shù);最終通過自適應(yīng)得到三維人臉模型,并進(jìn)行紋理映射,得到具有真實(shí)感的三維人臉模型[[] , and . An Anthropometric Face Model using Variational Technique [J].’98,1998:6774.]。這種變形方法的實(shí)現(xiàn)需要的頂點(diǎn)數(shù)遠(yuǎn)遠(yuǎn)少于目標(biāo)網(wǎng)格的頂點(diǎn)數(shù),因?yàn)榭梢岳蒙y數(shù)據(jù)插值算法得到其余頂點(diǎn)[[] 王剛,高新波, [J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(8):10121015.]。該算法首先在人臉外部輪廓、嘴巴、眉毛、鼻子和眼睛上選取一些特征點(diǎn)標(biāo)識(shí),特征點(diǎn)的個(gè)數(shù)和位置選擇決定了一般網(wǎng)格變形的效果 。(7)臉部動(dòng)作編碼系統(tǒng) 臉部動(dòng)作編碼系統(tǒng)(FACS)是根據(jù)人臉的生理結(jié)構(gòu)特征來描述眼睛、嘴巴和面部肌肉等動(dòng)作。Essa等人利用Modular Eigenspace方法來處理適配方面的問題。利用這些特征點(diǎn)可以控制圖像變形,通過變形,可以使個(gè)性化的人臉圖像與通用人臉模型相匹配[[] White , Omlin . Hear features for FACS AU recognition [C]. International Conference on Automatic Face and Gesture :26.]。通過用自由變形、隨機(jī)噪聲變形、定點(diǎn)編輯、或者數(shù)字化生物體來控制已有的模型產(chǎn)生新的特定人臉模型[[] Aleksic,Katsaggelos, facial expression recognition using facial animation parameters and multistream HMMs[C].IEEE Transactions on Information Forensics and Security,2006,1(1):311.]。通過利用數(shù)字化生物體或雕塑工藝品,或用自由變形技術(shù)、隨機(jī)噪聲變形、或定點(diǎn)編輯等方法來操作已有的模型產(chǎn)生新的人臉模型[[]龔勛,[J].,21(14): 43564361.]。(1)插值 插值技術(shù)為臉部動(dòng)畫提供了一個(gè)比較直觀的方法。當(dāng)有四幀畫面時(shí),就可以利用雙線性插值函數(shù)來實(shí)現(xiàn),與線性插值相比,雙線性插值更能容易表現(xiàn)生動(dòng)逼真的面部表情。雖然插值能夠簡單快速的產(chǎn)生基本臉部動(dòng)畫,但它無法創(chuàng)建大范圍內(nèi)具有真實(shí)感的人臉造型,因而該特性限制了它的應(yīng)用范圍。(2)基于統(tǒng)計(jì)的人臉渲染 Thomas Vetter和Volker Blanz基于統(tǒng)計(jì)的建模方法提出了利用人臉圖像庫來建模的方法,使用一張照片就可以得到個(gè)性的人臉模型。該方法的優(yōu)點(diǎn)是最終得到的模型逼真,不需要人工干預(yù),需要的信息量較少,但不足是必須事先建立龐大的人臉庫,即使人臉庫再大,也不可能包括世界上的所有人臉形態(tài),因此對人臉的模擬在一定程度上起到了限制作用。Oka等人創(chuàng)建了一個(gè)完整的真實(shí)感人臉表情和動(dòng)畫的動(dòng)態(tài)紋理映射系統(tǒng),每次調(diào)整三維物體的幾何結(jié)構(gòu)或觀察點(diǎn)時(shí),就會(huì)構(gòu)造一幅新的紋理映射圖像用于對象的最佳顯示[[] YANG Huizhong, ZHANG Suzhen, TAO Zhenlin, et al. A fault diagnosis method for polymeric reaction pro