【正文】
藍(lán)色色度分量, Cr是紅色色度分量。在 YCbCr空間中,眼特征可以用本文算法提取出來。此時對每一幀的處理實(shí)際上是對一個靜態(tài)圖像的運(yùn)算。 另一個是人臉膚色建模和閾值化的過程中,針對不同背景圖像,分割的效果也可能不理想,這也在一定程度上影響了檢測定位的精度,所以為了能更準(zhǔn)確的分割出人臉區(qū)域,我們可以從人臉的其他特征入手,從而減少閾值分割的非最佳性,并且我們可以在色彩轉(zhuǎn)換之前進(jìn)行光補(bǔ)償來改善顏色的聚類性。 IplImage* Threshold(IplImage* pFrame)。根據(jù)圖像的存儲原理,首先依次從下往上進(jìn)行掃描,出現(xiàn)白色像素的 第一行就是人臉的下邊界,記該行為 y1。用淺膚色類來判斷白種人,用中等膚色類來判斷黃種人,用深膚色類來判斷印第安人。 要通過“ 閾值處理”的方法實(shí)現(xiàn)對單幀人臉圖像的二值化,必須先解決的問題是確定適合的人臉膚色模型。即 )(1 YBkCb ?? 和)(2 YRkCr ?? ,其中 1k 、 2k 為加權(quán)系數(shù)。設(shè)計流程如下: 獲 取 視 頻 幀 圖 像轉(zhuǎn) 換 彩 色 空 間二 值 化后 處 理定 位 人 臉 并 檢 測 出 人 臉 圖 人臉定位和檢測流程圖 RGB 到 YCrCb 色彩模型的轉(zhuǎn)換 我們從視頻中獲取的幀圖像通常是 RGB模型的圖像,在 RGB空間中顏色是有紅、綠、藍(lán)三種顏色按照不同的比例混合而成,這樣的表達(dá)方式不不能準(zhǔn)確的反映出顏色本身的特征。 本章小結(jié) 隨著人機(jī)交互技術(shù)日益成為當(dāng)前研究的一個中心,人臉檢測與跟蹤問題越來越受到重視,成為模式識別與計算機(jī)視覺領(lǐng)域的一個熱點(diǎn)。 ②格子基搜索 ]21[ :這種方法首先將數(shù)據(jù)空間劃分成為有限個單元的網(wǎng)格結(jié)構(gòu),計算都是以單個的單元為對象,處理速度只與把數(shù)據(jù)空間分為多少個單元有關(guān)。 基于貝葉斯濾波的方法實(shí)際上是一種自頂向下的模型驅(qū)動的跟蹤方法。在搜索預(yù)測區(qū)域時,對每一個候選窗口使用雙眼模板匹配進(jìn)行粗篩選 ,跟蹤時使用前一幀結(jié)果,進(jìn)一步求解新的監(jiān)視區(qū)域。 1)基于膚色模型的人臉跟蹤 膚色是人臉最重要而且最明顯的特征,人臉面部膚色特征可以用幾個簡單的參數(shù)來表征, 而且在一定光照條件下基本保持不變。接著以前一幀特征點(diǎn)的坐標(biāo)作為這一幀參考點(diǎn),提取參考點(diǎn)的小波系數(shù),對比新舊小波系數(shù)來估計特征點(diǎn)的新坐標(biāo),從而得到特征點(diǎn)在新幀中的位置,實(shí)現(xiàn)跟蹤目的。例如在視頻圖像運(yùn)動目標(biāo)的提取過程中運(yùn)用的光流法、背景減除法、時域差分等方法均可應(yīng)用到人臉跟蹤上。 (4)基于 支持向量機(jī)的方法 ]16[ :支持向量機(jī) (SVM, Support Vector Machines)是 Vapnik等提出的基于結(jié)構(gòu)風(fēng)險最小化原理的統(tǒng)計學(xué)習(xí)原理,用于分類與回歸問題。 (2)模板大小人為設(shè)定,不能動態(tài)地檢測眼睛的位置。但是該方法面臨的主要問題是由于圖像噪聲、光照、陰影等原因破壞,弱化的局部特征 ,導(dǎo)致該算法失效。人臉器官的關(guān)系可以總結(jié)為一些規(guī)律。再根據(jù)選定的閾值得到其二值化圖像。通過這個膚色模型分布可以得到待檢測彩色圖像中任 意各一個像素點(diǎn)屬于皮膚的概率,對于某像素點(diǎn) s,從 RGB 空間轉(zhuǎn)換到 YCbCr色彩空間得到色度值 (Cb,Cr),則該像素的膚色概率密度可由下式計算得到: )]()( x p [),( 1 mxCmxCrCbp T ???? ? ( ) 式中, TCrCbx ),(? 。因此利用 R、 Q、 B三基色這三個分量來表征顏色是很自然的一種格式。一般都是用膚色檢測加快人臉檢測的速度。本章主要介紹了基于膚色人臉檢測的具體方法,并對視頻幀中單張圖片單人臉進(jìn)行檢測和定位。在人臉檢測方面文章主要討論了基于膚色的檢測方法、基于啟發(fā)式模型的 方法和基于統(tǒng)計模型的方法等幾種主要方法,并利用膚色在 YCrCb 空間的聚類特性來檢測人臉,同時為了去除亮度對膚色的影響,增強(qiáng)檢測的可靠性,采用了亮度補(bǔ)償。 (2)準(zhǔn)確性。此外, MPEG7 標(biāo)準(zhǔn)組織建立了人臉識別草案小組,人臉檢測算法也是一項(xiàng)征集的內(nèi)容,隨著研究的不斷深入,國際上一些權(quán)威期刊,如IJCV(International Journal of Computer Vision)、 CVIU(Computer Vision and Image Understanding)、 PAMI(IEEE Transonic Pattern Analysis and Machine Intelligence)及重要學(xué)術(shù)會議,例如 ICCV(International Conference on Computer Vision)、 CVPR(IEEE Computer Society Conference on Computer Vision and Pattern Recognition) 、ECCV(European Conference on Computer Vision)、 IWVS(IEEE International Workshop on Visual Surveillance)每年都有大量關(guān)于人臉檢測與人臉跟蹤的論文,極大地促進(jìn)了研究學(xué)者的學(xué)術(shù)交流。 在早期的人臉識別問題的研究中,人臉圖像往往具有很強(qiáng)的約束條件 (如無背景圖像 ),因此使人臉檢測問題并未受到很好的重視。它的目的是用計算機(jī)實(shí)現(xiàn)人的視覺功能 —— 對客觀世界的三維場景進(jìn)行感知、理解和解釋 ]1[ 。通過建立膚色模型,經(jīng)自適應(yīng)閾值的二值化處理后,再進(jìn)行膚色分割,將非人臉區(qū)域去除;最終利用眼睛特征定位人臉。 Technology, Southwest Jiaotong University, Chengdu, 610031, China) Abstract Face detection positioning and tracking as a biological feature recognition is an important technique, it is widely used in many aspects. In this article, in order to localize the human face in color images captured from the video accurately, a human face localization algorithm based on skin module and skin color segmentation was presented. Firstly, we build the skin module. Then, the nonface region was removed in color image after binary image processing with adaptive threshold and the skin color segmentation. And finally the human face was localized by using the characteristic the eyes Experiments show that the algorithm is effective to localize the human front face and the face after turning an angle in color images under plex background. key words: face detection and tracking。這里主要有兩類方法:一類是仿生學(xué)的方法,即參照人類視覺系統(tǒng)的結(jié)構(gòu)原理,建立相應(yīng)的處理模塊完成類似的功能和 工作;另一類是工程的方法,即從分析人類視覺過程的功能開始著手。在此應(yīng)用背景之下要求識別系統(tǒng)能夠適應(yīng)一般場 景下的圖像,由此引起的一系列問題使得研究者開始將人臉檢測和跟蹤作為一個獨(dú)立的課題進(jìn)行研究,使其應(yīng)用背景遠(yuǎn)遠(yuǎn)超出人臉識別系統(tǒng)的范疇。圖像或者視頻序場景中存在的背景復(fù)雜、人臉運(yùn)動的非剛性、目標(biāo)遮擋等問題,這對檢測和跟蹤帶來的很大的難度。不降準(zhǔn)確性的同時算法計算復(fù)雜程度相對較小,在現(xiàn)有的硬件條件下,對人臉實(shí)時跟蹤。 本文章節(jié)安排如下: 第 1章為緒論,主要討論了本課題的研究內(nèi)容和背景以及應(yīng)用范圍,分析了人臉檢測 與跟蹤在國內(nèi)外的研究狀況,就這一課題的難點(diǎn)進(jìn)行了論述。本文主要討論靜止圖像中的人臉檢測問題以及動態(tài)圖像序列中的人臉跟蹤問題。它的主要手段就是利用人臉膚色與周圍環(huán)境顏色的差異,通過膚色將人臉與背景環(huán)境區(qū)分開來。它同樣具有 HIS格式中將亮度分優(yōu)點(diǎn),但由于它可以從 RGB格式線性變化得到, YCrCb與 RGB的轉(zhuǎn)換公式為: ???????????????????????????????BGRCrCbY0 . 0 8 1 0 . 4 1 9 0 . 5 0 00 . 5 0 0 0 . 3 3 1 0 . 1 6 90 . 1 1 4 0 . 5 8 7 ( ) YCbCr格式直接應(yīng)用于物體色彩聚類分析的情況不多,相比之下,在其基礎(chǔ)上的變換模型的應(yīng)用更為普遍。這種格式的優(yōu)點(diǎn)在于它將亮度 (V)與反映色彩本質(zhì)特性的兩個參數(shù)即色度 (H)與飽和度 (S)分開。根據(jù)橢圓面積準(zhǔn)側(cè) 214llNSe ?? ( 21,ll 為橢圓軸長 ),若檢測區(qū)域的面積 Se 的值超過閾值,則該區(qū)域包含人臉。 Yang 等 ]9[ 提出了基于鑲嵌圖 (馬賽克圖 )的人臉檢測方法,將人臉的五官區(qū)域分別劃分為不同解析度的馬賽克塊,使用一組規(guī)則進(jìn)行檢驗(yàn),并利用邊緣特征進(jìn)一步驗(yàn)證。 (2)利用眼睛近似物分段來指導(dǎo)搜索潛在的人臉區(qū)域。在這個方法里,人臉檢測問題實(shí)際上轉(zhuǎn)化為統(tǒng)計模式識別的二分類問題。與人臉檢測不同,人臉跟蹤是指在視頻或者圖像序列中確定某個人臉的運(yùn)動軌跡及大小變化的過程。傳統(tǒng)的人臉特征點(diǎn)跟蹤方法通常是在人的臉部畫上標(biāo)識點(diǎn)進(jìn) 行跟蹤。與傳統(tǒng)的在人臉部畫上標(biāo)識點(diǎn)的特征點(diǎn)跟蹤方法不同, KLT算法可以從未加標(biāo)識點(diǎn)的正面人像視頻序列中通過紋理信息直接獲取臉部某些特征點(diǎn)的位移,該文獻(xiàn)還在 KLT算法中加入了基于人臉統(tǒng)計信息的經(jīng)驗(yàn)約束,使 KLT算法更加合理有效。目前的人臉跟蹤技術(shù)大都采用基于膚色模型的方法。他們用這種方法對臉部表情演變的參數(shù)值和形變進(jìn)行恢復(fù),在每個時刻測量高維可變模型的參數(shù)觀測值的正確分布。此方法主要包含以下幾種跟蹤算法:卡爾曼濾波及其改進(jìn)方法,格子基搜索算法(格子濾波),粒子濾波方法。 ③粒子濾波方法 ]22[ :粒子濾波本質(zhì)上是一種基于蒙特卡羅模擬實(shí)現(xiàn)貝葉斯遞推的技術(shù),其核心思想是使用一組帶有相關(guān)權(quán)值的粒子 (隨機(jī)樣本 )來對后驗(yàn)概率密度函數(shù)似然描述,然后基于這些粒子來對狀態(tài)進(jìn)行估計。如何解決特定應(yīng)用場合、特定約束條件下的人臉檢測與跟蹤問題,仍將是該領(lǐng)域研究的主要方向。由此可知,這三個要素是對顏色本身最本質(zhì)的詮釋。在多媒體計算機(jī)中采用的 YCrCb彩色空 間,數(shù)字化后 Y:Cb:Cr為 8:4:4或 8:2:2。忽略膚色亮度值將不會影響對人臉膚色的成功檢測,反而可以減少對大容量的三維 YCrCb彩色空間的處理,轉(zhuǎn)而對易處理的二維 CrCb圖進(jìn)行研究,同時還有助于減少對單幀圖像的計算量。結(jié)果表明式子 (6)能夠很好的實(shí)現(xiàn)人臉區(qū)域分割,效果如下: 圖 原始圖像 圖 閾值化圖像 圖 定位檢測的人臉圖像 后處理 通過二值化操作得到的單幀圖像中白色部分表示這些部分的像素是符合人臉膚色模型的像素,其黑色像素是不符合該模型判別條件的像素。由此得到的坐標(biāo)( x1,y1),( x2,y1),( x1,y2),( x2,y2)所確定的矩形內(nèi)的部分即為人臉區(qū)域。//RGB圖像中人臉標(biāo)定。背景模型的獲取和更新是該方法中的關(guān)鍵。任何一個顏色空間都只是可見光的子集,并不能包含所有可見光。 進(jìn)行光補(bǔ)償能夠有效改善膚色的聚類性。確定閾值二值化圖像時可以多次嘗試或者使用經(jīng)驗(yàn)閾值,但是這兩種方法都不完善,存在速度慢或準(zhǔn)確度不高的缺陷,折中的方法是使用自動閾值。通過進(jìn)一步作眼部特征判斷,可以去除這些部位影響,最終檢測出人臉。本文主要研究了彩色圖片和視頻序列中的人臉檢測與跟蹤的問題,復(fù)雜背景圖像下的多姿態(tài)人臉的檢測與跟蹤也是 研究的重點(diǎn)之一