【正文】
若訓練集中一共有 a個人,每人有 b張不同的人臉圖像,則訓練集中人臉圖像的總數(shù)為 m= ba? ,整個訓練集可記作 ? ?xxx n, 21 ? ,其中每一個向量 Rx qpi ?? 對應一幅人臉 31 圖像。 PCA 人臉識別算法流程圖如圖 : 30 圖 PCA 人臉識別算法流程圖 訓練過程 ( 1)建立訓練集 首先,對輸入的人臉進行圖像預處理,包括幾何歸一化、灰度歸一化等,盡量去除尺度大小、光線明暗等因素給識別過程帶來的不利影響。這樣,原來的人臉圖像識別問題就可以轉(zhuǎn)化為根據(jù)子空間中的訓練樣本點進行模式分類的問題。對訓練集進行主元分析,得到一組特征向量,即低維子空間的標準正交基。經(jīng)典的 PCA 人臉識別方法中,使用的是基于歐氏距離的最近鄰分類器,其分類過程我們將在下節(jié)詳細講解。 首先,需要對圖像之間的相似性進行度 量。其中 k 為訓練圖像的類別數(shù)。下面 27 討論幾種不同的特征值選擇方法。 通過以上討論,我們可以通過下列步驟求出 KL展開式的系數(shù) : (1)求出 X 的自相關矩陣 ? ?XXES T? ,由于沒有類別信息的樣本集的均值向量 ? 常常 沒有意義,所以也可以把數(shù)據(jù)的協(xié)方差矩陣作為 KL坐標系的產(chǎn)生矩陣,這里 ? 是總體均值向量。下面我們對 KL 變換作一個簡單的介紹。映射通常需要遵循兩個準則 : (1)特征空間必須保留測量空間中的主要分類信息; (2)特征空間的維數(shù)必須遠遠低于測量空間的維數(shù)。當識別對象是波形或數(shù)字圖像時,可以計算出來,當識別對象是實物 或某種過程時,這些特征可以用儀表或傳感器測量出來,這樣計算或測量出來的特征叫原始特征。 (3)把訓練圖像和測試圖像分別投影到特征子空間上。 PCA 人臉識別方法原理 將 PCA 方法用于人臉識別,其實是假設所有的人臉都處于一個低維 24 線性空間,而且不同的人臉在這個空間中具有可分性。在人臉圖像的灰度歸一化過程中,采用直方圖均衡化技術進行灰度歸一化處理,部分消除了光照的影響,得到標準的人臉圖像后,就可以進行圖像的特征提取和人臉識別工作了。圖片直方圖均衡化效果對比如圖 所示 : 22 ( c)圖像均衡化前對應的直 ( d)圖像均衡化后對應的直方圖 圖 圖像均衡化前后對應的直方圖示意圖 23 對于 unit8 類圖像, L=256, G=L1,則灰度級 rk 出現(xiàn)的頻數(shù)為 : ? ? ? ? nnhp nrr kkk ?? (21) 其中, k=1,2,... , L, h??rk 表表 k 級像素數(shù), n 表示像素總數(shù)。實驗結(jié)果也表明經(jīng)過幾何歸一化處理后,識別率有了相對程度的提高。其中最近鄰法簡單但是失真較多。圖像的縮放就是把原始圖像中包含的人臉縮放到統(tǒng)一大小,依據(jù)是人眼的坐標。因此,需要對輸入的人臉圖像進行校正,使得不 同情況下的人臉圖像統(tǒng)一到同樣大小,并且人臉的關鍵部位也盡量保持一致。由于 Yale人臉庫中原始圖像包含較多的背景,所以對原始圖像進行了預處理,剪裁出只包含人臉的圖像,并且尺寸歸一化為 92*1120。其最新的人臉庫包括 14051幅灰 度圖像,其中每人 8 張圖像,兩張正臉, 3張從右到左不同側(cè)面角度的圖像,有些人還提供了更多不同視角和不同表情的照片。其中, 35 人為男性, 5 人為女性。下面介紹一些常用的標準數(shù)據(jù)庫。 本節(jié)的預處理工作是在 原始 ORL 人臉庫上進行的。 第二章人臉圖像預處理 圖像的預處理是模式識別過程的一個重要步驟。因此如何解決年齡變化對識別算法的影響并提出具有中長期適應性的人臉識別算法是人臉識別系統(tǒng)必須解決的問題。 (3)識別算法的普適性問題 目前人臉識別中最成功的算法當屬基于統(tǒng)計學習理論的算法。對于人臉識別而言,造成遮擋的原因多種多樣,有可能 的原因包括 :外界景物的遮擋、眼鏡帽子等飾物的遮擋、人臉圖像部分缺失等。姿態(tài) :姿態(tài)的變化分為二維平面上的姿態(tài)變化和三維空間上的姿態(tài)變化。而就目前的研究現(xiàn)狀而言,光照、姿態(tài)、遮擋等干擾因素對檢測算法的影響要遠大于對識別算法的影響。這些困難一方面源于計算機本身學習能力的局限性,另一方面是源于人臉識別技術所具有的復雜 16 性。另一類是視頻圖像的實時匹配,如銀行、海關、公共場合的視頻監(jiān)控、公安系統(tǒng)中罪犯的跟蹤識別等。當前計算機系統(tǒng)的安全管理,通常使用字符和數(shù)字組成的密碼口令管理,此口令容易被遺忘或破解,如果使用人臉作為口令則既方便又安全; (4)在視頻監(jiān)控方面,目前,許多銀行、公司、公共場合等處都設有24 小時的視頻監(jiān)控。目前比較常用的手段是檢查證件。由于罪犯數(shù)據(jù)庫往往很大,如果這項搜索工作由人工完成,不僅效率低,而且容易出錯,因為人在看了上百幅人臉圖像后,記憶力會下降,而由計算機來完成則不會出現(xiàn)此問題; (2)身份證、駕駛證以及其他很多證件上都有照片,現(xiàn)在的證件驗證 15 一般都是由人進行驗證,如果利用人臉識別技術,這項工作就可以交給機器完成,從而實現(xiàn)自動化智能管理。小波包分解是一種多分辨率分析方法,能夠提供良好的面部紋理描述,所以有利于提取面部特征。因此可認為:對以均方誤差為準則的臉部重建來說, PCA 方法是一種最優(yōu)的方法:但從模式分類和辨識的觀點來看, PCA方法則不一定能夠取得最優(yōu)的結(jié)果。 類似于 Eigenface 方法, Fisherface 方法也是采用線性投影技術將人臉圖像從高維圖像空間轉(zhuǎn)化到低維特征子空間。由于人臉的特定構(gòu)造,在這種抽樣方式下,臉部特征帶的出現(xiàn)將服從于一定的順序,所以該模型可以用一個從左到右的隱馬爾可夫模型表示,其中狀態(tài)的轉(zhuǎn)移只能按照從左到右的方式進行。 13 隱馬爾可夫模型的識別方法 隱馬爾可夫模型 (Hidden Markov Model)一般應用于非平穩(wěn)時間序列矢量的統(tǒng)計建模,在語音處理,特別是語音識別中得到廣泛的應用。在尋找最佳匹配方法時,希望能夠同時維持特征數(shù)值接近和局部幾何關系。同樣的,對于一個待識別的人臉圖像也可以定義一個網(wǎng)格 G 及網(wǎng)格上的特征矢量。物體內(nèi)部的空間關系則可以用節(jié)點之間的幾何距離表示。一般來說, BP 算法的收斂速度非常緩慢,學習過程可能需要對整個訓練集進行上千次反復迭代運算,這是神經(jīng)網(wǎng)絡實際應用的一個問題。還有的文獻采用了二進制圖像的等密度區(qū)域或多個局部面部特征作為不同多層感知機的輸入層。因為隱層節(jié)點的數(shù)目 L 通常要遠遠小于輸入層和輸出層的節(jié)點數(shù)目,從而多層感知機將高維德輸入數(shù)據(jù)變換到一個低維子空間中,同時保留了原始數(shù)據(jù)中 最重要的信息。多層感知機由幾層全互連的非線性神經(jīng)組成。 人工神經(jīng)元通常采用非線性的作用函數(shù),當大量神經(jīng)元連接成一個網(wǎng)絡并動態(tài)運行時,則構(gòu)成了一個非線性動力學系統(tǒng)。 神經(jīng)網(wǎng)絡方法 人工神經(jīng)網(wǎng)絡是一種以大量的處理單元 (神經(jīng)元 )為節(jié)點,處理單 元之間實現(xiàn)加權值互連的拓撲結(jié)構(gòu)。改進 的一個思路是針對干擾所在,對輸入圖像作規(guī)范化處理,包括輸入圖像的均值方差歸一化,人臉尺寸歸一化。選擇訓練樣本的散布矩陣作為 KL 變換的生成矩陣,其最大特征向量反映了該樣本集合的最大分布 的方向,但這是圖像統(tǒng)計方法,而不是人臉統(tǒng)計方法。選擇那些正交基形成的子空間則有不同的考慮,與較大特征值對應的一些正交基 (也稱主分量 )能夠表達人臉的大體形狀,而具體細節(jié)需要那些小特征值對應的特征向量 (也稱次 10 分量 )來加以補充描述,因此低頻成分用主分量表示 ,高頻分量用次分量表示。 KL 變換是圖像壓縮的一種最優(yōu)正交變換,人們將它應用 于特征提取,形成了子空間法模式識別的基礎。由于人臉圖像具有相似的形狀和結(jié)構(gòu),人臉 圖像在主分量上的投影過多地反映了光照變化,因此有人提出舍棄人臉圖像在前 3 個特征矢量上的投影,而用人臉圖像在其余特征矢量上的投影作為描述人臉圖像的特征。人臉圖像在前面的特征矢量上的投影有較大的能量,稱為主分量 。 KL變換是圖像壓縮中的一種最優(yōu) 正交變換。所以僅靠增加臉上幾何參數(shù)的數(shù)目來提高人臉識別率是不太現(xiàn)實的。 (2)臉部幾何特征在人臉辨識中的有效性問題,即臉部幾何特征能夠提供多少可供識別的信息量。具體來說,這些幾何參數(shù)一般包括人臉上兩個指定特征點之間的歐式距離、邊緣曲率、角度等等。對于不同人來說,臉上的各個器官,如眼睛、鼻子、嘴巴以及整個臉部的輪廓具有不同的形狀、大小、相對位置和分布情況。這些方法中有的側(cè)重于表述人臉圖像的特征提取,如彈性圖匹配法和傅立葉不變特征法;有的則側(cè)重于分類,如最佳鑒別向量集法、貝葉斯法和神經(jīng)網(wǎng)絡法;而有的則側(cè)重于人臉圖像重構(gòu),如特征臉法和線性子空間法。同時,人臉器官分割的精確度也對人臉特征的提取有一定的影響。 常用的人臉識別方法 對人臉識別方法的研究主要有兩大方向:一是基于人臉圖像局部特征的識別方法;二是基于人臉圖像整體特征的識別方法。 根據(jù)對人臉圖像不同的特征提取方式,我們大致可以人臉識別方法分成 兩種 :一是基于局部特征分析的研究方法 。根據(jù)圖像來源途徑的不同,可以分為動態(tài)和靜態(tài)的人臉識別 。另一種是身份證實,只需要判斷識別對象是否是數(shù)據(jù)庫中個體的一員。除此之外還有 DCT, Gabor變換、分數(shù)階傅里葉變換等都是基于人臉的整體特征提取,還有基于人臉局部特征的提取方法,如利用顯著器官 (眼鏡、眉毛、耳朵、嘴 巴等 )之間的距離關系,以及通過訓練學習求得的局部特征。幾何歸一化主要是指將人臉圖像進行一定的處理變?yōu)橄袼?大小統(tǒng)一且人臉關鍵位置一致的圖片。檢測人臉對于簡單背景的同一人的人臉圖片是比較容易實現(xiàn)的,但當人臉的背景變得復雜,或者圖片中的人臉屬于 多個人時,檢測就會變得相對困難。 一個典型的自動人臉識別系統(tǒng)如圖 所示 ,分為訓練和識別兩個步驟,兩個步驟都需要檢測和定位人臉、人臉圖像的預處理和特征提取和選擇。 (5)物理分類 ((Physical Classification)即對待識別人臉的物理特征進行分類,得出其年齡、性別、種族等相關信息。通常的表示方法有幾何特征 (如歐氏距離、曲率、角度等 )、代數(shù)特征 (如矩陣特征矢量 )、固定特征模板、特征臉等 。從廣義上來說,人臉識別主要包括人臉檢測、人臉表征、人臉鑒別、表情分析和物理分類五個方面。雖然人們可以毫不費力地通過臉部圖像來鑒別互相的身份,然而由于成像過程中各種影響因素的變化常常導致同一個人的人臉圖像發(fā)生非常大的變化,因此建立自動系統(tǒng)完成識別任務是非常具有挑戰(zhàn)性 的。人臉識別作為一種新興的生物識別技術將占據(jù)整個生物特征識別技術 15%20%左右的份額。 目前,各國都加大力度研 究生物識別技術,人臉識別這一最類似人類身份鑒別的方式得到了很多人的關注,很多重要的出入場合都在安裝人臉識別系統(tǒng)。 人臉識別技術作為生物識別技術的一種,以其特有的穩(wěn)足性、方便性、唯一性等特點被愈來愈多地應用于除安全問題外的各種身份識別領域。利用人臉特征進行身份驗證最易被人們接受; (4)存在豐富的現(xiàn)有數(shù)據(jù)。人臉識別技術和其他的生物識別比起來有以下幾個優(yōu)點 : (1)人臉識別可以在隱蔽的條件下進行,適用于安全監(jiān)控 。相對傳統(tǒng)的身份認證方法而言,生物特征認證技術具有不會因當事人遺忘或他人竊取和偽造而進行錯誤判定,比傳統(tǒng)的身份認證方法更加安 全方便、特征唯一、不易偽造、不可竊取。密碼遺失、資料被盜的時間不斷發(fā)生,傳統(tǒng)的安全技術已暴露出重大的缺陷,就會給個人乃至整個社會帶來重大的甚至難以彌補的損失??梢娫诂F(xiàn)代社會中,身份識別己經(jīng)成為人們?nèi)粘I钪薪?jīng)常遇到的一個基本問題。主成分分析 II Research on Face Recognition Based on Principal Component Analysis Abstract Biometrics is a kind of science and technology using individual physiological or behavioral characteristics to verify identity. It provides a highly reliable and robust approach to the identity recognition. Automatic face detection and recognition is one of the most attention branches of biometrics and it is also the one of the most active and challenging tasks for image processing, pattern recognition and puter vision. It is widely applied in mercial and law area, such as mug shots retrieval, realtine video surveillance in security system and cryptography in bank and so on. The