【正文】
訓練集 首先,對輸入的人臉進行圖像預處理,包括幾何歸一化、灰度歸一化等,盡量去除尺度大小、光線明暗等因素給識別過程帶來的不利影響。對訓練集進行主元分析,得到一組特征向量,即低維子空間的標準正交基。 首先,需要對圖像之間的相似性進行度 量。下面 27 討論幾種不同的特征值選擇方法。下面我們對 KL 變換作一個簡單的介紹。當識別對象是波形或數(shù)字圖像時,可以計算出來,當識別對象是實物 或某種過程時,這些特征可以用儀表或傳感器測量出來,這樣計算或測量出來的特征叫原始特征。 PCA 人臉識別方法原理 將 PCA 方法用于人臉識別,其實是假設所有的人臉都處于一個低維 24 線性空間,而且不同的人臉在這個空間中具有可分性。圖片直方圖均衡化效果對比如圖 所示 : 22 ( c)圖像均衡化前對應的直 ( d)圖像均衡化后對應的直方圖 圖 圖像均衡化前后對應的直方圖示意圖 23 對于 unit8 類圖像, L=256, G=L1,則灰度級 rk 出現(xiàn)的頻數(shù)為 : ? ? ? ? nnhp nrr kkk ?? (21) 其中, k=1,2,... , L, h??rk 表表 k 級像素數(shù), n 表示像素總數(shù)。其中最近鄰法簡單但是失真較多。因此,需要對輸入的人臉圖像進行校正,使得不 同情況下的人臉圖像統(tǒng)一到同樣大小,并且人臉的關鍵部位也盡量保持一致。其最新的人臉庫包括 14051幅灰 度圖像,其中每人 8 張圖像,兩張正臉, 3張從右到左不同側面角度的圖像,有些人還提供了更多不同視角和不同表情的照片。下面介紹一些常用的標準數(shù)據(jù)庫。 第二章人臉圖像預處理 圖像的預處理是模式識別過程的一個重要步驟。 (3)識別算法的普適性問題 目前人臉識別中最成功的算法當屬基于統(tǒng)計學習理論的算法。姿態(tài) :姿態(tài)的變化分為二維平面上的姿態(tài)變化和三維空間上的姿態(tài)變化。這些困難一方面源于計算機本身學習能力的局限性,另一方面是源于人臉識別技術所具有的復雜 16 性。當前計算機系統(tǒng)的安全管理,通常使用字符和數(shù)字組成的密碼口令管理,此口令容易被遺忘或破解,如果使用人臉作為口令則既方便又安全; (4)在視頻監(jiān)控方面,目前,許多銀行、公司、公共場合等處都設有24 小時的視頻監(jiān)控。由于罪犯數(shù)據(jù)庫往往很大,如果這項搜索工作由人工完成,不僅效率低,而且容易出錯,因為人在看了上百幅人臉圖像后,記憶力會下降,而由計算機來完成則不會出現(xiàn)此問題; (2)身份證、駕駛證以及其他很多證件上都有照片,現(xiàn)在的證件驗證 15 一般都是由人進行驗證,如果利用人臉識別技術,這項工作就可以交給機器完成,從而實現(xiàn)自動化智能管理。因此可認為:對以均方誤差為準則的臉部重建來說, PCA 方法是一種最優(yōu)的方法:但從模式分類和辨識的觀點來看, PCA方法則不一定能夠取得最優(yōu)的結果。由于人臉的特定構造,在這種抽樣方式下,臉部特征帶的出現(xiàn)將服從于一定的順序,所以該模型可以用一個從左到右的隱馬爾可夫模型表示,其中狀態(tài)的轉移只能按照從左到右的方式進行。在尋找最佳匹配方法時,希望能夠同時維持特征數(shù)值接近和局部幾何關系。物體內部的空間關系則可以用節(jié)點之間的幾何距離表示。還有的文獻采用了二進制圖像的等密度區(qū)域或多個局部面部特征作為不同多層感知機的輸入層。多層感知機由幾層全互連的非線性神經(jīng)組成。 神經(jīng)網(wǎng)絡方法 人工神經(jīng)網(wǎng)絡是一種以大量的處理單元 (神經(jīng)元 )為節(jié)點,處理單 元之間實現(xiàn)加權值互連的拓撲結構。選擇訓練樣本的散布矩陣作為 KL 變換的生成矩陣,其最大特征向量反映了該樣本集合的最大分布 的方向,但這是圖像統(tǒng)計方法,而不是人臉統(tǒng)計方法。 KL 變換是圖像壓縮的一種最優(yōu)正交變換,人們將它應用 于特征提取,形成了子空間法模式識別的基礎。人臉圖像在前面的特征矢量上的投影有較大的能量,稱為主分量 。所以僅靠增加臉上幾何參數(shù)的數(shù)目來提高人臉識別率是不太現(xiàn)實的。具體來說,這些幾何參數(shù)一般包括人臉上兩個指定特征點之間的歐式距離、邊緣曲率、角度等等。這些方法中有的側重于表述人臉圖像的特征提取,如彈性圖匹配法和傅立葉不變特征法;有的則側重于分類,如最佳鑒別向量集法、貝葉斯法和神經(jīng)網(wǎng)絡法;而有的則側重于人臉圖像重構,如特征臉法和線性子空間法。 常用的人臉識別方法 對人臉識別方法的研究主要有兩大方向:一是基于人臉圖像局部特征的識別方法;二是基于人臉圖像整體特征的識別方法。根據(jù)圖像來源途徑的不同,可以分為動態(tài)和靜態(tài)的人臉識別 。除此之外還有 DCT, Gabor變換、分數(shù)階傅里葉變換等都是基于人臉的整體特征提取,還有基于人臉局部特征的提取方法,如利用顯著器官 (眼鏡、眉毛、耳朵、嘴 巴等 )之間的距離關系,以及通過訓練學習求得的局部特征。檢測人臉對于簡單背景的同一人的人臉圖片是比較容易實現(xiàn)的,但當人臉的背景變得復雜,或者圖片中的人臉屬于 多個人時,檢測就會變得相對困難。 (5)物理分類 ((Physical Classification)即對待識別人臉的物理特征進行分類,得出其年齡、性別、種族等相關信息。從廣義上來說,人臉識別主要包括人臉檢測、人臉表征、人臉鑒別、表情分析和物理分類五個方面。人臉識別作為一種新興的生物識別技術將占據(jù)整個生物特征識別技術 15%20%左右的份額。 人臉識別技術作為生物識別技術的一種,以其特有的穩(wěn)足性、方便性、唯一性等特點被愈來愈多地應用于除安全問題外的各種身份識別領域。人臉識別技術和其他的生物識別比起來有以下幾個優(yōu)點 : (1)人臉識別可以在隱蔽的條件下進行,適用于安全監(jiān)控 。密碼遺失、資料被盜的時間不斷發(fā)生,傳統(tǒng)的安全技術已暴露出重大的缺陷,就會給個人乃至整個社會帶來重大的甚至難以彌補的損失。主成分分析 II Research on Face Recognition Based on Principal Component Analysis Abstract Biometrics is a kind of science and technology using individual physiological or behavioral characteristics to verify identity. It provides a highly reliable and robust approach to the identity recognition. Automatic face detection and recognition is one of the most attention branches of biometrics and it is also the one of the most active and challenging tasks for image processing, pattern recognition and puter vision. It is widely applied in mercial and law area, such as mug shots retrieval, realtine video surveillance in security system and cryptography in bank and so on. The main research works and contributions are as the following. First, the research content, approach and development are emphasized. The research status is introduced. The technology of the face detection and recognition are summarized. And the paper describes face preprocessing in detail which is and important step in the face recognition. The face preprocessing methods we adopt are based on image processing techniques. The main purpose is to get the standardized facial images, and to eliminate the impact of illumination to some extent. In this paper, several key preprocessing methods are introduced, such as geometry normalization, grayscale normalization and images binaryconversion. Principal Component Analysis (PCA) face recognition methods as the foundation of the KL transformation is the most superior in the image pression .By using PCA, the dimension of the input is reduced while the main ponents are maintained. The major idea of PCA is to depose a data space into a linear bination of a small collection of the III facerecognition literature, the eigenvectors can be referred to as eigenfaces. The probe is identified by first projection to all gallery images. We denote a probe .A probe is paring the projection to all gallery images, and it causes around the pression the mean error to be youngest. But in the PCAbased face recognition technique, the 2D face image matrices must be previously transformed into 1 D image vectors. The resulting image vectors of faces usually lead to a high dimensional image vector space, where it is difficult to evaluate the covariance matrix accurately due to its large size and the relatively small number of training samples. Key words Face recognition ; Face pretreatment; PCA 目 錄 IV 第一章 緒 論 ................................................................................................ 1 ............................................................................. 1 ............................................................... 3 ........................................................................................... 6 ............................................................................... 6 .......................................................................... 6 ........................................................ 7 KL 變換的特征臉方法 ............................................................ 9 .......................................