【正文】
人臉數(shù)據(jù)降維的目的是得到表達(dá)性特征(如主成分分析等)或鑒別性特征(如線性鑒別分析等)以降低高維人臉數(shù)據(jù)的計算復(fù)雜度和減弱噪聲、表情、光照等因素的影響[50]. 對各種常見線性和非線性的降維方法研究的介紹可參考文獻(xiàn)[51].現(xiàn)階段對降維后的人臉序列描述方式包括矢量、矩陣、概率、動態(tài)模型、流形等. 其中采用概率和流形的方法需要大量反映人臉分布的樣本才能更準(zhǔn)確的刻畫人臉的分布, 達(dá)到較好的性能. 利用動態(tài)模型能夠很好地利用時間和空間的信息, 但是方法相對比較復(fù)雜, 計算量一般都比較大. 而利用矢量作為輸入描述方式的主要缺點(diǎn)是樣本選取的隨機(jī)性. 矩陣方式最為簡單, 并且可以應(yīng)用到時間上不連續(xù)的多幅圖像情況, 但如何更好地刻畫矩陣之間的度量是一個值得研究的內(nèi)容.4 常用的視頻人臉數(shù)據(jù)庫及一些實(shí)驗(yàn)結(jié)果目前基于視頻的人臉識別常用的視頻人臉數(shù)據(jù)庫包括Mobo (motion of body)數(shù)據(jù)庫[52]和Honda/UCSD數(shù)據(jù)庫[8, 9]. Mobo數(shù)據(jù)庫最初是CMU為了Human ID計劃進(jìn)行步態(tài)識別而采集的數(shù)據(jù)庫. 整個數(shù)據(jù)庫包含25個人在跑步機(jī)上以四種不同的方式行走的視頻序列. 行走的方式包括慢速行走、快速行走、斜面行走和拿球行走. 正面角度拍攝的視頻序列共99段(一段丟失). UCSD/Honda數(shù)據(jù)庫包含20個人的共52段視頻. 數(shù)據(jù)庫中的人臉視頻包含了大規(guī)模的2D(平面內(nèi))和3D(平面外)的頭部旋轉(zhuǎn). 另外還有DXM2VTS數(shù)據(jù)庫[53].這些視頻人臉數(shù)據(jù)庫普遍的缺點(diǎn)是沒有考慮到各種條件的變化. 大部分都是姿態(tài)的變化, 其他的如光照、表情的變化等考慮較少, 并且數(shù)據(jù)庫的人偏少(50個人), 無法進(jìn)行大規(guī)模有效的實(shí)驗(yàn)來評價各種算法的優(yōu)劣.目前大部分的文獻(xiàn)中采用的數(shù)據(jù)庫以及訓(xùn)練, 測試方法都不盡相同. 但為了對目前典型方法的實(shí)驗(yàn)結(jié)果有一個直觀的認(rèn)識, 表4匯集了在視頻人臉數(shù)據(jù)庫上一些典型方法的實(shí)驗(yàn)結(jié)果.表4 視頻人臉數(shù)據(jù)庫上典型方法的實(shí)驗(yàn)結(jié)果方法名稱識別率典型文獻(xiàn)PCA(多數(shù)投票)%(MoBo)[44]%(Honda/UCSD)LDA(多數(shù)投票)%(MoBo)[44]%(Honda/UCSD)隱馬爾可夫模型%(MoBo)[44]%(Honda/UCSD)基于貝葉斯框架的SIS方法92%以上(MoBo)[10]概率外觀流形法%(無遮擋) (Honda/UCSD)[9]%(有遮擋) (Honda/UCSD)ARMA模型90%左右(Honda/UCSD)[12]混合高斯模型94%[13]局部線性模型%[21]5 總結(jié)和展望本文介紹了現(xiàn)階段基于視頻的人臉識別研究進(jìn)展. 在對人臉識別不同情況分類的基礎(chǔ)上, 重點(diǎn)介紹了現(xiàn)階段基于視頻的人臉識別的主要方法, 分析和討論了各種方法的優(yōu)缺點(diǎn), 還介紹了常用的視頻人臉數(shù)據(jù)庫及一些典型方法的實(shí)驗(yàn)結(jié)果.現(xiàn)階段基于視頻的人臉識別一般都是把人臉視頻看成一個整體來克服分辨率低的問題[35]. 對于光照或者姿態(tài)的單獨(dú)變化可以通過矩陣、概率或者流形的方式部分解決[9, 18], 但是需要不同條件下的大量的訓(xùn)練樣本. 對于遮擋問題可以采用魯棒統(tǒng)計學(xué)[11]或者對臉部的分塊處理[54]來解決.隨著研究的深入, 基于視頻的人臉識別需要進(jìn)一步研究的工作包括:(1) 人臉特征的準(zhǔn)確定位本文假設(shè)已經(jīng)得到了圖像或者視頻中人臉的位置, 并且人臉的特征已經(jīng)準(zhǔn)確定位. 但是在實(shí)際應(yīng)用中, 人臉視頻的分辨率過低常會使得人臉的檢測和準(zhǔn)確的特征定位存在一定的困難. 人臉的誤配準(zhǔn)也會嚴(yán)重影響人臉識別的結(jié)果. 作為人臉識別的基礎(chǔ), 準(zhǔn)確和快速的人臉檢測和特征定位方法是必不可少的.(2) 人臉的超分辨率重建和模糊復(fù)原視頻序列中的人臉由于采集條件和運(yùn)動的影響, 人臉圖像分辨率低且人臉模糊. 研究人臉圖像超分辨率技術(shù)[55]和圖像復(fù)原技術(shù)[56]以得到清晰的人臉圖像也是未來需要重點(diǎn)解決的問題.(3) 人臉的3D建模現(xiàn)階段基于二維的人臉識別方法可以在一定程度上解決姿態(tài)或光照的變化問題. 但是人臉是一個三維的物體, 利用人臉的三維的信息是解決姿態(tài), 光照變化問題的最本質(zhì)方法. 現(xiàn)階段利用視頻數(shù)據(jù)生成3D模型的計算復(fù)雜度很大[42, 5759], 無法達(dá)到使用要求. 更好降低三維人臉建模的復(fù)雜度和提高建模的精度是未來發(fā)展的一個重要方向.(4) 視頻人臉數(shù)據(jù)庫和測試方法的標(biāo)準(zhǔn)化與基于靜止圖像的人臉識別相比, 基于視頻的人臉識別的最大問題是還沒有一個包含各種條件變化的、統(tǒng)一的、大規(guī)模的視頻人臉數(shù)據(jù)庫和測試標(biāo)準(zhǔn). 許多文章采用的視頻人臉數(shù)據(jù)庫和測試方法都不盡相同, 無法進(jìn)行算法之間的比較. 建立一個公共的、大規(guī)模的視頻人臉數(shù)據(jù)庫和標(biāo)準(zhǔn)的測試方法是該領(lǐng)域的一個首要任務(wù).(5) 多模生物特征認(rèn)證現(xiàn)階段基于視頻的人臉識別算法主要是基于室內(nèi)的環(huán)境條件. 室外條件下的人臉圖像光照、姿態(tài)等的劇烈變化使人臉識別仍然面臨著許多困難, 融合多種生物特征提高識別的性能也將是未來研究的一個重點(diǎn)[6062].參考文獻(xiàn)[1] Chellappa R, Wilson C, Sirohey S. Human and machine recognition of faces: A survey. Proceedings of the IEEE, 1995, 83(5): 705740[2] Zhao W, Chellappa R, Rosenfeld A, Phillips P J. Face recognition: A literature survey. ACM Computation Survey, 2003, 35(4): 399458[3] Li S Z, Jain A K. Handbook of Face Recognition, Springer, New York, 2005[4] Zhou S, Chellappa R. Beyond a single still image: face recognition from multiple still images and videos. Face Processing: Advanced Modeling and Methods, Academic Press, New York, 2005[5] Shakhnarovich G., Fisher J W, Darrell T. Face recognition from longterm observations//Proceedings of the European Conference on Computer Vision. Bari, 2002: 851868[6] Liu X M, Chen T, Thornton S M. Eigenspace updating for nonstationary process and its application to face recognition. Pattern Recognition, 2003, 36(9): 19451959[7] Liu X M, Chen T. Videobased face recognition using adaptive hidden markov models//Proceedings of IEEE International Conference on Computer Vision and Pattern Recognition. Madison, 2003: 340345[8] Lee K C, Ho J, Yang M H, Kriegman D. Videobased face recognition using probabilistic appearance manifolds//Proceedings of the International IEEE Conference on Computer Vision and Pattern Recognition. Madison, 2003: 313320[9] Lee K C, Ho J, Yang M H, Kriegman D. Visual tracking and recognition using probabilistic appearance manifolds. Computer Vision and Image Understanding, 2005, 99(3): 303331[10] Zhou S, Krueger V, Chellappa R. Probabilistic recognition of human faces from video. Computer Vision and Image Understanding, 2003, 91(1): 214245[11] Zhou S, Chellappa R, Moghaddam B. Visual tracking and recognition using appearanceadaptive models in particle filters. IEEE Transactions on Image Processing, 2004, 13(11): 14341456[12] Aggarwal G., Chowdhury A K R, Chellappa R. A system identification approach for videobased face recognition//Proceedings of the IEEE International Conference on Pattern Recognition. Cambridge, 2004: 2326[13] Arandjelovi? O, Cipolla R. Face recognition from face motion manifolds using robust kernel resistoraverage distance//Proceedings of the IEEE Conference on Compute Vision and Patter Recognition workshop. Washington , 2004: 8893[14] Arandjelovi? O, Shakhnarovich G, Fisher G, Cipolla R, Darrell T. Face recognition with image sets using manifold density divergence//Proceeding of the IEEE Conference on Computer Vision and Pattern Recognition. San Diego, 2005: 581588[15] Arandjelovi? O, Cipolla R. A posewise linear illumination manifold model for face recognition using video. Computer Vision and Image Understanding, 2009, 113(1): 113125[16] Yamaguchi O, Fukui K, Maeda K. Face recognition using temporal image sequence//Proceedings of the IEEE International Conference on Automatic Face and Gesture Recognition. Nara, 1998: 318323[17] Fukui K, Yamaguchi O. Face recognition using multiviewpoint patterns for robot vision. International Symposium of Robotics Research. 2