【正文】
束語 人臉做為計(jì)算機(jī)視覺的一個(gè)大的研究方向,很多科研人員在上面投入了大量精力,每年出來上百篇相關(guān)論文,本文中不一一列舉,文中講述分析如有不妥之處請多包涵指正! 參考文獻(xiàn) [1] Henry A Rowley, Shumeet Baluja, Takeo Kanade. Neural workbased face detection. 1998, IEEE Transactions on Pattern Analysis and Machine Intelligence. [2] Henry A Rowley, Shumeet Baluja, Takeo Kanade. Rotation invariant neural workbased face detection. 1998, puter vision and pattern recognition. [3] and . Rapid object detection using a boosted cascade of simple features. In Proceedings IEEE Conf. on Computer Vision and Pattern Recognition, 20xx [4] Rainer Lienhart, Jochen Maydt. An extended set of Haarlike features for rapid object detection. 20xx, international conference on image processing. [5] Lubomir Bourdev, Jonathan Brandt. Robust Object Detection Via Soft Cascade. CVPR 20xx. [6] Bo Wu, Haizhou Ai, Chang Huang, Shihong Lao. Fast rotation invariant multiview face detection based on real Adaboost. 20xx, IEEE international conference on automatic face and gesture recognition. [7] , . Fast MultiView Face Detection. Mitsubishi Electric Research Laboratories, Technical Report: MERL20xx96, July 20xx. [8] , . Realtime rotation invariant face detection based on costsensitive AdaBoost. In: Proceedings of the IEEE International Conference on Image Processing. Barcelona, Spain: IEEE Computer Society, 20xx. 921924. [9] , . Robust multiview face detection and pose estimation based on costsensitive AdaBoost. In: Proceedings of the 6th Asian Conference on Computer Vision. Jeju, Korea: Springer, 20xx. [10] , , , , , . Statistical learning of multiview face detection. In: Proceedings of the 7th European Conference on Computer Vision. Copenhagen, Denmark: Springer, . [11] , , , . FloatBoost learning for classification. In: Proceedings of the 16th Annual Conference on Neural Information Processing Systems. Vancouver, Canada: MIT Press, 20xx. 9931000. [12] , , , . Learning to detect multiview faces in realtime. In: Proceedings of the 2nd International Conference on Development and Learning. Cambridge, MA, USA: IEEE Computer Society, 20xx. 172177. [13] , . FloatBoost Learning and Statistical Face Detection. In: IEEE Transactions on Pattern Analysis and Machine Intelligence, 20xx. [14] , , , . Fast rotation invariant multiview face detection based on real adaboost. In: Proc. 6th Int39。(由于大的卷積核效率問題,根據(jù) INCEPTION 的思想,使用 2個(gè) 3*3的卷積核替代一個(gè) 5*5的卷積核,使用 3個(gè) 3*3的卷積核替換 1個(gè) 7*7的卷積核)。通過加入 center loss 使得類內(nèi)的特征差異更小(起到聚類的作用),提高正負(fù)樣本在特征空間的差異性從而提升分類器的性能。 如何從預(yù)訓(xùn)練的深度網(wǎng)絡(luò)中最佳地提取尺度不變的特征。該方法目前在很多工業(yè)級場景中得到了應(yīng)用。 根據(jù) attributeaware 深度網(wǎng)絡(luò)生成人臉部件 map 圖 (partness map),如上圖Faceness(a)中的顏色圖,文章共使用了 5 個(gè)部件 :hair,eye,nose,mouth,beard. 通過 part 的結(jié)合計(jì)算人臉的 部件之間是有相對位置關(guān)系的 ,比如頭發(fā)在眼睛上方 ,嘴巴在鼻子下方 ,因此利用部件的 spatial arrangement 可以計(jì)算 face likeliness. 通過這個(gè)打分對原始的人臉 proposal 進(jìn)行重排序 . 如圖 Faceness(b)。真實(shí)的類別標(biāo)簽值為 ,取值為 0或者 1,分別表示是背景和目標(biāo)。卷積層 conv4_4 的的輸出被送入 4 個(gè) 的卷積層中。 。 文中影響區(qū)域位置和大小的因素有三種:尺度、 X 方向偏移、 Y 方向 偏移。 構(gòu)建多尺度的人臉圖像金字塔, 12 將密集的掃描這整幅圖像(不同的尺寸),快速的剔除掉超過 90%的檢測窗口,剩下來的檢測窗口送入 12calibration調(diào)整它的尺寸和位置,讓它更接近潛在的人臉圖像的附近。基于 DPM 的方法在戶外人臉集上都取得了比 ViolaJones 更好的效果,但是由于該模型過于復(fù)雜,判斷時(shí)計(jì)算復(fù)雜,很難滿足實(shí)時(shí)性的要求。 ( 2)生成的決策函數(shù)是需要通過之前每個(gè)階段的值而不單單是本階段來判定。另外,檢測處于各種角度和姿態(tài)的人臉是研究另一個(gè)重點(diǎn), VJ 方法的分類器級聯(lián)只有一條路徑,是瀑布模型,改進(jìn)的方案有樹狀級聯(lián),金字塔級聯(lián)等,篇幅所限這里不做過多解釋,各種級聯(lián)方案如下圖所示: 在深度學(xué)習(xí)出現(xiàn)以前工業(yè)界的方案都是基于 VJ算法。對于前者,可以理解為一個(gè)負(fù)樣本被每一級分類器都判定為正樣本的概率;對于后者,可