【正文】
起來(lái),它被用于解決一個(gè)多重的,循環(huán)的學(xué)習(xí)問(wèn)題。我們稱(chēng)其為學(xué)習(xí)機(jī)是因?yàn)?,這個(gè)分類(lèi)器的學(xué)習(xí)算法會(huì)對(duì)一個(gè)分類(lèi)器集做一個(gè)搜索,運(yùn)用選擇算法來(lái)找出那些分類(lèi)錯(cuò)誤最小的分類(lèi)器,這是一個(gè)學(xué)習(xí)的過(guò)程。它通過(guò)結(jié)合一組弱分類(lèi)函數(shù)來(lái)組成一個(gè)強(qiáng)大的分類(lèi)器。 采用AdaBoost方法[3],用于選擇特征和訓(xùn)練分類(lèi)器。實(shí)驗(yàn)已經(jīng)證實(shí)了我們假設(shè),也就是很小一部分的這種特征可以結(jié)合起來(lái)組成一個(gè)有效的分類(lèi)器。我們回想一下,每個(gè)圖像的子窗口有45,396個(gè)矩形特征,這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)超過(guò)了像素的個(gè)數(shù)。最后,在實(shí)現(xiàn)實(shí)時(shí)性的時(shí)候,通過(guò)調(diào)用CvCapture FromCAM函數(shù)從視頻當(dāng)中獲取圖片,實(shí)現(xiàn)本系統(tǒng)的實(shí)時(shí)性。 在實(shí)現(xiàn)人臉檢測(cè)的過(guò)程中,對(duì)圖片進(jìn)行預(yù)處理也是一個(gè)比較重要的環(huán)節(jié)。 它其中一個(gè)困難是如何將人類(lèi)知識(shí)轉(zhuǎn)化成為有效的規(guī)則:如果規(guī)則制定得太細(xì),那么可能有許多人臉無(wú)法通過(guò)規(guī)則的驗(yàn)證;如果規(guī)則制定得太寬泛,那么可能許多非人臉會(huì)被誤判為人臉。(4)運(yùn)動(dòng)規(guī)則若輸入圖像為動(dòng)態(tài)圖像序列,則可以利用與人臉或人臉的器官相對(duì)于背景的運(yùn)動(dòng)來(lái)檢測(cè)人臉,比如利用眨眼或說(shuō)話等動(dòng)作的探測(cè)來(lái)實(shí)現(xiàn)人臉與背景的分離。這種方法一般是先對(duì)人臉的器官或器官的組合建立模板,然后檢測(cè)圖像中幾個(gè)器官可能分布的位置,對(duì)這些位置點(diǎn)分別組合,用器官分布的知識(shí)規(guī)則進(jìn)行篩選,從而找到可能存在的人臉。 (2)器官分布規(guī)則 雖然人臉因人而異, 但都遵循一些普遍適用的規(guī)則, 即五官分布的幾何規(guī)則。一些關(guān)于人臉的知識(shí),可以歸納成下面幾個(gè)簡(jiǎn)單的規(guī)則: (1)輪廓規(guī)則 人臉的輪廓可近似地被看成一個(gè)橢圓,則人臉檢測(cè)可以通過(guò)檢測(cè)橢圓來(lái)完成。通常這些規(guī)則包括了臉部特征之間關(guān)系的知識(shí)。在后面的章節(jié)里面,可以通過(guò)AdaBoost來(lái)看到基于特征方法的主要處理過(guò)程。利用膚色特征檢測(cè)出的人臉區(qū)域可能不夠準(zhǔn)確, 但如果在整個(gè)系統(tǒng)實(shí)現(xiàn)中作為人臉檢測(cè)的粗定位環(huán)節(jié),它具有直觀、實(shí)現(xiàn)簡(jiǎn)單、快速等特點(diǎn),可以為后面進(jìn)一步進(jìn)行精確定位創(chuàng)造良好的條件,以達(dá)到最優(yōu)的系統(tǒng)性能。 人的膚色被證明是人臉檢測(cè)的一個(gè)有效特征。 有許多方法就是按照這個(gè)潛在假設(shè),首先去尋找這種臉部特征(通過(guò)大量樣本學(xué)習(xí)的方法) ,然后用尋找到的特征去檢測(cè)人臉。這個(gè)方法的目標(biāo)是尋找那些即使當(dāng)姿勢(shì)、 視角和光線條件變化時(shí)仍然存在的結(jié)構(gòu)特征,并利用這些特征來(lái)定位人臉。 梅隆大學(xué))、MIT( 麻省理工學(xué)院)、YALE( 耶魯大學(xué)) 等機(jī)構(gòu);國(guó)內(nèi)的清華大學(xué)、中國(guó)科學(xué)院自動(dòng)化研究所、上海交通大學(xué)、南京理工大學(xué)、哈爾濱工業(yè)大學(xué)等單位都有人員從事人臉識(shí)別相關(guān)工作的研究。非線性建模方法、基于Boosting的學(xué)習(xí)技術(shù)、基于3D模型的人臉建模與識(shí)別方法等逐漸成為備受重視的技術(shù)發(fā)展趨勢(shì)??傮w而言,目前非理想成像條件下(尤其是光照和姿態(tài))、用戶(hù)不配合、大規(guī)模人臉數(shù)據(jù)庫(kù)上的人臉識(shí)別問(wèn)題逐漸成為研究的熱點(diǎn)。對(duì)于姿態(tài)變化的處理方法主要有多視角法、局部到整體幾何特征變換匹配法、通用3D模型法、3D形變模型法、光流場(chǎng)法[7]等。近幾年來(lái),研究人員針對(duì)影響人臉識(shí)別的一些主要因素,例如光照、姿態(tài)、表情、年齡、遮擋、低分辨率等變化因素,提出了很多解決方法。從技術(shù)方案上看,2D人臉圖像線性子空間判別分析、統(tǒng)計(jì)表觀模型、統(tǒng)計(jì)模式識(shí)別方法是這一階段的主流技術(shù)。這一階段時(shí)間相對(duì)短暫,但卻是人臉識(shí)別研究的高潮期,不但誕生了主成分分析、線性判別分析、彈性圖匹配、局部特征分析、獨(dú)立分量分析、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、隱馬爾可夫模型、柔性模型 (FlexibleModels)(包括主動(dòng)形狀模型(ASMs)和主動(dòng)表觀模型(AAMs))等若干代表性的人臉識(shí)別算法,美國(guó)軍方還組織了著名的FERET人臉識(shí)別算法測(cè)試,并出現(xiàn)了若干商業(yè)化運(yùn)作的人臉識(shí)別系統(tǒng),最為著名的是Visionics(現(xiàn)為Idenfx)的Facelt系統(tǒng)。該階段的方法仍擺脫不了操作員的干涉。他們用21維特征矢量表示人臉面部特征,并設(shè)計(jì)了基于這一特征表示的識(shí)別系統(tǒng)。第二個(gè)階段是人機(jī)交互識(shí)別階段。第一個(gè)階段以Bertillon,Allen和Parke為代表,主要研究人臉識(shí)別所需要的面部特征?,F(xiàn)在,幾乎所有知名的理工科大學(xué)和IT產(chǎn)業(yè)的主要公司都有研究組在從事人臉識(shí)別的研究。近年來(lái),人臉識(shí)別研究得到了諸多研究人員的青睞,涌現(xiàn)出了諸多技術(shù)方法。人臉識(shí)別的研究歷史比較悠久,Galton早在1888年和1910年就分別在《Nature》雜志發(fā)表了兩篇關(guān)于利用人臉進(jìn)行身份識(shí)別的文章,對(duì)人類(lèi)自身的人臉識(shí)別能力進(jìn)行了分析,但當(dāng)時(shí)還不可能涉及到人臉的自動(dòng)識(shí)別問(wèn)題。 人臉檢測(cè)是人臉?lè)治龅牡谝徊?,指?duì)于任意一幅給定的圖像,采用一定的策略對(duì)其進(jìn)行搜索以確定其中是否含有人臉,如果含有則返回人臉的位置、大小和姿態(tài)。 早期的人臉識(shí)別算法都是在假設(shè)已經(jīng)得到了一個(gè)正面人臉或者假設(shè)人臉很容易獲得的前提下進(jìn)行的, 但是隨著人臉?lè)治鰬?yīng)用范圍的不斷擴(kuò)大和開(kāi)發(fā)實(shí)際系統(tǒng)需求的不斷提高,這種假設(shè)下的研究不再能滿(mǎn)足需求。 與指紋、 視網(wǎng)膜、虹膜、基因、掌紋等其它人體生物特征識(shí)別系統(tǒng)相比,人臉識(shí)別更加直接、友好,其使用者無(wú)心理障礙。 人臉?lè)治鲋饕ㄈ四槞z測(cè)(face detection)和人臉識(shí)別(face recognition)兩部分。人臉?lè)治龅南嚓P(guān)研究希望用戶(hù)的身份、狀態(tài)和意圖的信息能夠從圖像中提取出來(lái),然后由計(jì)算依此做出反應(yīng)(比如通過(guò)觀察用戶(hù)臉部表情來(lái)分析心情并進(jìn)行相應(yīng)反應(yīng)) 。 相信在不久的將來(lái),擁有高級(jí)視覺(jué)系統(tǒng)的智能電子產(chǎn)品會(huì)給我們的生活帶來(lái)更大的方便。經(jīng)過(guò)研究者們的不懈努力,新的信息技術(shù)和媒體手段的出現(xiàn),使得更加有效和友好的人機(jī)交互方式得到了發(fā)展,新型的人機(jī)交互將不再依賴(lài)傳統(tǒng)的輸入設(shè)備。人們夢(mèng)想,終有一天,人機(jī)之間的交流可以像人與人之間的交流一樣暢通和友好。關(guān)鍵字:人臉檢測(cè),AdaBoost算法,圖像處理ABSTRACTWe mainly study human face detection and realtime face detection problem. In the part of the face detection, we use the algorithm based on AdaBoost to realize face detection,and call the function in the OpenCv to achieve realtime face detection. AdaBoost face detection is a method which select a small number of key haarlike features from a larger feature, resulting in an efficient and strong classifier. Then we cascade to a single strong classifier which is cascaded into a more plex cascade classifier. The quality of the classifier determines a face detection system good or bad. In image preprocessing, histogram equalization and median filtering approach can greatly accelerate the speed of face detection. Finally, to realize “realtime”, we call cvCaptureFromCAM functions to obtain pictures from the video.Keywords: Face detection, AdaBoost algorithm , Image processing目 錄第1章 引 言 1 1 2 3 3 4 4第2章 AdaBoost算法 6 AdaBoost算法簡(jiǎn)介 6 7 9 11 11第3章 AdaBoost算法訓(xùn)練過(guò)程 13 13 16 18 18 20 23第4章 圖像預(yù)處理 25 直方圖均衡化 25 26 中值濾波 27第5章 實(shí)時(shí)性人臉檢測(cè)研究 29 實(shí)時(shí)性人臉檢測(cè)系統(tǒng)描述 29 OpenCv視覺(jué)函數(shù)庫(kù) 30 實(shí)時(shí)性人臉檢測(cè)實(shí)驗(yàn)結(jié)果及分析 31第6章 結(jié)束語(yǔ) 36參考文獻(xiàn) 37致 謝 38附 錄 39外文資料原文 46外文資料譯文 54第1章 引 言 長(zhǎng)期以來(lái),計(jì)算機(jī)就好像一個(gè)盲人,需要被動(dòng)地接受由鍵盤(pán)、文件輸入的信息,并不能主動(dòng)從這個(gè)世界獲取并自主處理信息。在圖像預(yù)處理環(huán)節(jié),本文采用直方圖均衡化、中值濾波的處理方法,能夠大大加快人臉檢測(cè)的速度。再用級(jí)聯(lián)方式將單個(gè)的強(qiáng)分類(lèi)器級(jí)聯(lián)成為一個(gè)更加復(fù)雜的級(jí)聯(lián)分類(lèi)器。在人臉檢測(cè)環(huán)節(jié)中,本文采用了基于AdaBoost算法的人臉檢測(cè)以及圖片預(yù)處理技術(shù),并通過(guò)調(diào)用OpenCv里的函數(shù)來(lái)實(shí)現(xiàn)人臉檢測(cè)的實(shí)時(shí)性。摘 要人臉檢測(cè)是指任意給定一副圖像或者一組圖像序列,判定該圖像或圖像序列中是否存在人臉。本文研究人臉檢測(cè)以及實(shí)時(shí)性人臉檢測(cè)問(wèn)題。AdaBoost的人臉檢測(cè)從一個(gè)較大的特征集中選擇少量關(guān)鍵的haarlike特征,產(chǎn)生一個(gè)高效的強(qiáng)分類(lèi)器。分類(lèi)器的好壞決定了一個(gè)人臉檢測(cè)系統(tǒng)的好壞。最后,在實(shí)現(xiàn)實(shí)時(shí)性的時(shí)候,通過(guò)調(diào)用CvCapture FromCAM函數(shù)從視頻當(dāng)中獲取圖片,實(shí)現(xiàn)本系統(tǒng)的實(shí)時(shí)性。人們?yōu)榱俗層?jì)算機(jī)看到這個(gè)世界并主動(dòng)從這個(gè)世界尋找信息,發(fā)展了機(jī)器視覺(jué);為了讓計(jì)算機(jī)自主處理和判斷所得到的信息,發(fā)展了人工智能科學(xué)。 迄今為止,機(jī)器視覺(jué)的發(fā)展已經(jīng)歷了一個(gè)漫長(zhǎng)的過(guò)程。而且,計(jì)算性?xún)r(jià)比的提高和視頻獲取成本的降低,使得計(jì)算機(jī)視覺(jué)系統(tǒng)能夠向桌面級(jí)和嵌入式系統(tǒng)發(fā)展, 這意味著計(jì)算機(jī)視覺(jué)系統(tǒng)能夠安裝在一切電子系統(tǒng)之中。 計(jì)算機(jī)視覺(jué)要處理的一個(gè)重要內(nèi)容,就是對(duì)人臉的視覺(jué)處理。由于人臉和臉部表情已經(jīng)被心理學(xué)家、神經(jīng)科學(xué)家和工程師們研究了多年,所以人臉和臉部表情識(shí)別的研究得到了更多的關(guān)注。 最初人臉?lè)治鲋饕性谌四樧R(shí)別領(lǐng)域。人臉識(shí)別技術(shù)應(yīng)用背景十分廣泛,可用于公安系統(tǒng)刑偵破案的罪犯身份識(shí)別、身份證及駕駛執(zhí)照等證件驗(yàn)證、銀行及海關(guān)的監(jiān)控、自動(dòng)門(mén)視頻會(huì)議、機(jī)器人的智能化研究以及醫(yī)學(xué)等方面。人臉檢測(cè)開(kāi)始作為獨(dú)立的研究?jī)?nèi)容發(fā)展起來(lái)了。本篇論文關(guān)注的是進(jìn)行實(shí)時(shí)性的人臉檢測(cè)。最早的關(guān)于人臉識(shí)別問(wèn)題的研究論文見(jiàn)于1964年Bertillon在Panoramic Research ,和1965年Chan在Panoramic Research ,到現(xiàn)在已有四十余年的歷史。尤其是1990年以來(lái),人臉識(shí)別更得到了長(zhǎng)足的發(fā)展,每年都有大量的學(xué)術(shù)論文發(fā)表。人臉識(shí)別的研究大致可分為四個(gè)階段[1]。該階段是人臉識(shí)別研究的初級(jí)階段,非常重要的成果不是很多,也基本沒(méi)有獲得實(shí)際應(yīng)用。該階段代表性工作是Goldstion,Harmon和Lesk等用幾何特征參數(shù)來(lái)表示人臉正面圖像。在這個(gè)階段,Kanade博士于1973年在京都大學(xué)完成了第一篇人臉識(shí)別方面的博士論文。第三個(gè)階段是真正的機(jī)器自動(dòng)識(shí)別階段。這一階段的人臉識(shí)別技術(shù)發(fā)展非常迅速,所提出的算法在較理想圖像采集條件、用戶(hù)配合、中小規(guī)模正面人臉數(shù)據(jù)庫(kù)上達(dá)到了非常好的性能。第四個(gè)階段是魯棒的人臉識(shí)別技術(shù)的研究階段。如對(duì)于光照變化的處理方法主要有熵圖像法、光照錐法、球諧波函數(shù)法、九點(diǎn)光源法等。目前在實(shí)際中應(yīng)用的人臉檢測(cè)方法多為基于Adaboost學(xué)習(xí)算法的方法,這種檢測(cè)方法最初由劍橋大學(xué)的兩位大牛Paul Viola和Michael Jones[ViolaJones01]提出,并由另一位大牛英特爾公司的Rainer Lienhart[Lienhart02]對(duì)這一方法進(jìn)行了改善。解決這類(lèi)問(wèn)題的方法的特點(diǎn)是通過(guò)描述和補(bǔ)償變化因素,從而提高算法的性能。目前,國(guó)外對(duì)人臉識(shí)別問(wèn)題的研究很多,比較著名的有CMU( 卡耐基關(guān)于人臉識(shí)別研究的重要國(guó)際會(huì)議有IEEE 的FG(IEEE International Conference Automatic Face and Gesture Recognition)、ICIP(International Conference on Image Processing)、CVPR(Conference on Computer Vision and Pattern Recognition ) 等。由于人類(lèi)能夠毫不費(fèi)勁地“看到”在不同光線和姿態(tài)下的人臉和物體,因此研究人員認(rèn)為有一個(gè)潛在的假設(shè):存在一些關(guān)于人臉的不依賴(lài)于外在條件的屬性或者特征。這種基于特征的方法是自下而上的。人臉膚色聚集在顏色空間中一個(gè)較小的區(qū)域,因此可利用膚色特征能夠有效地檢測(cè)出圖像中的人臉。 本論文的AdaBoost方法就是基于人臉特征的方法。這個(gè)方法[2]將人類(lèi)有關(guān)典型的臉的知識(shí)編碼成一些規(guī)則。這個(gè)方法主要用于人臉的定位。對(duì)任意一幅圖像,首先進(jìn)行邊緣檢測(cè),并對(duì)細(xì)化后的邊緣提取曲線特征,然后計(jì)算各曲線組合成人臉的評(píng)估函數(shù)來(lái)檢測(cè)人臉。檢測(cè)圖像中是否有人臉,即是否存在滿(mǎn)足這些規(guī)則的圖像塊。(3)對(duì)稱(chēng)性規(guī)則人臉具有一定的軸對(duì)稱(chēng)性,各器官也具有一定的對(duì)稱(chēng)性?;谥R(shí)的方法是一種自上而下的方式。 本文所采用的人臉檢測(cè)方法為基于AdaBoost算法的人臉檢測(cè)算法,主要方式是通過(guò)訓(xùn)練一個(gè)級(jí)聯(lián)分類(lèi)器以及調(diào)用OpenCv函數(shù)庫(kù)來(lái)實(shí)現(xiàn)人臉檢測(cè)。在圖像預(yù)處理環(huán)節(jié),本文采用直方圖均衡化、中值濾波的處理方法,能夠大大加快人臉檢測(cè)的速度。第2章 AdaBoost算法 AdaBoost算法簡(jiǎn)介給定一個(gè)特征集合和一個(gè)包含正樣本和負(fù)樣本圖像的訓(xùn)練集,任何機(jī)器