【正文】
f picture process directly influenced the accuracy rate of localization and discerning. The picture process technology that the software mainly used included : light pensating、gauss smooth and twain value method. before discerning, we pensated the light for image, then we could obtain the possible face area through the plexion, finally, the system could depend on the symmetry of eyes to make sure whether it is the face of people, at the same time, the system could eliminate noises through the method that named gauss smoothness, then we used twain value method to deal with picture,the method got the threshold value in face area . After dealing with picture , the following operations are localization、draw characteristic value 、discerning and so on . After testing, we made true that the picture pretreatment modal has get the better effect in the process of dealing with picture, and improve the exactness rate of localization and discerning.【key word】: Face recognition; light pensating; gauss smooth;contrast enhancing 第一章 前言第一節(jié) 課題背景一 課題的來源隨著安全入口控制和金融貿(mào)易方面應(yīng)用需要的快速增長,生物統(tǒng)計識別技術(shù)得到了新的重視。而人臉識別是所有的生物識別方法中應(yīng)用最廣泛的技術(shù)之一,人臉識別技術(shù)是一項近年來興起的,但不大為人所知的新技術(shù)。這并非虛構(gòu)的情節(jié)。在國內(nèi),對于人臉識別技術(shù)的研究始于上世紀(jì)90年代,目前主要應(yīng)用在公安、金 融、網(wǎng)絡(luò)安全、物業(yè)管理以及考勤等領(lǐng)域。人臉識別技術(shù)是一個非?;钴S的研究領(lǐng)域,它覆蓋了數(shù)字圖像處理、模式識別、計算機視覺、神經(jīng)網(wǎng)絡(luò)、心理學(xué)、生理學(xué)、數(shù)學(xué)等諸多學(xué)科的內(nèi)容。如何能正確識別大量的人并滿足實時性要求是迫切需要解決的問題?;叶确e分投影曲線分析、模板匹配、可變形模板、Hough變換、Snake算子、基于Gabor小波變換的彈性圖匹配技術(shù)、主動性狀模型和主動外觀模型是常用的方法。由于模板變形利用了特征區(qū)域的全局信息,因此可以較好地檢測出相應(yīng)的特征形狀。針對這兩方面的問題,我們采用了一種由粗到細的檢測算法:首先利用人臉器官構(gòu)造的先驗知識、面部圖像灰度分布的峰谷和頻率特性粗略檢測出眼睛、鼻子、嘴、下巴的大致區(qū)域和一些關(guān)鍵的特征點;然后在此基礎(chǔ)上,給出了較好的模板的初始參數(shù),從而可以大幅提高算法的速度和精度?;趨^(qū)域增長的眼睛定位技術(shù),該技術(shù)在人臉檢測的基礎(chǔ)上,充分利用了眼睛是面部區(qū)域內(nèi)臉部中心的左上方和右上方的灰度谷區(qū)這一特性,可以精確快速的定位兩個眼睛瞳孔中心位置。該算法根據(jù)人眼灰度明顯低于面部灰度的特點,利用搜索矩形找到眼部的邊緣,最后定位到瞳孔的中心。佩戴黑框眼鏡,也會影響本算法的定位結(jié)果。盡管人臉識別不能說是其他面部感知模塊的必備功能,但是, 可以肯定的是,利用已知的身份信息,結(jié)合特定人的先驗知識,可以提高表情分析、唇讀和語音識別、手勢識別乃至手寫體識別的可靠性。視頻輸入人臉檢測和跟蹤面部特征定位人臉識別表情分析性別判斷種族判斷年齡判別唇 讀身份信息情感狀態(tài)性別信息種族信息年齡信息唇形類別 圖11面部感知系統(tǒng)結(jié)構(gòu)圖第二節(jié) 人臉識別的國內(nèi)外發(fā)展概況現(xiàn)在人臉識別技術(shù)已經(jīng)應(yīng)用在許多領(lǐng)域中,并起到了舉足輕重的作用,人臉識別研究開始于1966年P(guān)RI的Bledsoe的工作,經(jīng)過三十多年的發(fā)展,人臉識別技術(shù)取得了長足的進步, 現(xiàn)在就目前國內(nèi)外的發(fā)展情況來進行展述。1993年,美國國防部高級研究項目署 (Advanced Research Projects Agency)和美國陸軍研究實驗室(Army Research Laboratory)成立了Feret(Face Recognition Technology) 項目組,建立了feret 人臉數(shù)據(jù)庫,用于評價人臉識別算法的性能。在美國的進行的公開測試中,F(xiàn)AR,為53%。這種算法需要人工或自動指出圖像中人的兩眼的中心坐標(biāo),然后進行識別。二 國內(nèi)的發(fā)展概況 [2]人臉識別系統(tǒng)現(xiàn)在在大多數(shù)領(lǐng)域中起到舉足輕重的作用,尤其是用在機關(guān)單位的安全和考勤、網(wǎng)絡(luò)安全、銀行、海關(guān)邊檢、物業(yè)管理、軍隊安全、智能身份證、智能門禁、司機駕照驗證、計算機登錄系統(tǒng)。北京科瑞奇技術(shù)開發(fā)股份有限公司在2002年開發(fā)了一種人臉鑒別系統(tǒng),對人臉圖像進行處理,消除了照相機的影響,再對圖像進行特征提取和識別。系統(tǒng)可以接受時間間隔較長的照片,并能達到較高的識別率,在計算機中庫藏2300人的正面照片,每人一張照片,使用相距17年、差別比較大的照片去查詢,首選率可以達到50%,前20張輸出照片中包含有與輸入照片為同一人的照片的概率可達70% 。2005年1月18日,由清華大學(xué)電子系人臉識別課題組負責(zé)人蘇光大教授主持承擔(dān)的國家十五攻關(guān)項目《人臉識別系統(tǒng)》通過了由公安部主持的專家鑒定。本論文主要對該人臉識別系統(tǒng)進行模塊劃分,并介紹各模塊的功能,重點介紹圖像預(yù)處理模塊,對其內(nèi)的子模塊的功能和算法進行詳細講述,主要介紹光線補償、圖像灰度化、高斯平滑、均衡直方圖、圖像對比度增強,圖像預(yù)處理模塊在整個系統(tǒng)中起著極其關(guān)鍵的作用,圖像處理的好壞直接影響著后面的定位和識別工作。在我國以及其他國家都有大量的學(xué)者正在研究之中,不斷的更新人臉識別技術(shù),以便系統(tǒng)的識別準(zhǔn)確率達到新的高度。一 技術(shù)可行性 圖像的處理方法很多,我們可以根據(jù)需要,有選擇地使用各種方法。膚色提取,則對臉部區(qū)域的獲取則比較準(zhǔn)確,成功率達到95%以上,并且速度快,減少很多工作。高斯平滑:在圖像的采集過程中,由于各種因素的影響,圖像中往往會出現(xiàn)一些不規(guī)則的隨機噪聲,如數(shù)據(jù)在傳輸、存儲時發(fā)生的數(shù)據(jù)丟失和損壞等,這些都會影響圖像的質(zhì)量,因此需要將圖片進行平滑操作以此來消除噪聲。同樣在進行灰度變換前,我們也要對圖像的信息進行統(tǒng)計,找出一個比較合理的灰度值,才能進行灰度變換。對比度增強:將所要處理的區(qū)域和周圍圖像區(qū)域進一步拉開他們的對比度,使它們更加明顯,主要通過像素的聚集來實現(xiàn)。安裝有Windows 9Windows Me、Windows 2000、Windows NT等操作系統(tǒng)中的其中一種。因此,從操作可行性來看,只要系統(tǒng)用戶的硬件軟件設(shè)備滿足以上條件,即可用該人臉識別軟件進行人臉的識別。預(yù)處理這個模塊在整個人臉識別系統(tǒng)的開發(fā)過程中占有很重要的地位,只有預(yù)處理模塊做的好,才可能很好的完成后面的人臉定位和特征提取這兩大關(guān)鍵模塊。圖像預(yù)處理功能:該模塊主要包括圖像光線補償、圖像變成灰色、高斯平滑、均衡直方圖、實現(xiàn)圖像對比度增強、二值化變換等。特征提取功能:該模塊是在定位后的人臉圖片中將眼睛、鼻子、嘴巴的特征值提取出來。二 開發(fā)環(huán)境需求分析硬件環(huán)境(1)硬件配置原則具有可靠性,可用性和安全性,具有完善的技術(shù)支持。(2)運行本軟件所需的硬件資源CPU: 800M及以上;內(nèi)存: 128M及以上軟件環(huán)境(1)系統(tǒng)軟件配置原則 能夠滿足該軟件的可靠性,可用性和安全性的要求(2)系統(tǒng)軟件配置方案① 配置有持續(xù)工作能力、高穩(wěn)定性、高度可集成的開放式標(biāo)準(zhǔn)的操作系統(tǒng),如Windows2000,Windows NT,UNIX,Linux等。如:Visual C++ 。 運行環(huán)境需求分析(1)、硬件環(huán)境CPU:500M及以上;內(nèi)存:64 M及以上。如Windows 9Windows Me、Windows 2000、Windows NT等。采用成熟的技術(shù),保證應(yīng)用程序的安全性和可靠性。應(yīng)用程序充分利用現(xiàn)有的資源,盡量減少不必要的再投資。二 圖像文件格式選擇在設(shè)計的過程中,為了定位和特征提取的方便,我們采用的是24位位圖。 Visual C++ 。用戶無需通過繁雜的編程操作,即可完成Windows下應(yīng)用程序的編輯、編譯、測試和細化等工作。下面將本系統(tǒng)采用的算法進行介紹:實際上就是調(diào)整圖片像素的RGB值。圖像灰度化:圖像灰度化是將圖像變成灰色,本系統(tǒng)中采用以下步驟來實現(xiàn)圖像的灰度化:彩色轉(zhuǎn)換成灰度、灰度比例變換、灰度線性變換、灰度線性截斷、灰度取反。高斯平滑:在圖像的采集過程中,由于各種因素的影響,圖像中往往會出現(xiàn)一些不規(guī)則的隨機噪聲,如數(shù)據(jù)在傳輸、存儲時發(fā)生的數(shù)據(jù)丟失和損壞等,這些都會影響圖像的質(zhì)量,因此需要將圖片進行平滑操作以此來消除噪聲。它的實現(xiàn)主要是利用灰度均衡的轉(zhuǎn)換式DB = f (DA)= H(u)du 。圖像對比度增強:為了將圖像的特征一步一步顯現(xiàn)出來,需要進行圖像的對比度增強,它主要通過對圖像的灰度值進行統(tǒng)計,對于小于Low則認(rèn)為是有關(guān)的信息,則將它作為黑色處理,對于處于High以上的則認(rèn)為是一些無關(guān)的信息,將它們?nèi)サ?,而處于兩者之間的,則進行對比度增強,將他們在總的灰度值里面的比例作為新的像素信息保存起來。(一) 應(yīng)用程序的總體結(jié)構(gòu)設(shè)計流程圖如圖3-1所示:圖3-1總體結(jié)構(gòu)設(shè)計流程圖用 戶從“文件”菜單中選擇“打開”選項在彈出的“打開”對話框中選擇要打開的位圖,點擊“確定”,應(yīng)用程序顯示所要打開的位圖識別獲取臉部區(qū)域獲取特征參數(shù)人臉定位圖象預(yù)處理顯示識別結(jié)果(二) 圖像預(yù)處理的層次圖如圖32所示: 圖32 預(yù)處理的層次圖預(yù)處理光線補償圖像灰度化高斯平滑均衡直方圖圖像對比度增強二值化第一節(jié) 各模塊功能概述以上是該系統(tǒng)的總體結(jié)構(gòu)設(shè)計圖以及圖像預(yù)處理模塊的層次圖。人臉區(qū)域獲取 該系統(tǒng)中圖像里人臉區(qū)域的獲取,主要是根據(jù)膚色來進行獲取,通過膚色非線形分段色彩變換來實現(xiàn)。圖像預(yù)處理模塊圖像預(yù)處理就是對獲取得來的圖像進行適當(dāng)?shù)奶幚恚顾哂械奶卣髂軌蛟趫D像中明顯的表現(xiàn)出來。光線補償[3]因為系統(tǒng)得到的圖片可能會存在光線不平衡的情況,這會影響我們對特征的提取,同時系統(tǒng)中要用到Y(jié)crCB色彩空間,所以有必要對圖像進行光線補償。YcrCB是一種色彩空間,它用于視頻系統(tǒng)中,在該色彩空間中,Y分量表示像素的亮度,Cr表示紅色分量,Cb表示藍色分量,通常把Cr和Cb稱為色度。因此,盡可能在轉(zhuǎn)化的過程中用簡單的方式表現(xiàn)圖像復(fù)雜的信息。高斯平滑處理[5]高斯平滑將對圖像進行平滑處理,在圖像采集過程中,由于各種因素的影響,圖像往往會出現(xiàn)一些不規(guī)則的噪聲,入圖像在傳輸、存儲等都有可能產(chǎn)生數(shù)據(jù)的丟失。處理噪聲的過程稱為平滑。平滑可以通過卷積來實現(xiàn)。它針對原始圖像的每一個像素直接對其灰度進行處理的,其處理過程主要是通過增強函數(shù)對像素的灰度級進行運算并將運算結(jié)果作為該像素的新灰度值來實現(xiàn)的。二值化就是通過一些算法,通過一個閾值改變圖像中的像素顏色,令整幅圖像畫面內(nèi)僅有黑白二值,該圖像一般由黑色區(qū)域和白色區(qū)域組成,可以用一個比特表示一個像素,“1”表示黑色,“0”表示白色,當(dāng)然也可以倒過來表示,這種圖像稱之為二值圖像。該設(shè)計中采用組內(nèi)方差和組外方差來實現(xiàn)二值化。直方圖均衡[8]直方圖均衡化的目的是使一輸入圖像轉(zhuǎn)換為在每一灰度級上都有相同的象素點數(shù),它的處理的中心思想是把原始圖像的灰度直方圖從比較集中的某個灰度區(qū)間變成在全部灰度范圍內(nèi)的均勻分布,它的研究思路是:通過直方圖變換式來進行直方圖的均衡處理,直方圖變換式是但是直方圖均衡化存在著兩個缺點: 1)變換后圖像的灰度級減少,某些細節(jié)消失; 2)某些圖像,如直方圖有高峰,經(jīng)處理后對比度不自然的過分增強。由于眼睛具有對稱性,因此可以很快就能標(biāo)記出來,而鼻子是在眼睛下面,且嘴巴在鼻子下面,所以只要眼睛標(biāo)記好,鼻子和嘴巴也能相應(yīng)的標(biāo)記出來。 識別模塊該模塊通過與庫存中的特征向量進行比較,找出與特征最相近的參數(shù),再對該參數(shù)進一步分析。然后從庫存中提取出該人相關(guān)的信息,并顯示出來。第四章 系統(tǒng)的詳細設(shè)計本章主要對圖像處理這一模塊進行詳細介紹,對其子模塊所用到的算法及具體實現(xiàn)進行詳細講述。點擊攝像鍵,然后進行拍照,并將圖像顯示并保存。將處理好的人臉圖片進行定位,標(biāo)出眼睛、鼻尖和嘴巴。識別出圖片上的人。本系統(tǒng)中建立了一個專門的類DIB來處理設(shè)備無關(guān)位圖,表4-1列出了對位圖的操作函數(shù)。所以,點運算不可以改變圖像內(nèi)的空間關(guān)系。除了灰度級的改變是根據(jù)某種特定的灰度變換函數(shù)進行之外,點運算可以看作是“從像素到像素”的復(fù)制操作。點運算有時又稱為對比度增強、對比度拉伸或灰度變換,它是圖像數(shù)字化軟件和圖像顯示軟件的重要組成部分。光線補償(1)