freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

人臉識別技術(shù)研究本科畢業(yè)論文(編輯修改稿)

2025-07-25 11:19 本頁面
 

【文章內(nèi)容簡介】 臉圖像作為模式,那么光照、視角以及人臉尺寸會對人臉識別有很大的影響,因此如何能夠有效的去掉這些干擾就尤為關(guān)鍵。神經(jīng)網(wǎng)絡(luò)的方法在人臉識別上有其獨到的優(yōu)勢,即它避免了復(fù)雜的特征提取工作,可以通過學(xué)習(xí)的過程獲得其它方法難以實現(xiàn)的關(guān)于人臉識別的規(guī)律和規(guī)則的隱性表達。但是NN方法通常需要將人臉作為一個一維向量輸入,因此輸入節(jié)點龐大,降維就顯得尤為重要。根據(jù)文獻[32]對于自組織神經(jīng)網(wǎng)絡(luò)方法的分析,認為可采用自組織神經(jīng)網(wǎng)絡(luò)的P個節(jié)點來表達原始的N個輸入(PN),但由于將P個節(jié)點進行分類,其識別的效果僅相當(dāng)于提取人臉空間特征向量后進行的識別分類,因此采用此類神經(jīng)網(wǎng)絡(luò)進行識別的效果只能是特征臉的水平。除此之外,由于人臉處在高維空間,如一幅不大的100x100的圖像為10000維,這樣神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點將很龐大,因此實際訓(xùn)練網(wǎng)絡(luò)的參數(shù)繁多,實現(xiàn)起來很困難。神經(jīng)網(wǎng)絡(luò)方法的優(yōu)點是可以針對特定的問題進行子空間設(shè)計,比如用于人臉檢測、性別識別、種族識別等(不屬于本文的研究內(nèi)容)。鑒于以上考慮,本文未對此方法進行重點研究。圖12 可以提取的各種人臉特征,圖下方為各種特征的綜合方式通過對不同的人臉識別分類方法的總結(jié),多視角的、全面的介紹了主要的人臉識別方法。從對人臉識別方法的分析中可以看出,每種方法各有其優(yōu)缺點,因此一些學(xué)者傾向于將多種方法綜合起來,或同時利用不同種類的特征,圖12為人臉圖像可以提取的特征以及可能的特征綜合方法。在對各種人臉識別方法進行理論分析后,本文主要研究基于統(tǒng)計學(xué)習(xí)的、整體的人臉識別方法,包括特征臉法、基于獨立分量分析的人臉識別方法和基于隱馬爾可夫模型的人臉識別方法,并嘗試新的特征提取和分類方法。 人臉識別是近年來研究的熱點,各國研究人員提出了各種新的識別算法,為測試和比較各種識別技術(shù)的優(yōu)缺點及其識別率的高低,世界各研究機構(gòu)都建立了各自的人臉測試和測評數(shù)據(jù)庫,下面介紹一些著名的標(biāo)準(zhǔn)數(shù)據(jù)庫。1. 英國ORL(O一Olivertti Research Laboratory)人臉數(shù)據(jù)庫 ORL人臉圖像庫是由英國劍橋011vetti實驗室從1992年4月到1994年4月期間拍攝的一系列人臉圖像組成,共有40個不同年齡、不同性別和不同種族的對象。每個對象10幅圖像共計400幅灰度圖像組成,圖像尺寸為92xlZl,圖像背景為黑色。其中人臉部分表情和細節(jié)均有變化,例如笑與不笑,眼睛睜著或閉著,戴或不戴眼鏡等,人臉姿態(tài)也有變化,其深度旋轉(zhuǎn)和平面旋轉(zhuǎn)可達20度,人臉的尺寸也有最多10%的變化。該庫是目前使用最廣泛的標(biāo)準(zhǔn)數(shù)據(jù)庫,它含有大量的比較結(jié)果。2. 英國Manchester人臉數(shù)據(jù)庫 該數(shù)據(jù)庫由30人的690幅圖像組成,圖像有不同的光照和背景特征,而且對于每個人而言,前后兩張照片之間的時間間隔至少為3周。訓(xùn)練集對光源有一定的約束。雖然Manchester人臉數(shù)據(jù)庫遠比ORL數(shù)據(jù)庫全面,但因發(fā)表的比較結(jié)果不夠多,從而遠不如ORL數(shù)據(jù)庫使用廣泛。3. Yale耶魯人臉庫 該數(shù)據(jù)庫包括15人每個人11幅正視圖,每幅圖像具有不同的面部表情、有或者無眼鏡,這些圖像在不同光照條件下拍攝。該庫的特點就是光照變化顯著,且有面部部分遮掩。4. 歐洲M2VTS多模型數(shù)據(jù)庫 該庫是用來作為多模型輸入的通路控制實驗,它包括37個人的序列人臉圖像。每人的5幅圖像間隔一個星期,每個圖像序列包括從右側(cè)輪廓(90度)到左側(cè)輪廓(90度)之間的圖像,而且拍攝時每個人用他們的母語從一到九數(shù)數(shù)。該庫主要用于測試多模式身份識別。5. 美國FERET(Face Recognition Technology)人臉數(shù)據(jù)庫 FERET人臉數(shù)據(jù)庫是目前最大的人臉數(shù)據(jù)庫,由美國軍方研究實驗室提供,其中每人的圖像數(shù)目不等,有些人提供了更多不同視點和不同表情的照片。該數(shù)據(jù)庫中不包含戴眼鏡的照片,拍攝條件也有一定的限制。人臉大小約束在規(guī)定范圍內(nèi)。1996年6月,該數(shù)據(jù)庫己存儲了1199個人的14126幅圖像,而且逐年增加。但到目前為止,該數(shù)據(jù)庫并未提供運動圖像系列或包含語言信息。FERTE數(shù)據(jù)庫的最大缺點是非美研究機構(gòu)的獲取不便。其他數(shù)據(jù)庫還有CMU(Carnegie Mellon University)正面人臉數(shù)據(jù)庫,MIT單人臉數(shù)據(jù)庫等。不同的人臉數(shù)據(jù)庫,圖像的質(zhì)量和內(nèi)容也是不同的,為了客觀的、全面的測試人臉識別方法的性能,考慮不同因素對識別方法的影響,本文的人臉識別方法主要應(yīng)用了ORL、Manchester、Yale和部分FERET人臉數(shù)據(jù)庫進行測試。 本文主要研究基于靜止圖像的正面人臉識別技術(shù),方法包括基于主分量分析的人臉識別方法、基于獨立分量分析的人臉識別方法和基于隱馬爾可夫模型的人臉識別方法。在分析人臉識別方法理論基礎(chǔ)的同時,針對其中的特征提取與分類識別的關(guān)鍵環(huán)節(jié)進行了改進,提高了識別性能。 第2章 基于主分量分析的人臉識別方法 早期的人臉識別方法主要是基于幾何特征的方法和基于模板匹配的方法?;谥鞣至糠治?Pr1neipal Components Analysis,PCA)的人臉識別方法是首次將人臉看作一個整體,特征提取由手工定義到利用統(tǒng)計學(xué)習(xí)自動獲取特征,是人臉識別方法上的一個重要轉(zhuǎn)變。在該方法的發(fā)展過程中,sirovich和Kirby首先將K一L變換(Karhunen一Loeve Transfer)用于人臉圖像的最優(yōu)表示[33],Turk和Pentland進一步提出了“特征臉”(Eigenfaces)這個概念,該方法又被稱為“特征臉法”[34]。特征臉法是將整個人臉的圖像區(qū)域看作一隨機向量,通過CPA獲取正交向量基的方法。其中對應(yīng)較大特征值的向量基具有與人臉相似的形狀,所以被稱為特征臉,如圖21。圖21 FERET人臉庫中提取的特征臉示例利用這些向量基的線性組合可以描述、表達和逼近人臉圖像,因此可以進行人臉的識別與合成。識別過程就是將人臉圖像映射到由特征臉張成的子空間上,比較其與己知人臉在特征臉空間中的位置,完成分類識別的。PAC至今仍是傳統(tǒng)的人臉特征提取方法。 本章首先以多維數(shù)據(jù)的統(tǒng)計變換的概念引出主分量分析的基本理論和主要特點;其次介紹基于CPA的人臉特征提取方法和人臉識別方法:最后從理論分析結(jié)合實驗結(jié)果論述基于PCA的人臉識別方法存在不足。人臉圖像原始特征的數(shù)量很大,或者說樣本處于一個高維空間中,通過映射(或變換)的方法可以用低維空間來表示樣本,這個過程稱為特征提取。如果不對特征進行選擇而直接進行分類器設(shè)計,無論從計算的復(fù)雜程度還是分類器性能來看都是不適宜的。因此研究如何將高維數(shù)據(jù)空間壓縮到低維特征空間以便有效的識別分類便成為一個重要的課題。特征的選擇和提取的基本任務(wù)是從樣本的許多特征中找出那些最有效的特征,所以它滿足以下兩條原則:,降低人臉表示的維數(shù),減少數(shù)據(jù)計算量;,最能表現(xiàn)不同人臉間差異的特征,以提高識別率。映射后的特征稱為二次特征,它們是原始特征的某種組合(通常是線性組合)。所謂特征提取在廣義上就是一種變換。在科學(xué)研究的眾多研究領(lǐng)域,一個普遍存在的問題是如何從采集的數(shù)據(jù)中獲取信息。隨著科技的高速發(fā)展,大量數(shù)據(jù)的測量及存儲已經(jīng)不再成為問題,但是獲取數(shù)據(jù)本身所含的信息是不夠的,提取產(chǎn)生這些數(shù)據(jù)的系統(tǒng)的固有的信息才是根本目的所在。在諸如數(shù)據(jù)分析、信號處理、神經(jīng)網(wǎng)絡(luò)等應(yīng)用領(lǐng)域,找到多維數(shù)據(jù)的一個恰當(dāng)?shù)拿枋鍪墙?jīng)常會遇到的問題。為了使問題盡可能的簡單化以及考慮到計算的復(fù)雜性,最好使得這種描述是一個對原始數(shù)據(jù)的線性變換,因為這會對各種形式的后繼分類帶來極大的方便,如數(shù)據(jù)壓縮、特征提取、模式識別等。在多維信號處理中,為了便于研究,通常把采集得到的數(shù)據(jù)(如一系列人臉圖像)看作多維隨機信號的一系列樣本值,以便于將隨機矢量的數(shù)值統(tǒng)計方法[36][37]應(yīng)用到原數(shù)據(jù)。這樣做雖然忽略了信號的時間特性,但是可以盡可能的利用其統(tǒng)計特性。假設(shè)所有分量都是零均值的,即有E{x}=0,如果不滿足此條件,通過減去其均值可以很容易獲得。對多維信號x=(x1,x2,…,xn)T的某一觀測樣本矢量,其中x1,i=l,2,…,n為各個分量,按照某種規(guī)則對其做線性變換,記為T:Rn→Rm, Y=Tx (21)y=(y1,y2,…,ym)T為變換后的結(jié)果。假設(shè)這里T是一個線性變換,于是y中的每個分量都是原數(shù)據(jù)所有分量的線性組合: (22)對應(yīng)每個yi的一組系數(shù)wij,j=1,2,…,n稱為一個基向量,式(22)寫出矩陣形式為: Y=Wx (23)所以多維數(shù)據(jù)的線性變換就是按照一定的準(zhǔn)則尋找一系列的加權(quán)系數(shù)瑪組成線性變換矩陣砰中的各個基向量(碎的行向量),而這m個基向量構(gòu)成一個新的坐標(biāo)系。將原數(shù)據(jù)在這樣一個坐標(biāo)系上展開,得到各個分量便是變換的結(jié)果。要求變換后的數(shù)據(jù)夕在最大程度上體現(xiàn)原數(shù)據(jù)間隱含的實質(zhì)結(jié)構(gòu),并且y的各個分量盡可能的代表產(chǎn)生原數(shù)據(jù)的系統(tǒng)本身的物理機制。基于多維隨機變量統(tǒng)計分析的框架,變換矩陣砰的尋找方法通常是建立在一個體現(xiàn)輸出結(jié)果y的統(tǒng)計特性的目標(biāo)函數(shù)g(y)的基礎(chǔ)上。而這種統(tǒng)計特性因算法中的基本準(zhǔn)則不同而不同,可能是一階、二階的,如相關(guān)系數(shù)、協(xié)方差等;也可能是高階的,如互信息、非高斯性等,這樣隨之產(chǎn)生了不同的線性變換技術(shù),如主分量分析(PCA)、奇異值分解(SVD)、投影法(Projection Pursuit)等[38]。簡而言之,所有的線性變換都是尋找這樣的砰矩陣,只是因輸出y的目標(biāo)函數(shù)的不同,使得不同方法得到不同的變換矩陣。主分量分析的目的是在數(shù)據(jù)空間中找到一組向量以盡可能的解釋數(shù)據(jù)的方差,最終將數(shù)據(jù)從原來的n維空間降到m維(nm),降維后仍保存了數(shù)據(jù)中的主要信息。主分量分析是一種正交變換,在多維數(shù)據(jù)統(tǒng)計分析中是一個應(yīng)用廣泛的工具。假設(shè)原始向量特征維數(shù)為n,即xi=(xi1,xi2,…,xni)T,i=1,2,…,N,要求構(gòu)造N個新的特征yl,y2,…,yn,并使它們滿足以下的條件:,即 (24) b. 各個新變量之間是不相關(guān)的,即相關(guān)系數(shù)為零: (25) c. wi使yi的能量達到極大,i=1,2,…,N 可以證明滿足條件的城為樣本的協(xié)方差矩陣Sx=E{XXT},對應(yīng)于λi特征值的正交規(guī)范化的特征向量ui,滿足以上條件的新特征y1,y2,…,yn分別稱為樣本點的第1,2,…,N個主分量。令W=(ul,u2,…,un)T,且滿足正交歸一化,即 (26)經(jīng)過Y=WTX的變換之后,因為X的協(xié)方差矩陣SX為實對稱陣必然與一個對角陣相似,所以對應(yīng)于Y的協(xié)方差矩陣如下式: (27) 這就是說,新特征y1,y2, …,yn兩兩之間的協(xié)方差為零,即它們是不相關(guān)的。由于yi也是零均值,每個特征的方差數(shù)值E{yi2}在一定意義下反映了它所包含的能量即信息量。由前面敘述可知,所有這些映射矢量作為基向量,便構(gòu)成主分量分析對應(yīng)的變換矩陣W={w1,w2,…,wm,…,wn,}T其中前幾個基向量wl,w2,…,wm,對應(yīng)能量占主導(dǎo)地位的幾個主分量的映射方向,現(xiàn)將余下的基向量置零,得到W?={wl,w2,…,wm,0,0,…,0}T。利用W?對信號進行近似恢復(fù),得到x?=W?W? Tx。其中W? Tx為所選擇的前m個主分量。重構(gòu)信號的均方誤差為E{||xx?||2}。當(dāng)選擇m個主分量去重構(gòu)原信號時,由于原信號的維數(shù)nm,所以從信號維數(shù)的角度來講PCA起到了對信號降維的作用。在很多情況下,有效的降維會使得在最大程度保持原信號中所蘊涵的信息的情況下,大大降低運算復(fù)雜度。譬如在進行人臉識別應(yīng)用中,輸入的人臉圖像的維數(shù)往往很高,采用P以方法對其進行特征提取可以降低樣本的維數(shù),從而降低計算復(fù)雜度,提高了計算速度。 主分量分析是是一種基于統(tǒng)計特征的最佳正交變換,稱其為最佳變換是因為它具有優(yōu)良的性質(zhì),使變換后產(chǎn)生的新的分量正交或不相關(guān)。主分量分析也是一種最小均方誤差(MSE)意義下的最優(yōu)變換[39]。也就是說,變換后的信號能量主要集中在前幾個主分量中,而由這少數(shù)幾個主分量張成的子空間去重構(gòu)原信號,逼近效果從最小均方誤差意義下是最優(yōu)的。主分量分析使變換矢量更趨確定,能量更趨集中等,這使得它在特征提取、數(shù)據(jù)壓縮等方面都有著及其重要的作用。任何基于統(tǒng)計學(xué)習(xí)的模式識別系統(tǒng)都包括兩個過程,一個是訓(xùn)練階段(training Process),二是測試階段(testing process),且兩個階段都需要特征提取,應(yīng)用CAP的人臉識別系統(tǒng)也不例外。假定在訓(xùn)練階段,數(shù)據(jù)庫中有K個人,每個人有M幅人臉灰度圖像,其中每一幅圖像都用NxN的二維數(shù)組I(x,y)來表示,數(shù)組元素表示象素點的灰度值。同樣,每一幅圖像都可以視為一個N2xI的向量。因此,它等同于N2維的人臉象素域空間中的一個點。設(shè)xij表示一個N2xI的向量來表示數(shù)據(jù)庫中第i個人的第j幅圖像(0≤i≤k1,0≥j≥M1)然后,定義平均人臉μ如下: (28)表示了每一幅人臉與平均人臉的差值,它是零均值的。它們組成了一個N2xMK的矩陣,=(00, 01, …,K1,M1), PCA方法就是要找到對應(yīng)于矩陣T 的前m個較大特征λi 的正交規(guī)范化的特征向量μi : (29)因為T 是N2xN2 的矩陣,求它的N2個特征值的計算量非常大。一般而言,訓(xùn)練過程中人臉數(shù)據(jù)庫里的圖像數(shù)目MxK比人臉空間的維度N2要小,所以我們可以先求得T 見的正交規(guī)范化的特征向量城μi?:
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1