freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于pca的人臉識(shí)別研究畢業(yè)論文(編輯修改稿)

2024-10-02 15:16 本頁面
 

【文章內(nèi)容簡介】 法及隱馬爾可夫模型方法等等?;诰植刻卣鞣治龅姆椒ㄗR(shí)別結(jié)果取決于特征定位算法的準(zhǔn)確性,而且要求圖像的像素較高,因此要近距離拍攝圖片。基于整體的識(shí)別方法也各自有自己的缺陷,所以近年來的研究趨勢(shì)是將人臉的局部特征分析和整體識(shí)別結(jié)合起來。 常用的人臉識(shí)別方法 對(duì)人臉識(shí)別方法的研究主要有兩大方向:一是基于人臉圖像局部特征的識(shí)別方法;二是基于人臉圖像整體特征的識(shí)別方法?;谌四槇D 像局部特征的識(shí)別通常抽取人臉器官如眼睛、眉毛、鼻子和嘴等器官的位置,尺度以及彼此間的比率作為特征。進(jìn)一步地可以用幾何形狀擬合人臉器官,從而以幾何參數(shù)作為描述人臉的特征。由于此類方法通常要精 7 確地抽取出位置、尺度、比率或幾何參數(shù)作為描述人臉的特征,因此對(duì)人臉圖像的表情變化比較敏感。同時(shí),人臉器官分割的精確度也對(duì)人臉特征的提取有一定的影響。另外,該類方法并沒有充分利用到人臉圖像本身具有的獲度信息,該方向已經(jīng)不是人臉識(shí)別技術(shù)發(fā)展的主流方向?;谌四槇D像整體特征的人臉識(shí)別方法由于不需要精確提取人臉圖像中部件的具體信息 ,而且可以充分利用到人臉圖像本身具有的灰度信息,因此可獲得更好的識(shí)別性能。目前,絕大部分關(guān)于人臉識(shí)別方法的文章都是基于人臉圖像整體特征的,主要有特征臉法、最佳鑒別向量集法,貝葉斯法,基于傅立葉不變特征法,彈性圖匹配法,其他相關(guān)方法有線性子空間法,可變形模型法和神經(jīng)網(wǎng)絡(luò)法。這些方法中有的側(cè)重于表述人臉圖像的特征提取,如彈性圖匹配法和傅立葉不變特征法;有的則側(cè)重于分類,如最佳鑒別向量集法、貝葉斯法和神經(jīng)網(wǎng)絡(luò)法;而有的則側(cè)重于人臉圖像重構(gòu),如特征臉法和線性子空間法。所有這些基于人臉圖像整體特征的人臉識(shí)別方法均取得 了一定的識(shí)別性能。 基于幾何特征的人臉識(shí)別方法 基于幾何特征的人臉識(shí)別方法主要源于人臉識(shí)別的初期研究階段。這種方法是以人臉各個(gè)器官和幾何關(guān)系為基礎(chǔ)進(jìn)行算法設(shè)計(jì)。對(duì)于不同人來說,臉上的各個(gè)器官,如眼睛、鼻子、嘴巴以及整個(gè)臉部的輪廓具有不同的形狀、大小、相對(duì)位置和分布情況。 在基于幾何特征的人臉識(shí)別方法中,可以用一個(gè)矢量來表示提取出來的幾何參數(shù)。如果要獲得一個(gè)準(zhǔn)確、穩(wěn)定和可靠的識(shí)別結(jié)果,就要求這些被選出的幾何特征參數(shù)包含足夠豐富的辨識(shí)人臉的信息,且能反映不同人臉之間的差別。也就是說對(duì)這些矢量要求具有較 高的模式分類能力,同時(shí)還要有一定的穩(wěn)健性,能夠消除由于時(shí)間變遷、光照變化等其他干擾因素所帶來的影響。具體來說,這些幾何參數(shù)一般包括人臉上兩個(gè)指定特征點(diǎn)之間的歐式距離、邊緣曲率、角度等等。 在 Brunelli 和 Poggio 的文獻(xiàn)中給出了一組典型的人臉幾何特征參 8 數(shù): (1)眉毛的厚度 (2)眉毛與眼睛中心的垂直距離; (3)描述左眼眉毛弧度的 12 個(gè)數(shù)據(jù); (4)鼻子的寬度; (5)鼻子在面部上的位置; (6)嘴巴的垂直位置、嘴巴的寬度和上下嘴唇的亮度; (7)描述下顎形狀的 11個(gè)半徑數(shù)據(jù); (8)以鼻子位置為準(zhǔn) 的臉部寬度; (9)顴骨寬度 (半臉寬 )。 當(dāng)這些幾何特征參數(shù)提取出來后,就可以采用最小距離 (歐式距離 )分類器,將待識(shí)別人臉特征向量與數(shù)據(jù)庫中人臉特征矢量進(jìn)行比較,取距離最近者作為識(shí)別結(jié)果。 在實(shí)際應(yīng)用過程中,基于幾何特征的人臉識(shí)別方法存在著兩個(gè)方面的問題: (1)如何快速、準(zhǔn)確地檢測(cè)出人臉的重要標(biāo)志點(diǎn)依然是一個(gè)沒有很好解決的問題。 (2)臉部幾何特征在人臉辨識(shí)中的有效性問題,即臉部幾何特征能夠提供多少可供識(shí)別的信息量。 雖然各人臉的器官在形狀、大小及分布上各不相同,但是這種器官上的差異性更多是體現(xiàn)在某些細(xì)微 的感覺意義上。例如眼睛顯得比較小、鼻子顯得比較寬,以及皮膚的紋理、顏色上的差異等等。顯然,這些特征中的一部分是難以精確測(cè)量出來或者是不能用幾何參數(shù)準(zhǔn)確描述的。所以僅靠增加臉上幾何參數(shù)的數(shù)目來提高人臉識(shí)別率是不太現(xiàn)實(shí)的。由于進(jìn)一步改善測(cè)量精度是十分困難的,因而通過增加臉部幾何參數(shù)的數(shù)量來改善識(shí)別率結(jié)果,其影響是極小的。因此,基于少量人臉幾何特征進(jìn)行大規(guī)模人臉辨識(shí)的可靠性是不容樂觀的。 9 基于 KL變換的特征臉方法 基于特征臉的人臉識(shí)別方法的基礎(chǔ)是 KL 變換。 KL變換是圖像壓縮中的一種最優(yōu) 正交變換。通過 KL 變換,可以把圖像在高維空間表示轉(zhuǎn)換到低維空間表示,而由低維空間恢復(fù)的圖像和原圖像具有最小的均方誤差,從而可以以圖像在低維空間的變換系數(shù)作為人臉圖像的描述特征。KL 變換用于人臉識(shí)別的前提是人臉圖像處于低維空間,并且不同人臉是線性可分的。通常情況下, KL 變換的變換矩陣由訓(xùn)練樣本類間散布矩陣的特征矢量生成。人臉圖像在前面的特征矢量上的投影有較大的能量,稱為主分量 。在后面的特征矢量上的投影具有較小的能量。稱為次分量。當(dāng)舍棄部分次分量時(shí), KL 變換也稱為主成分分析法 (PCA)。由于人臉圖像具有相似的形狀和結(jié)構(gòu),人臉 圖像在主分量上的投影過多地反映了光照變化,因此有人提出舍棄人臉圖像在前 3 個(gè)特征矢量上的投影,而用人臉圖像在其余特征矢量上的投影作為描述人臉圖像的特征。 KL 變換是數(shù)字圖像壓縮領(lǐng)域里的一種最優(yōu)變換,它使從低維空間恢復(fù)的人臉圖像和原圖像的均方誤差最小。但 KL 變換只是從壓縮角度來看是最優(yōu)的,從分類角度來看卻不是最優(yōu)的。雖然它考慮了人臉圖像的所有差異 (從壓縮角度 ),但沒有考慮這些差異是類內(nèi)差異 (如光照變化,頭飾變化或幾何變化 )還是類間差異 (從分類角度 )。 KL 變換是圖像壓縮的一種最優(yōu)正交變換,人們將它應(yīng)用 于特征提取,形成了子空間法模式識(shí)別的基礎(chǔ)。將 KL 變換用于人臉識(shí)別,需要假設(shè)人臉處于低維的線性空間,不同人臉具有可分性。高維的圖像空間經(jīng)過 KL 變換后得到一組新的正交基,保留其中重要的正交基從而形成了低維的人臉空間。 若將所有子空間的正交基排列成圖像陣列,則正交基呈現(xiàn)人臉的形狀,因此這些正交基也被稱為特征臉。選擇那些正交基形成的子空間則有不同的考慮,與較大特征值對(duì)應(yīng)的一些正交基 (也稱主分量 )能夠表達(dá)人臉的大體形狀,而具體細(xì)節(jié)需要那些小特征值對(duì)應(yīng)的特征向量 (也稱次 10 分量 )來加以補(bǔ)充描述,因此低頻成分用主分量表示 ,高頻分量用次分量表示。采用主分量作為新的正交空間的正交基的方法稱為主分量_(Principal Component Analysis,簡稱 PCA)方法。 KL 變換在 90 年代初受到了很大的重視,實(shí)際用于人臉識(shí)別取得了很好的效果,一般庫德大小為 100 幅左右,識(shí)別率在 70% 100%之間不等,這主要取決于人臉庫圖像的質(zhì)量。從壓縮能量的角度來看, KL 變換是最優(yōu)的,變換后的低維空間對(duì)于人臉有很好的表達(dá)能力,較好的判別能力。選擇訓(xùn)練樣本的散布矩陣作為 KL 變換的生成矩陣,其最大特征向量反映了該樣本集合的最大分布 的方向,但這是圖像統(tǒng)計(jì)方法,而不是人臉統(tǒng)計(jì)方法。它查找的是圖像之間所有的差異,并根據(jù)這些差異來確定不同人臉間的距離,而不管這些差異是由于光線、發(fā)型或背景的改變引起的,還是屬于人臉本身的內(nèi)在差異,因此特征臉的方法用于人臉識(shí)別存在理論的缺陷。研究表明,特征連的方法隨著光線、角度以及人臉的尺寸的引入而識(shí)別率急劇下降。主分量的方法使得變換后的表達(dá)能力最佳,次分量的方法考慮了高頻的人臉區(qū)分能力,但是由于外在因素帶來圖像差異和人臉本身帶來的差異對(duì) KL變換而言是不加任何區(qū)分的,因此,如何選擇正交基并不根本解決問題。改進(jìn) 的一個(gè)思路是針對(duì)干擾所在,對(duì)輸入圖像作規(guī)范化處理,包括輸入圖像的均值方差歸一化,人臉尺寸歸一化。另一種改進(jìn)是考慮到局部人臉圖像受到外在干擾相對(duì)較小的情況,除了計(jì)算特征臉之外,還利用 KL 變換計(jì)算出特征眼、特征嘴等。將局部特征向量加權(quán)進(jìn)行匹配得到一些好的效果。 總之,特征臉方法是一種簡單、快速、使用的基于變換系數(shù)的算法,但由于它在本質(zhì)上依賴于訓(xùn)練集合測(cè)試集圖像的灰度相關(guān)性,而且要求測(cè)試圖像與訓(xùn)練集比較接近,所以存在著很大局限。 神經(jīng)網(wǎng)絡(luò)方法 人工神經(jīng)網(wǎng)絡(luò)是一種以大量的處理單元 (神經(jīng)元 )為節(jié)點(diǎn),處理單 元之間實(shí)現(xiàn)加權(quán)值互連的拓?fù)浣Y(jié)構(gòu)。人工神經(jīng)網(wǎng)絡(luò)中的處理單元是人類大 11 腦神經(jīng)單元的簡化。處理單元之間的互連則是軸突、樹突這些信息傳遞路徑的簡化。根據(jù)不同的應(yīng)用場(chǎng)合,現(xiàn)已研究出較多的神經(jīng)元網(wǎng)絡(luò)模型及其動(dòng)態(tài)過程的算法。 人工神經(jīng)元通常采用非線性的作用函數(shù),當(dāng)大量神經(jīng)元連接成一個(gè)網(wǎng)絡(luò)并動(dòng)態(tài)運(yùn)行時(shí),則構(gòu)成了一個(gè)非線性動(dòng)力學(xué)系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)具有自組織性、高維性、模糊性、分布性和冗余性等等特點(diǎn),較馮 諾依曼體系的計(jì)算機(jī)更適合模擬人類大腦的思維機(jī)理。但總的來說,由于人類對(duì)自身思維機(jī)理認(rèn)識(shí)的不足,所以對(duì)人工神經(jīng)元作了極度的簡化 ,這種模擬表現(xiàn)為極其膚淺和簡單。 很多臉部識(shí)別系統(tǒng)都采用了多層感知機(jī) (Multi. Layer Perceptor)作為人工神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)。多層感知機(jī)由幾層全互連的非線性神經(jīng)組成。神經(jīng)元之間有權(quán)值連接,權(quán)值包含了訓(xùn)練模式空間的特征。訓(xùn)練過程就是調(diào)整權(quán)值的過程,最常用的算法就是 BP法則。 采用多層感知機(jī)進(jìn)行面部識(shí)別的目的就是建立一個(gè)關(guān)于臉部的緊湊表示,這相當(dāng)于面部特征的抽取。因?yàn)殡[層節(jié)點(diǎn)的數(shù)目 L 通常要遠(yuǎn)遠(yuǎn)小于輸入層和輸出層的節(jié)點(diǎn)數(shù)目,從而多層感知機(jī)將高維德輸入數(shù)據(jù)變換到一個(gè)低維子空間中,同時(shí)保留了原始數(shù)據(jù)中 最重要的信息。如果隱層神經(jīng)元采用線性作用函數(shù),則多層感知機(jī)張成的降維子空間將與主元分析法張成的子空間一樣。主元分析法的方差是由大到小排列的,而多層感知機(jī)的方差是均勻分布到每個(gè)隱層神經(jīng)元上。 多層感知機(jī)的輸入形式有很多種,最簡單的就是將整個(gè)人臉圖像作為輸入層,也可以對(duì)人臉圖像進(jìn)行采樣,然后用低分辨率圖像作為輸入層。還有的文獻(xiàn)采用了二進(jìn)制圖像的等密度區(qū)域或多個(gè)局部面部特征作為不同多層感知機(jī)的輸入層。 直接使用 BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識(shí)別的問題在于網(wǎng)絡(luò)過于龐大和復(fù)雜,例如對(duì)于一幅 128 128 的人臉圖像,輸入層和輸出 層的節(jié)點(diǎn)數(shù)目將達(dá) 16438。顯然,訓(xùn)練這樣大的一個(gè)網(wǎng)絡(luò)將花費(fèi)很長時(shí)間,需要的存儲(chǔ)量 12 也會(huì)很高。由此可以看出,人工神經(jīng)網(wǎng)絡(luò)有著與 Eigenface 方法非常相似的表達(dá)方法。一般來說, BP 算法的收斂速度非常緩慢,學(xué)習(xí)過程可能需要對(duì)整個(gè)訓(xùn)練集進(jìn)行上千次反復(fù)迭代運(yùn)算,這是神經(jīng)網(wǎng)絡(luò)實(shí)際應(yīng)用的一個(gè)問題。此外, BP 算法以誤差梯度下降的方式達(dá)到極小值,但在實(shí)際應(yīng)用中,容易陷入到局部極小中,無法得到全局最優(yōu)解,這也是有待解決的一個(gè)問題。 彈性匹配圖臉部識(shí)別方法 在利用圖匹配進(jìn)行識(shí)別的方法中,一個(gè)目標(biāo) (如一個(gè)人臉圖像 )可 以采用一張圖 (Graph)來表示。根據(jù)局部化空間頻率得到的一系列多分辨率秒數(shù)值可以用來表示圖中的節(jié)點(diǎn)數(shù)值。物體內(nèi)部的空間關(guān)系則可以用節(jié)點(diǎn)之間的幾何距離表示。 Gabor變換是進(jìn)行時(shí)頻分析的有效工具,該函數(shù)在時(shí)間域和頻率域上都是局部化的,通常將 Gabor 特征用到針對(duì)臉部識(shí)別的彈性圖匹配中。Gabor特征在網(wǎng)格節(jié)點(diǎn)上提供了一個(gè)多尺度邊緣強(qiáng)度。一般來說,圖像中的關(guān)鍵部位會(huì)有較大的 Gabor 系數(shù)。同樣的,對(duì)于一個(gè)待識(shí)別的人臉圖像也可以定義一個(gè)網(wǎng)格 G 及網(wǎng)格上的特征矢量。在彈性圖匹配 (Elastic Graph Matching)方法中,兩幅圖的距離是通過尋找 G 與 M之間的最優(yōu)匹配來得到。 在彈性圖匹配方法中,將人臉圖像庫中的圖像和待識(shí)別圖像都用特征矢量圖表示。通過對(duì)突遇圖之間的拓?fù)浣Y(jié)構(gòu)的匹配以及節(jié)點(diǎn)與節(jié)點(diǎn)之間的特征矢量值的比較,可以進(jìn)行人臉識(shí)別,這就將模板的圖像匹配轉(zhuǎn)化成了模板的圖匹配。在尋找最佳匹配方法時(shí),希望能夠同時(shí)維持特征數(shù)值接近和局部幾何關(guān)系。彈性圖匹配方法的最大優(yōu)點(diǎn)在于對(duì)光和表情變化的相對(duì)不敏感性。這主要?dú)w功于兩個(gè)原因: (1)用 Gabor變換可提取圖像的局部多分辨率特征; (2)在計(jì)算距離或者能量函數(shù)時(shí),使用 了變形匹配方法。 彈性匹配圖方法的主要缺點(diǎn)在于計(jì)算量大。 13 隱馬爾可夫模型的識(shí)別方法 隱馬爾可夫模型 (Hidden Markov Model)一般應(yīng)用于非平穩(wěn)時(shí)間序列矢量的統(tǒng)計(jì)建模,在語音處理,特別是語音識(shí)別中得到廣泛的應(yīng)用。隱馬爾可夫模型為一個(gè)觀測(cè)序列提供了一個(gè)統(tǒng)計(jì)模型 n 引,該模型由兩個(gè)互相關(guān)聯(lián)的過程組成: (1)一個(gè)是底層不可觀測(cè)的馬爾可夫鏈,它由有限個(gè)狀態(tài)、一個(gè)概率轉(zhuǎn)移矩陣和一個(gè)初始狀態(tài)概率分布函數(shù)組成。 (2)另外是一組聯(lián)系每一個(gè)狀態(tài)的概率密度函數(shù)。 在使用隱馬爾可夫模型的面部識(shí)別方法中,首 先將一個(gè)人臉圖像采集成一系列的條狀圖,將一幅二維圖像變成一個(gè)一維矢量序列,這個(gè)序列構(gòu)成了隱馬爾可夫模型的觀測(cè)矢量。由于人臉的特定構(gòu)造,在這種抽樣方式下,臉部特征帶的出現(xiàn)將服從于一定的順序,所以該模型可以用一個(gè)從左到右的隱馬爾可夫模型表示,其中狀態(tài)的轉(zhuǎn)移只能按照從左到右的方式進(jìn)行。接著是訓(xùn)練該隱馬爾夫模型,由以下幾個(gè)步驟組成: (1)建立一個(gè)隱馬爾可夫模型; (2)用訓(xùn)練數(shù)據(jù)迭代計(jì)算初始參數(shù)值; (3)用 Baum— Welch方法重新估計(jì)參數(shù)值。 識(shí)別通過一個(gè) Viterbi 識(shí)別器完成,用代表不同人的隱馬爾可夫模型與待識(shí)別圖像匹配,最高匹配者被選出來。 基于 FISHER 線性判別式的方法 提出了一種基于 Fisher 線性判別式的人臉識(shí)別方法,與 Eigenface
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1