freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

行業(yè)研究報告-人臉檢測算法綜述(已修改)

2025-08-01 13:46 本頁面
 

【正文】 人臉檢測算法綜述 導言 人臉檢測是目前所有目標檢測子方向中被研究的最充分的問題之一,它在安防監(jiān)控,人證比對,人機交互,社交和娛樂等方面有很強的應用價值,也是整個人臉識別算法的第一步。在本文中, SIGAI 將和大家一起回顧人臉檢測算法的整個發(fā)展歷史。 問題描述 人臉檢測的目標是找出圖像中所有的人臉對應的位置,算法的輸出是人臉外接矩形在圖像中的坐標,可能還包括姿態(tài)如傾斜角度等信息。下面是一張圖像的人臉檢測結果: 雖然人臉的結構是確定的,由眉毛、眼睛、鼻子和嘴等部位組成,近似是一個剛體,但由于姿態(tài)和表情的變化,不同人的外觀差異,光照,遮擋的影響,準確的檢測處于各種條件下的人臉是一件相對困難的事情。 人臉檢測算法要解決以下幾個核心問題: 人臉可能出現(xiàn)在圖像中的任何一個位置 人臉可能有不同的大小 人臉在圖像中可能有不同的視角和姿態(tài) 人臉可能部分被遮擋 評價一個人臉檢測算法好壞的指標是檢測率和誤報率。我們將檢測率定義為: 誤報率定義為: 算法要在檢測率和誤報率之間做平衡,理想的情況是有高檢測率,低誤報 率。 經(jīng)典的人臉檢測算法流程是這樣的:用大量的人臉和非人臉樣本圖像進行訓練,得到一個解決 2 類分類問題的分類器,也稱為人臉檢測模板。這個分類器接受固定大小的輸入圖片,判斷這個輸入圖片是否為人臉,即解決是和否的問題。人臉二分類器的原理如下圖所示: 由于人臉可能出現(xiàn)在圖像的任何位置,在檢測時用固定大小的窗口對圖像從上到下、從左到右掃描,判斷窗口里的子圖像是否為人臉,這稱為滑動窗口技術( sliding window)。為了檢測不同大小的人臉,還需要對圖像進行放大或者縮小構造圖像金字塔,對每張縮放后的圖像都用上面的方法進行掃描。由于采用了滑動窗口掃描技術,并且要對圖像進行反復縮放然后掃描,因此整個檢測過程會非常耗時。 由于一個人臉附件可能會檢測出多個候選位置框,還需要將檢測結果進行合并去重,這稱為非極大值抑制( NMS)。多尺度滑動窗口技術的原理如下圖所示: 以 512x512 大小的圖像為例,假設分類器窗口為 24x24,滑動窗口的步長為 1,則總共需要掃描的窗口數(shù)為: 即要檢測一張圖片需要掃描大于 120 萬個窗口?。?!計算量驚人,因此有必要采取某種措施提高效率,具體解決方案本文會給出。 典型應用 人臉檢測是機器視覺領域被深入研究的經(jīng)典問題,在安防監(jiān)控、人證比對、人機交互、社交等領域都有重要的應用價值。數(shù)碼相機、智能手機等端上的設備已經(jīng)大量使用人臉檢測技術實現(xiàn)成像時對人臉的對焦、圖集整理分類等功能,各種虛擬美顏相機也需要人臉檢測技術定位人臉,然后才能根據(jù)人臉對齊的技術確定人臉皮膚、五官的范圍然后進行美顏。在 人臉識別的流程中 ,人臉檢測是整個人臉識別算法的第一步。 早期算法 我們將整個人臉檢測算法分為 3 個階段,分別是早期算法, AdaBoost 框架,以及深度學習時代,在接下來將分這幾部分進行介紹。 早期的人臉檢測算法使用了模板匹配技術,即用一個人臉模板圖像與被檢測圖像中的各個位置進行匹配,確定這個位置處是否有人臉;此后機器學習算法被用于該問題,包括神經(jīng)網(wǎng)絡,支持向量機等。以上都是針對圖像中某個區(qū)域進行人臉非人臉二分類的判別。 早期有代表性的成果是 Rowley 等人提出的方法 [1][2]。他們用神經(jīng)網(wǎng)絡進行人臉檢測,用 20x20 的人臉和非人臉圖像訓練了一個多層感知器模型。文獻 [1]的方法用于解決近似正面的人臉檢測問題,原理如下圖所示: 文獻 [2]的方法解決多角度人臉檢測問題,整個系統(tǒng)由兩個神經(jīng)網(wǎng)絡構成,第一個網(wǎng)絡用于估計人臉的角度,第二個用于判斷是否為人臉。角度估計器輸出一個旋轉角度,然后用整個角度對檢測窗進行旋轉,然后用第二個網(wǎng)絡對旋轉后的圖像進行判斷,確定是否為人臉。系統(tǒng)結構如下圖所示: Rowley 的方法有不錯的精度,由于分類器的設計相對復雜而且采用的是密集滑動窗口進行采樣分類導致其速度太慢。 AdaBoost 框架 接下來介紹 AdaBoost 框架之后的方法, boost 算法是基于 PAC 學習理論( probably approximately correct)而建立的一套集成學習算法 (ensemble learning)。其根本思想在于通過多個簡單的弱分類器,構建出準確率很高的強分類器, PAC 學習理論證實了這一方法的可行性,感謝大神 LeslieValiant??!我們首先來看 FDDB 上各種檢測算法的 ROC 曲線,接下來的介紹將按照這些 ROC曲線上的算法進行展開。 在 20xx 年 Viola 和 Jones 設計了一種人臉檢測算法 [10]。它使用簡單的Haarlike 特征和級聯(lián)的 AdaBoost 分類器構造檢測器,檢測速度較之前的方法有 2 個數(shù)量級的提高,并且保持了很好的精度,我們稱這種方法為 VJ 框架。 VJ框架是人臉檢測歷史上第一個最具有里程碑意義的一個成果,奠定了基于AdaBoost 目標檢測框架的基礎,所以作為重點和大家嘮嘮。 用級聯(lián) AdaBoost 分類器進行目標檢測的思想是:用多個 AdaBoost 分類器合作完成對候選框的分類,這些分類器組成一個流水線,對滑動窗口中的候選框圖像進行判定,確定它是人臉還是非人臉。 在這一系列 AdaBoost 分類器中,前面的強分 類器設計很簡單,包含的弱分類器很少,可以快速排除掉大量的不是人臉的窗口,但也可能會把一些不是人臉的圖像判定為人臉。如果一個候選框通過了第一級分類器的篩選即被判定為人臉,則送入下一級分類器中進行判定,以此類推。如果一個待檢測窗口通過了所有的強分類器,則認為是人臉,否則是非人臉。下圖是分類器級聯(lián)進行判斷的示意圖: 這種思想的精髓在于用簡單的強分類器在初期快速排除掉大量的非人臉窗口,同時保證高的召回率,使得最終能通過所有級強分類器的樣本數(shù)很少。這樣做的依據(jù)是在待檢測圖像中,絕大部分都不是人臉而是背景,即人臉是 一個稀疏事件,如果能快速的把非人臉樣本排除掉,則能大大提高目標檢測的效率。 出于性能考慮,弱分類器使用了簡單的 Haarlike 特征,這種特征源自于小波分析中的 Haar 小波變換, Haar 小波是最簡單的小波函數(shù),用于對信號進行均值、細節(jié)分解。這里的 Haarlike 特征定義為圖像中相鄰矩形區(qū)域像素之和的差值。下圖是基本 Haarlike 特征的示意圖: Haarlike 特征是白色矩形框內(nèi)的像素值之和,減去黑色區(qū)域內(nèi)的像素值之和。以圖像中第一個特征為例,它的計算方法如下:首先計算左邊白色矩形區(qū)域里所有像素 值的和,接下來計算右邊黑色矩形區(qū)域內(nèi)所有像素的和,最后得到的Haarlike 特征值為左邊的和減右邊的和。 這種特征捕捉圖像的邊緣、變化等信息,各種特征描述在各個方向上的圖像變化信息。人臉的五官有各自的亮度信息,很符合 Haarlike 特征的特點。 為了實現(xiàn)快速計算,使用了一種稱為積分圖( Integral Image)的機制。通過積分圖可以快速計算出圖像中任何一個矩形區(qū)域的像素之和,從而計算出各種類型的 Haarlike 特征。假設有一張圖像,其第 i行第 j列處的像素值為 ,積分圖定義為: 即原始圖像在 任何一點處的左上角元素之和。在構造出積分圖之后,借助于它可以快速計算出任何一個矩形區(qū)域內(nèi)的像素之和,以下圖中的矩形框為例: 在上圖中,要計算黑色矩形框內(nèi)的像素值之和。假設上面四個矩形
點擊復制文檔內(nèi)容
公司管理相關推薦
文庫吧 www.dybbs8.com
公安備案圖鄂ICP備17016276號-1