【正文】
隨著研究的不斷深入,客流量信息提取必定會(huì)朝著魯棒的實(shí)際應(yīng)用發(fā)展,能夠在實(shí)際應(yīng)用中滿足系統(tǒng)的準(zhǔn)確率、魯棒性和實(shí)時(shí)性是本文要研究的最終目標(biāo)。因此,三維標(biāo)定是本文以后一個(gè)研究方向。本文提出的算法在性能上具有較大的提升,通過大量的實(shí)驗(yàn)證明了算法的優(yōu)越性,具有一定的價(jià)值,能夠?qū)嶋H應(yīng)用。最后,本文深入研究了以往的人臉跟蹤算法并提出了本文的基于匹配算法的人臉跟蹤算法。然后,由于以往攝像機(jī)標(biāo)定算法依賴于攝像機(jī)架設(shè)高度、攝像機(jī)焦距等,當(dāng)標(biāo)定平面與攝像機(jī)距離較近時(shí),以往攝像機(jī)標(biāo)定算法失敗,并且以往攝像機(jī)標(biāo)定算法所需圖像和世界坐標(biāo)信息量較大。AdaBoost算法是一種經(jīng)典并且目前最流行的人臉檢測(cè)算法。在分類器的選擇上,使用了BP神經(jīng)網(wǎng)絡(luò)。人臉檢測(cè)和人臉跟蹤也是目前檢測(cè)和跟蹤方面研究的熱點(diǎn)和重點(diǎn),但是由于運(yùn)動(dòng)目標(biāo)的狀態(tài)受自身動(dòng)作變化、光照變化、運(yùn)動(dòng)目標(biāo)間相互遮擋等因素影響,導(dǎo)致目標(biāo)的狀態(tài)在檢測(cè)和跟蹤的過程中不是一成不變的,這種變化給人臉檢測(cè)和跟蹤帶來很大的影響。,在210s到230s之間本文得到錯(cuò)誤分類結(jié)果,主要原因是在210s到230s之間視頻中檢測(cè)區(qū)域內(nèi)人群攜帶大件行李,并且行李具有較多的紋理特征所致。若滿足此種情況,并且下一次處理得到的密度等級(jí)與前一次不同,則當(dāng)前密度等級(jí)為計(jì)算得到的密度等級(jí)。其中第四種算法,即本文改進(jìn)算法,分類錯(cuò)誤的情況都是分類時(shí)將密度等級(jí)錯(cuò)誤分類到鄰居密度等級(jí)。 實(shí)驗(yàn)結(jié)果根據(jù)單位面積內(nèi)人群數(shù)量將密度分為五個(gè)等級(jí),其中D表示單位面積內(nèi)人數(shù)。將特征向量去相關(guān)性后經(jīng)過快速ICA分析,: ()其中,為經(jīng)過快速ICA聚類后的特征向量。 ()為去相關(guān)性處理后的向量。ICA聚類算法主要分為中心化、去相關(guān)性和快速ICA分析三個(gè)部分。各個(gè)樣本集間均無交集。評(píng)估樣本集與訓(xùn)練樣本集和測(cè)試樣本集均無交集,同時(shí)也要考慮模式之間的平衡。而在訓(xùn)練中,雖然訓(xùn)練樣本集誤差可以達(dá)到很小的值,測(cè)試樣本集誤差也降低到合適的程度,卻無法判定該網(wǎng)絡(luò)是最優(yōu)的。測(cè)試樣本集與訓(xùn)練樣本集沒有交集,也需要考慮模式間平衡。因此訓(xùn)練樣本集必須具有代表性,必須盡可能反映實(shí)際應(yīng)用中可能出現(xiàn)的各種情況,這樣訓(xùn)練出來的神經(jīng)網(wǎng)絡(luò)才具有魯棒性,才能在復(fù)雜情況下做出正確判決。訓(xùn)練樣本集用來對(duì)BP神經(jīng)網(wǎng)絡(luò)權(quán)值進(jìn)行修正,要能盡可能準(zhǔn)確地反應(yīng)識(shí)別函數(shù)。擁有最大輸出值的節(jié)點(diǎn)便對(duì)應(yīng)著相應(yīng)的密度等級(jí)。 (),代表當(dāng)前輸入節(jié)點(diǎn)最大值,;代表當(dāng)前輸入節(jié)點(diǎn)最小值,;為當(dāng)前輸入節(jié)點(diǎn)值。 各層節(jié)點(diǎn)個(gè)數(shù)與識(shí)別神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)分為輸入層節(jié)點(diǎn)、隱層節(jié)點(diǎn)和輸出層節(jié)點(diǎn)。步驟3:計(jì)算實(shí)際輸出與期望輸出的誤差值,如果足夠小,則跳至步驟6。如此反復(fù),直至實(shí)際輸出與期望輸出的誤差小于一定值為止。通過不斷修改網(wǎng)絡(luò)權(quán)值從而使得網(wǎng)絡(luò)輸出不斷逼近期望值。BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程就是調(diào)整網(wǎng)絡(luò)權(quán)值的過程。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法(訓(xùn)練算法)描述了如何根據(jù)已有樣本調(diào)整網(wǎng)絡(luò)權(quán)值,以獲得理想的輸出結(jié)果。上層節(jié)點(diǎn)與下層節(jié)點(diǎn)均為全連接。本文采用Sigmoid激勵(lì)函數(shù)。本文采用BP神經(jīng)網(wǎng)絡(luò)作為特征分類器。歸一化后的特征向量取值范圍在[1,1]之間。特征提取后,需要對(duì)提取的特征向量進(jìn)行歸一化,為后續(xù)的ICA聚類分析提供基礎(chǔ)。取每幅圖均值為一個(gè)圖像特征,所以Gabor濾波器得到16種特征值。應(yīng)用快速傅里葉變換將圖像從時(shí)域轉(zhuǎn)換到頻域后可以看到,頻譜有很大差別。于是, b)圖所示10個(gè)區(qū)域,對(duì)每個(gè)區(qū)域分別求GLDM。GDLM產(chǎn)生16種特征值,GDLM對(duì)圖像時(shí)域特征進(jìn)行分析和提取。GLDM是第二級(jí)聯(lián)條件概率密度函數(shù)。 特征提取 紋理是一幅圖像有別于其它圖像的重要特征。隨著計(jì)算機(jī)技術(shù)、人工智能和模式識(shí)別技術(shù)的不斷發(fā)展,人臉檢測(cè)必定能夠獲得更廣闊的發(fā)展。完全遮擋和長(zhǎng)時(shí)間遮擋是遮擋中最需要解決但也最難解決的問題。遮擋分為部分遮擋和全遮擋。人臉跟蹤最根本的問題在于如何處理狀態(tài)變化的人臉。但是有些目標(biāo)跟蹤算法僅僅停留在理論研究階段,到實(shí)際應(yīng)用還有一段距離。 局部搜索區(qū)域 a) 迭代1 b) 迭代2 c) 迭代3 d) 迭代4 目標(biāo)迭代跟蹤過程c) 模板更新問題人體在運(yùn)動(dòng)過程中,人臉姿態(tài)必然發(fā)生改變,并且由于外部因素的影響,導(dǎo)致人臉的顏色和灰度像素描述也發(fā)生改變()。而且人臉與其它物體有不同之處,人臉為對(duì)稱的,具有雙眼、嘴和鼻子等特征,這是其它物體所沒有的。 a) 透視變換前 b) 透視變換后 透視變換前后對(duì)應(yīng)關(guān)系目前人臉跟蹤是目標(biāo)跟蹤的熱點(diǎn)和一個(gè)主要研究方面。其中典型的便是Tsai兩步定標(biāo)法[18]。并且此算法不適合圖像中不具有平行線的情況,對(duì)于本文應(yīng)用場(chǎng)景,此算法無法標(biāo)定。需要兩組以上平行線,每組平行線不低于三條,并且線的長(zhǎng)度越長(zhǎng)準(zhǔn)確率越高。根據(jù)交比定理同樣也可以得到的計(jì)算公式。消隱點(diǎn)一般在圖像外,甚至是無窮遠(yuǎn)處。在計(jì)算圖像某點(diǎn)坐標(biāo)的世界坐標(biāo)時(shí),需要首先判斷該點(diǎn)所在的網(wǎng)格區(qū)域,然后找出與此點(diǎn)對(duì)應(yīng)的攝像機(jī)內(nèi)參,才能求此點(diǎn)的世界坐標(biāo)。此種方法精度有較大提高,但是由于對(duì)每個(gè)網(wǎng)格進(jìn)行擬合,導(dǎo)致系統(tǒng)出現(xiàn)了幾個(gè)缺點(diǎn):(1)對(duì)系統(tǒng)消耗資源大。整幅圖像采用同一種攝像機(jī)內(nèi)參不能滿足計(jì)算精度。均為攝像機(jī)內(nèi)參。在將圖像坐標(biāo)轉(zhuǎn)換為實(shí)際坐標(biāo)時(shí),在同樣準(zhǔn)確率的情況下,所需圖像知識(shí)越少越好。單攝像頭不能采集到圖像的深度信息,二維標(biāo)定主要針對(duì)單攝像頭的拍攝情況。進(jìn)行人臉跟蹤和信息提取前,需要一個(gè)圖像坐標(biāo)轉(zhuǎn)換到世界坐標(biāo)的過程。神經(jīng)網(wǎng)絡(luò)、SVM和貝葉斯分類器等通常能獲得好的分類結(jié)果,研究新的分類方法是提高檢測(cè)性能的另一個(gè)重要途徑。3) 由于人臉模式具有多樣性,導(dǎo)致人臉圖像的空間分布非常復(fù)雜,有限的樣本集難以覆蓋全部人臉圖像子空間,但是在高維空間中建立準(zhǔn)確的分布模型比較困難。圖像中的亮度、對(duì)比度的變化和陰影也會(huì)影響人臉檢測(cè)。目前基于人工神經(jīng)網(wǎng)絡(luò)和基于SVM等的檢測(cè)方法都獲得了較好的檢測(cè)結(jié)果,并且基于人工神經(jīng)網(wǎng)絡(luò)和基于SVM等的方法也在人臉識(shí)別領(lǐng)域得到越來越廣泛的研究與應(yīng)用。特征向量可以看成隨機(jī)變量,這個(gè)隨機(jī)變量被分類條件密度函數(shù)和分別描述成人臉和非人臉。現(xiàn)在常用的人臉檢測(cè)算法均是基于表象的方法。人臉灰度模板也可以看作是一種啟發(fā)式模型。 不同姿態(tài)的人臉c) 基于啟發(fā)式模型的人臉檢測(cè)方法基于啟發(fā)式模型的方法首先抽取幾何形狀、灰度紋理等特征,然后檢驗(yàn)它們是否符合人臉的先驗(yàn)知識(shí)。Garcia[41]等按照色度的差異將膚色進(jìn)一步量化為不同類型,將類型相同且相鄰的膚色像素聚類為區(qū)域,再根據(jù)幾何區(qū)域、形狀和色調(diào)相容性進(jìn)行歸并,歸并過程中利用區(qū)域的小波特征進(jìn)行驗(yàn)證。顏色在目標(biāo)檢測(cè)和跟蹤中有重要的作用。但是人臉特征變化較大,當(dāng)?shù)玫焦潭ǖ哪0逡院螅矡o法有效處理姿態(tài)的變化,所以后來引入了可變形模板。本文將目前人臉檢測(cè)領(lǐng)域常用的算法歸結(jié)為以下幾類[40]:a) 基于模板匹配的人臉檢測(cè)方法 模板匹配法屬于一種經(jīng)典的模式識(shí)別方法。 a) 低密度 b) 中低密度 c) 中密度 d) 中高密度 e) 高密度 密度等級(jí)圖 人臉檢測(cè)方法目前,人臉檢測(cè)是目標(biāo)檢測(cè)中較為成熟的一個(gè)方面。文獻(xiàn)[9]根據(jù)SVM分類器來計(jì)算圖像中人數(shù),以達(dá)到計(jì)算密度的目的。分類器采用自組織神經(jīng)網(wǎng)絡(luò)來進(jìn)行特征分類。理論上講,與其它所有分類算法相比,貝葉斯分類出錯(cuò)率最小,然而實(shí)踐中并非總是如此。徑向基神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)類似,但只有一層隱層和一個(gè)輸出節(jié)點(diǎn)。SVM是一種二值分類器,在二值領(lǐng)域取得了較好的應(yīng)用,并在小樣本模式識(shí)別問題上具有特有的優(yōu)勢(shì)。它分為輸入層和競(jìng)爭(zhēng)層。經(jīng)過特征提取后,分類器對(duì)提取的特征進(jìn)行分類。分形維數(shù)可以用來表征圖像特征,但是當(dāng)人群密集時(shí),密度等級(jí)高的圖像具有相近的分形維數(shù),很難根據(jù)分形維數(shù)判斷密度等級(jí)。 ,第一列到第五列分別為原始圖像、邊緣二值圖、膨脹系數(shù)為膨脹系數(shù)為8和膨脹系數(shù)為15的二值圖。OTSU方法在獲得圖像灰度直方圖條件下,利用概率論知識(shí),通過計(jì)算最大類間方差而得到分割門限。對(duì)原始圖像經(jīng)過灰度變換后進(jìn)行邊緣分析,采用Robert算子計(jì)算邊緣圖像。由于如何精確判斷圖像中人數(shù)本身就屬于一個(gè)難題,所以根據(jù)人數(shù)來判斷圖像密度等級(jí)需要進(jìn)一步研究。由于攝像頭架設(shè)和地鐵空間布局因素。 密度等級(jí)分類方法圖像密度等級(jí)分類在保障客流人身安全方面有重要作用,具有實(shí)際研究意義。但是除了光照等因素外,還存在其它外在因素導(dǎo)致目標(biāo)顏色變化,一些內(nèi)在因素也會(huì)導(dǎo)致目標(biāo)顏色的變化。圖像特征提取是進(jìn)行目標(biāo)分類、檢測(cè)、識(shí)別和跟蹤的前提。降維可以使同類之間的數(shù)據(jù)更加緊湊,不同類之間的數(shù)據(jù)更加分離。 a) 原始圖像 b) Robert算子邊緣圖 c) Sobel算子邊緣圖 邊緣提取圖特征提取后,提取的特征向量在高維空間?;谶吘壍奶卣魈崛∷惴▽?duì)光照強(qiáng)度變換的敏感程度低于基于顏色的特征提取算法。Laws紋理能量測(cè)量法根據(jù)單個(gè)像素及其鄰域的灰度分布或某種屬性作紋理測(cè)量,是典型的一階統(tǒng)計(jì)分析方法。同次性、能量、熵和對(duì)比度等可以用來表征圖像紋理。粗略度與觸覺相關(guān)。Bajcsy將其分為單向性和雙向性。當(dāng)圖像乘以一個(gè)系數(shù)變成后,圖像的對(duì)比度改變。此紋理特征的六個(gè)特征分量對(duì)應(yīng)于心理學(xué)角度上紋理特征的六種屬性,分別是粗糙度,對(duì)比度,方向性,線像度,規(guī)律度和粗略度。紋理特征()可以對(duì)紋理圖像進(jìn)行特征提取,它是一種不依賴于亮度而可反映圖像中同質(zhì)現(xiàn)象的視覺特征,包含了物體表面結(jié)構(gòu)組織排列的重要信息以及它們與周圍環(huán)境的聯(lián)系。它描述不同色彩在整幅圖像中所占的比例,而不關(guān)心其空間位置,無法描述圖像中的對(duì)象。顏色空間按照基本結(jié)構(gòu)可以分為兩大類,基色顏色空間和亮、色分離顏色空間。視覺特征又可分為通用的視覺特征和領(lǐng)域相關(guān)的視覺特征。特征提取在圖像分類、人臉檢測(cè)和人臉跟蹤中具有極為重要的作用,是分析和處理圖像的前提。圖像分類、人臉檢測(cè)和人臉跟蹤均是目前視頻圖像處理研究的熱點(diǎn)和難點(diǎn)。 基于分類器的人臉跟蹤是目前較流行的一種跟蹤方法。這種方法計(jì)算簡(jiǎn)單,運(yùn)算速度快,比較適合實(shí)時(shí)處理。圖像由運(yùn)動(dòng)的塊構(gòu)成,下一幀的塊是經(jīng)上一幀的塊經(jīng)過形變平移得到。一般情況下,光流由攝像機(jī)運(yùn)動(dòng)、場(chǎng)景中目標(biāo)運(yùn)動(dòng)或者兩者的運(yùn)動(dòng)產(chǎn)生?;谀P偷姆椒ǜ櫵俣瓤?,但受模型本身的限制,一旦跟蹤環(huán)境發(fā)生變化難以得到較好的處理效果。該特征能夠在自然光照條件下取得較為滿意的跟蹤結(jié)果,同時(shí)對(duì)人臉在旋轉(zhuǎn)、縮放和遮擋等條件下,多人臉背景下的跟蹤有較強(qiáng)的魯棒性。首先,人臉目標(biāo)捕獲和系統(tǒng)初始化階段使用膚色分類和統(tǒng)計(jì)人臉模型匹配來找到人臉目標(biāo)。膚色是人臉最重要而且最明顯的特征,人臉面部膚色特征可以用幾個(gè)參數(shù)來表示,在一定光照條件下,膚色特征基本保持不變。(2)目標(biāo)遮擋問題。目前常見的跟蹤技術(shù)大致可以分為四類:基于模型跟蹤,基于運(yùn)動(dòng)信息跟蹤,基于人臉局部模型跟蹤和基于分類器跟蹤。人臉跟蹤技術(shù)是一種具有重要應(yīng)用價(jià)值的技術(shù)。文獻(xiàn)[34]采用了一種基于訓(xùn)練的方法檢測(cè)人臉,采用SVM和Kalman相結(jié)合的方法。首先分割非人臉區(qū)域和人臉區(qū)域以減少檢測(cè)時(shí)間,后續(xù)步驟只需對(duì)原來圖像1%區(qū)域進(jìn)行人臉檢測(cè),大大縮小了檢測(cè)時(shí)間。文獻(xiàn)[31]對(duì)人臉嘴唇區(qū)域進(jìn)行特征提取,作為區(qū)分人臉區(qū)域與非人臉區(qū)域的方法。文獻(xiàn)[29]采用膚色邊緣分析和人臉模板匹配的算法檢測(cè)人臉。膚色的方法簡(jiǎn)單易行,但是當(dāng)非人臉區(qū)域顏色與人臉顏色相似的情況下,容易發(fā)生誤檢。根據(jù)膚色進(jìn)行人臉檢測(cè)是目前較流行的一種算法。目前,國(guó)內(nèi)外對(duì)人臉檢測(cè)問題的研究很多。人臉檢測(cè)問題最初來源于人臉識(shí)別,人臉檢測(cè)是自動(dòng)識(shí)別系統(tǒng)中一個(gè)關(guān)鍵環(huán)節(jié),但早期的人臉識(shí)別主要針對(duì)具有較強(qiáng)約束條件