freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于視覺的靜態(tài)圖片中人體姿態(tài)估計進(jìn)行了研究-文庫吧資料

2025-01-22 12:01本頁面
  

【正文】 示方法,另一種是樣條、多項式、插值、特征點檢測及多邊形逼近等根據(jù)簡化方式劃分的形狀表示方法。幾十年來人們對形狀匹配的方法進(jìn)行了深入和廣泛的研究,提出了很多新的算法,但是每種方法都有一定的優(yōu)點和缺點,下面對這些方法做一簡要的介紹。 本章小結(jié)本章主要詳細(xì)介紹了圖像特征提取的一個特征——梯度直方圖人體檢測算法的基本原理,以及為之后的人體姿態(tài)檢測估計提供了理論基礎(chǔ)。(3)對同一Block內(nèi)的Cell_HOGs進(jìn)行標(biāo)準(zhǔn)化處理,得到Block的HOGs(Block_HOGs)。HOG 人體檢測算法具體計算過程為:(1)將規(guī)范化大小的檢測窗口作為輸入,通過梯度算子計算水平和垂直方向上的梯度。以下是幾種標(biāo)準(zhǔn)化方法,其中v是沒有標(biāo)準(zhǔn)化區(qū)域描述符向量:①L2norm,②L2Hys,(與①相同,)③L1norm,④L1sqrt,在檢測窗口中,絕大多數(shù)區(qū)域都有重疊,所有單元對最終特征向量都有影響,對區(qū)域進(jìn)行標(biāo)準(zhǔn)化雖然看起來較多余,但是實際中很有用。圖 33 單元梯度直方圖(2)區(qū)域梯度直方圖:當(dāng)檢測窗口為64*128時,因為有105個網(wǎng)格,一個區(qū)域特征描述符為36維,所以檢測窗口特征向量總共3780維。每20176。(1)單元方向角度:通過高斯濾波將圖像梯度為像素點賦予權(quán)值后,在所有單元內(nèi)統(tǒng)計像素點梯度方向,梯度直方圖角度范圍為0176。設(shè)h是直方圖、帶寬是b,h(x)指的是像素點中心處于x的直方圖值,如果要將權(quán)值w插入到直方圖x處,又設(shè) x1 和 x 2是點x在直方圖中最鄰近兩個bin 的端點坐標(biāo)(x1≤ x≤x2),那么線性插值權(quán)值w對x1和x2影響為分別公式(314)和公式(315): (314) (315)上述是一維情況下的線性插值,將其擴展到三維空間,w為三維空間中點x= [ x,y,z]權(quán)值,其中x1和x2為x在X軸方向上最鄰近兩個bin端點坐標(biāo),梯度方圖中沿著X,Y,Z軸方向帶寬分別為。的無符號梯度,且將其分成9個方向(9bins)。的有符號梯度兩種,在本論文中使用0176。的無符號梯度,也可以是0176。梯度方向范圍可以是0176。計算權(quán)值步驟:(1)標(biāo)準(zhǔn)差 Var=cellsize_*numcell_/(2*wtscale),Var=Var2, cellsize _表示包含的像素數(shù),numcell_表示區(qū)域中包含的單元數(shù),wtscale_則表示的是檢測窗口的寬度;(2)區(qū)域中心點位置 center_=extent_/2;其中center_網(wǎng)格中心點位置;(3)計算分配權(quán)值像素點距中心點距離;(4)運用計算權(quán)值對圖像梯度進(jìn)行加權(quán)。這說明在與空間域高斯模板做卷積時,空間頻率越高,圖像高頻部分就變得減??;(4)一維高斯函數(shù)的二階導(dǎo)數(shù)的中間突出部分是光滑的,為負(fù)值,其中兩個側(cè)邊突出部分也是光滑的,為正值。二元高斯函數(shù)可以表示為公式(312)所示,這里的是關(guān)聯(lián)概率分布的標(biāo)準(zhǔn)確性差: (312)d 維多變量高斯函數(shù)形式如公式(313),X為d維向量,U表示均值向量,K 表示協(xié)方差矩陣: (313)高斯濾波幾個重要性質(zhì):(1)離原點越遠(yuǎn),權(quán)值就變的越來越小并逐漸趨近于0。在本章里面,=0 .5,??則表示像素點到自己所在區(qū)域網(wǎng)格中心距離。圖像的子空間中,高斯濾波器根據(jù)空間距離提供權(quán)值,用一個掩膜掃描圖像區(qū)域中的每個像素,用掩膜確定的鄰域內(nèi)像素的加權(quán)平均灰度值去替代掩膜中心點像素點,其中所掃描像素點自身分配權(quán)值最大,離該像素點越遠(yuǎn)分配的權(quán)值越小,一元高斯函數(shù)表示為(311): (311)在公式(311)中,表示標(biāo)準(zhǔn)差,是高斯濾波器的唯一參數(shù),的大小表示高斯函數(shù)的寬度。 分配權(quán)值 高斯濾波權(quán)值分配在統(tǒng)計區(qū)域梯度直方圖之前,需要對區(qū)域中圖像梯度進(jìn)行高斯窗口濾波。 梯度大小和方向計算本章中,將輸入彩色圖像R、G、B三個分量,分別用1,0,1沿著 X 、Y 軸進(jìn)行卷積,再計算梯度,對于這三個顏色分量,具有最大梯度大小的顏色分量可以被認(rèn)為是當(dāng)前圖像中像素點的值,這樣彩色圖像就轉(zhuǎn)化成了灰色圖像,可以得到所有像素點梯度大小和方向。算子一般情況下是對稱的(如用平滑或者用其他各向同性)。卷積:核算子最右邊元素乘以圖像中最左邊元素;核算子:相對應(yīng)的元素直接進(jìn)行相乘,即左邊與左邊相乘,右邊與右邊相乘。例如有 5*5矩陣的二維圖像f和算子h,則有: (33)其中a,b只取 1,0,1,由公式(33)可以得到: (34) 圖像卷積對于函數(shù)f(x)、 h(x),它們的卷積運算可以表示為公式(35): (35)可以將上式擴展到二維情況有公式(36): (36)公式(36)表示的是連續(xù)圖像的卷積,對于數(shù)字圖像的離散卷積可以表示成公式(37): (37)因在實際情況中,圖像f以及核算子都是有限值,可以定義圖像以外看成是0,公式(37)又可以寫成:== (38)公式(38)中a,b是核算子下標(biāo)取值范圍。如果D 是在圖像 f 上的算子,且生成圖像g。當(dāng),時,劃分密集統(tǒng)一網(wǎng)格中心點方法為公式(31): (31)當(dāng)檢測窗口大小為64*12單元大小為8區(qū)域大小為1616時,水平方向有( 6416)/8+1=7個點,垂直方向為 (12816)/8+1=15個點,整個檢測窗口有715=105個網(wǎng)格中心點,在以網(wǎng)格中心點形成局部區(qū)域梯度方向直方圖。圖 32 區(qū)域示意圖在對矩形梯度直方圖特征描述符進(jìn)行計算時,將檢測圖像的檢測窗口劃分成密集統(tǒng)一的網(wǎng)點,以這些網(wǎng)格點為中心,使得它的周圍像素點構(gòu)成區(qū)域和單元,每個區(qū)域包含個單元,每個單元中包含像素和個方向角度,其中,是參數(shù)。梯度直方圖特征描述符是對圖像區(qū)域進(jìn)行重疊密集描述的一種方法。第3章 梯度直方圖算法第3章 梯度直方圖算法2005年Navneet Dalal提出的梯度直方圖(Histograms of Oriented Gradient, HOG)[5]人體檢測算法取得了傳統(tǒng) HarrLike[6]特征和 SIFT[7]等人體檢測算法無法比擬的效果,同時也克服了幀間差分法對環(huán)境依賴性較高這一缺陷。圖29 輸出數(shù)據(jù)降維后的維數(shù)實驗分析:輸出數(shù)據(jù)的降維情況與輸入數(shù)據(jù)的降維情況類似,可見如上分析。如果一個深度序列含有n幀圖像,那么其對應(yīng)的骨架文件當(dāng)中含有的數(shù)據(jù)個數(shù)為:n*20*4。另外,在這個數(shù)據(jù)庫當(dāng)中,對于每一個深度圖像序列文件都對應(yīng)一個骨架序列文件,且唯一對應(yīng),其中每一個骨架選取了20個關(guān)鍵骨架點作為人體模型。 輸入輸出數(shù)據(jù)降維 數(shù)據(jù)庫介紹本文中所采用的數(shù)據(jù)庫是對外免費開放的MSRAction 3D,其中包括20個不同的行為 (高抬揮手,水平揮手,敲打,抓手,向前出拳,高拋,畫X形狀,畫刻度線,畫圈圈,拍手,揮舞雙手,側(cè)拳,彎腰,前踢腳,側(cè)踢,慢跑,拍網(wǎng)球,接網(wǎng)球,打高爾夫,撿起并丟棄),每個動作都由是個不同的實驗對象做3次,每秒15幀。而當(dāng)P越接近N,則逼近的結(jié)果越接近于原矩陣。對于一個MN大小的矩陣A來說,總是可以分解為: (214)其中U和V分別是AAT和ATA的特征向量,而則是他們的特征根。SVD奇異值分解是線性代數(shù)中的一種重要的矩陣分解方法,在信號處理、統(tǒng)計學(xué)等領(lǐng)域都有重要的應(yīng)用。那么我們的問題又轉(zhuǎn)化為最小化目標(biāo)函數(shù)J。我們引入D維完備正交基向量組,即: (26)所以我們可以用完備正交基向量來線形表示樣本數(shù)據(jù)集中的每一個數(shù)據(jù), (27)充分利用根據(jù)等式(26)的正交屬性,利用等式(27)可得系數(shù),反代回等式(27),可得等式: (28)我們來看表達(dá)等式(28)需要D維信息,而我們的目的是希望用MD維信息近似地表達(dá)出: (29)代表的是數(shù)據(jù)點的特殊分量,而bi代表的是所有數(shù)據(jù)點的所共有的分量。構(gòu)造條件限制等式: (24)由高等數(shù)學(xué)知識可知,我們要求解關(guān)于u1的等式(24)的最大值,只需要令(24)對u1求導(dǎo)令其等于0,得: (25)由線形代數(shù)知識可知,λ必為協(xié)方差矩陣的特征值,而為其對應(yīng)的特征向量。那么問題就轉(zhuǎn)化為求解等式(22)的最大值。那么每一個樣本數(shù)據(jù)點xn被映射到1維空間后就表示成了u1Txn。為了使問題簡單化,我們令M=1,即映射到1維空間。因為我們希望被映射后的數(shù)據(jù)之間的相關(guān)性降低到最低點,所以我們可以采取求解被映射后方差最大化的最優(yōu)策略來找到低維空間。 方差最大化上面我們說過PCA方法的過程其實是尋找低維子空間的過程。在原數(shù)據(jù)集變換空間后應(yīng)使單一數(shù)據(jù)樣本的相互相關(guān)性降低到最低點。 PCA算法的原理PCA方法其實就是將數(shù)據(jù)空間通過正交變換映射到低維子空間的過程,如圖25所示。近年來,PCA方法被廣泛地運用于計算機領(lǐng)域,如數(shù)據(jù)降維、圖像有損壓縮、特征追蹤等等。PCA通過將多個變量通過線性變換以選出較少的重要變量。本文當(dāng)中采用的是主成分分析法(PCA)進(jìn)行數(shù)據(jù)降維。然后返回執(zhí)行第2步,得到連續(xù)不斷的深度圖像視頻流。并對距離數(shù)據(jù)歸一化,轉(zhuǎn)換成圖像灰度值,最后將所生成的深度圖像輸出給外部處理設(shè)備。第1步:標(biāo)定在不同距離處采集激光散斑參考圖像第4步,重建。在圖23中,場景放入A 物體所拍攝的ZA 位置散斑測試圖與Z2 處參考圖像相關(guān)系數(shù)最大,即認(rèn)為A 物體在Z2 距離處。第3步,定位。當(dāng)不透明物體放入場景,或者物體在場景中運動時,在物體表面形成新的散斑,得到測試圖像,此時的散斑圖樣發(fā)生變化,與所有參考圖像均不同。圖23中,參考圖像的位置分別記為Z1,Z2,Z3,Z4。首先在目標(biāo)區(qū)域距光源的多個不同位置分別用CMOS 感光元件采集散斑圖案,然后存儲這些不同位置的圖案作為參考圖像。圖23 成像系統(tǒng)構(gòu)造圖光編碼技術(shù)的成像過程如圖24 所示。激光發(fā)射器透過不均勻介質(zhì)發(fā)射激光,在場景中形成激光散斑。其構(gòu)造圖如圖23 所示。圖22 Kinect結(jié)構(gòu)圖 Kinect深度成像的基本原理根據(jù)PrimeSense 公司的專利記載,Kinect 深度成像的原理是一種叫做光編碼( light coding) 的技術(shù)。Kinect 共有3個攝像頭,中間的鏡頭是RGB彩色攝像機,左右兩邊鏡頭分別為紅外線發(fā)射器和紅外線CMOS 攝像機。 Kinect技術(shù) Kinect簡介Kinect 是微軟在2010 年6 月14 日對XBOX360體感周邊外設(shè)正式發(fā)布的名字。 Kinect 設(shè)備的出現(xiàn)極大地激發(fā)了研究者們的興趣,特別是計算視覺和模式識別的研究者們。其原因是,雖然上述3 種深度圖攝像機價格越來越便宜,并且在工業(yè)上得到廣泛應(yīng)用,但是對于研究領(lǐng)域還是非常昂貴。三維激光掃描是利用脈沖激光或者相位激光結(jié)合快速掃描技術(shù)瞬間得到三維空間中坐標(biāo)的點云(point cloud) 數(shù)據(jù)測量值,可以快速構(gòu)建結(jié)構(gòu)復(fù)雜、不規(guī)則的場景。其中飛行時間法的原理是通過給目標(biāo)連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過計算光脈沖的往返飛行時間來得到目標(biāo)物體的距離。該性質(zhì)表明,利用深度圖像可以在一定范圍內(nèi)重建3D空間區(qū)域,并且可以在一定程度上解決物體遮擋或同一物體各部分重疊的問題。該性質(zhì)表明深度圖像與彩色圖像不同,不會有光照、陰影、以及環(huán)境變化的干擾。理想的深度圖像如圖21所示,其中左圖是立體結(jié)構(gòu)的可見光圖像,右圖是深度圖像,距離相機越近的位置灰度值越小。與彩色圖像相比,深度圖像能直接反映物體表面的三維特征,且不受光照、陰影和色度等因素的影響[4]。這樣,假設(shè)圖像深度值的變化方向( 即攝像機拍攝方向) 與所需要描述的三維場景的視場方向Z 方向相同的話,那么就能夠很容易地描述整個三維場景。利用深度圖像進(jìn)行模式識別可以很好地克服以上可見光圖像模式識別常遇到的困難。與飛行時間技術(shù)( time of flight,TOF) 、結(jié)構(gòu)光、三維激光掃描等深度相機相比,Kinect 深度相機的優(yōu)勢在于拍攝的深度圖分辨率高,成本低。第2章 圖像深度信息第2章 圖像深度信息利用深度圖像進(jìn)行模式識別是近年來興起的技術(shù),這主要得益于深度圖攝像機的成本降低。第5章 基于線性回歸模型的算法原理介紹及對實驗數(shù)據(jù)進(jìn)行分析、比較。第3章 圖像特征提取之梯度直方圖(HOG)的算法原理介紹。 本文的結(jié)構(gòu)安排第1章 引言,主要介紹人體姿態(tài)估計研究意義及研究現(xiàn)狀,人體姿態(tài)估計現(xiàn)階段所面臨的的困難,以及本文的主要研究內(nèi)容和本文結(jié)構(gòu)。另外,本文另外研究了梯度直方圖(HOG)和形狀上下文(Shape Context)作為圖像特征空間的情況下的人體姿態(tài)估計。另外,圖像作為人體姿態(tài)估計的觀測數(shù)據(jù),對于其處
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1