【正文】
P k XN???? ? ( ) 基于參數(shù)模型的運(yùn)動(dòng)目標(biāo)分割方法研究 11( | , )?( | , )kttkk ktkX P k XP k X???????? ( ) 2 11? ?( ( ) ( ) ( | , )?( | , )kt k t k tkk ktkX u X u P k XP k X?????????? ( ) 上述 [ 15]理論結(jié)果是無法應(yīng)用到實(shí)際的,因?yàn)樗俣?k, X 是靜態(tài)過程,且把 N作為了一個(gè)定值,實(shí)際上每一幀 k, X都在變化,每 一幀都要根據(jù)當(dāng)前幀的觀測(cè)樣本對(duì)參數(shù)重新進(jìn)行估計(jì)。 當(dāng)前所有觀測(cè)樣本的最大似然函數(shù)可以表示為 1 2 11( , , . . . , , | ) ( | )NN x ktP X X X k f X???? ? 表示某點(diǎn)某時(shí)刻的觀測(cè)值,當(dāng)前總共有 N 個(gè)觀測(cè)值。 Stau 月七卜Grimson 將一種 EM的近似算法應(yīng)用到了運(yùn)動(dòng) 目標(biāo) 提取領(lǐng)域。有很多早期的工作對(duì)這個(gè)求解進(jìn) 行了研究。比如前面的 P(r|q)或 g(x, rk)可以用 fx( x) 來表示,先驗(yàn)概率 P(q)可以用叭來表示,后驗(yàn)概率 P(r|x)可以用 P(k)來表示,以后他們是通用的,不再 敘 述 [1 8]。然后我們要對(duì) P(x|q)進(jìn)行估計(jì)。從上面的公式還浙江理工大學(xué)本科畢業(yè)設(shè)計(jì) 15 可以看出,背景模型包含了 p(B),利用這一點(diǎn),我們可以引入相應(yīng)的幾只把具體應(yīng)用相關(guān)的因素引入到背景的分割中來。這相當(dāng)于一種兩分法,但作為背景的高斯的數(shù)目并不是固定的。舉例來說,即使背景分布是從混合模型衍生來的,如果只把最有可能的高斯作背景, P(x|r)為 l,其余的高斯都不是背景, P(x|q)為 0,所得到的背景模型就只是一個(gè)簡(jiǎn)單的高斯分布。假設(shè) P(x|Gk,B)=P(x|Gk)某點(diǎn)( r, c)的背景過程在 t時(shí)刻的分布 (直觀點(diǎn)說就是是背景的概率 )[15]可以表示為 : 11( , , ) ( , ) ( | , ) ( | ) ( ) ( | ) ( ) ( | )k k k k kkkM r c t P x B P x B G P G B P B P x G P G P B G??? ? ???( ) 等號(hào)最右邊的表達(dá)式表明背景的分布是由原始的混合模型中的高斯部分經(jīng)P(x|r)加權(quán)得到的。 如果我們能正確地把所有的樣本進(jìn)行分類,把每個(gè)樣本都?xì)w為屬于某個(gè)高斯過程的一類,那么,背景模型就應(yīng)該由被認(rèn)為是背景的樣本組成的,也就是說背景的隨機(jī)過程一維分布函數(shù)需要由所有被認(rèn)為是背景的觀測(cè)來估計(jì)。 背景模型 要使用混合高斯模型進(jìn)行背景分割,只要估計(jì)出上述兩個(gè)問題中相應(yīng)的分布率。舉個(gè)例子,一個(gè)正在走路的人和一個(gè)正在旋轉(zhuǎn)的電風(fēng)扇有著相似的信號(hào)特征,如果沒有對(duì)事件的理解,它們就很難區(qū)分。因此在解決第二個(gè)問題時(shí)可以引入一些與應(yīng)用環(huán)境相關(guān)的因子和高層的語義來達(dá)到更好的效果。 解決第一個(gè)問題就要估計(jì) P(q)和 P(qk)(第 k個(gè)高斯過程的分布率 ),這與判斷觀測(cè)屬于哪個(gè)過程相似,從理論上講是與具體應(yīng)用無關(guān)的??梢赃@樣來直觀的理解這個(gè)貝葉斯框架 :把某點(diǎn)觀測(cè)到的樣本看成是那些不同高斯過程產(chǎn)生的 (看到的顏色是那些不同的物理表面產(chǎn)生的 ),我們首先判斷某個(gè)樣本 (某點(diǎn)某時(shí)刻的觀測(cè) )是哪個(gè)高斯過程產(chǎn)生的,然后再來判斷各個(gè)高斯過程哪些是背景過程,哪些是前景過程。 在這個(gè)分布模型的基礎(chǔ)上,開始的后驗(yàn)概率等價(jià)于 ( | , )? ktttktktP k X??? ?? () 從上面的公式分析可知前景背景分割實(shí)際上需要解決兩個(gè)問題 :首先通過所有得到的樣本來估計(jì)某點(diǎn)的隨機(jī)過程一維分布函數(shù) (因?yàn)槭且玫侥硶r(shí)刻的分布率 ),這包括合成混合高斯過程的各高斯過程的一維分布函數(shù) (以下簡(jiǎn)稱高斯過程的分布 )以及他們的系數(shù) P(q)(即某個(gè)高斯過程的權(quán)重,表示觀測(cè)到這個(gè)高斯過程的概率 )。簡(jiǎn)單來說就是用混合高斯過程來模擬某個(gè)點(diǎn)隨時(shí)間的變化過程。通過參數(shù)估計(jì)得到實(shí)際的模型,在再一個(gè)貝葉斯準(zhǔn)則的框架下對(duì)模型進(jìn)行分析并得到最終的結(jié)論。 接下來的這種方法是混合高斯模型方法,我將在隨后章節(jié)作詳細(xì)分析。網(wǎng)格模型可以很好地應(yīng)用在旋轉(zhuǎn)和縮放的情況下,并能檢測(cè)和跟蹤多個(gè)運(yùn)動(dòng) 目標(biāo) ,并可以處理 目標(biāo) 間遮擋或新 目標(biāo) 的出現(xiàn),但是該方法的分割結(jié)果容易受到網(wǎng)格生成算法中關(guān)鍵點(diǎn)數(shù)目選擇的影響,運(yùn)算估計(jì)的復(fù)雜度也大大增加。這種算法可以同時(shí)完成運(yùn)動(dòng)場(chǎng)估計(jì)和 目標(biāo) 分割,但計(jì)算量比較大,而且需要選擇合適的特征并建立良好的 目標(biāo) 特征概率分布模型。在給定光流數(shù)據(jù)的條件下,搜索分割標(biāo)記的最大后驗(yàn)概率,使當(dāng)前分割與期望分割的符合程度最大。 基于統(tǒng)計(jì)模型的方法 基于貝葉斯概率統(tǒng)計(jì)的運(yùn)動(dòng)估計(jì) 建立統(tǒng)計(jì)模型 [10]。 Snake 是能量極小化的樣條,內(nèi)力約束它的形狀,外力引導(dǎo)它的行為,圖像力將其拖向顯著的圖像特征。 Snake算法的主要思想是:一條參數(shù)曲線在內(nèi)力和外力的作用下移動(dòng)到某個(gè)能量函數(shù)極小的位置,以此來確定物體的輪廓。這種理論認(rèn)為底層的視覺認(rèn)為 的完成只能依賴于從圖像本身獲得的信息。如果圖像中沒有運(yùn)動(dòng)目標(biāo),則光流失量在整個(gè)圖像區(qū)域是連續(xù)變化的,當(dāng)物體和圖像背景存在相對(duì)運(yùn)動(dòng)時(shí),運(yùn)動(dòng)物體所形成的速度矢量必然和鄰域背景速度矢量不同,從而檢測(cè)出運(yùn)動(dòng)物體的位置。所謂光流是指圖像中模式運(yùn)動(dòng)的速度,它是一種二維( 2D)瞬時(shí)速度場(chǎng),其中 2D 速度矢量是可見的三維速度矢量在成像平面上的投影。 ( , , ) ( , , )( , ) 1。 i j n i j mijI x y t I x y t Td x yo th e r w is e? ???? ??? ( ) 其中, T 為二值化的閾值,可有人工選取,也可由專門的算法自動(dòng)求出。 0 。比較簡(jiǎn)單的方法就是將兩幅圖像做“差分”或“相減”運(yùn)算,從相減的圖像中,很容易發(fā)現(xiàn)運(yùn)動(dòng)物體信息。對(duì)后一種情況,處理起來比較復(fù)雜,則通常需要進(jìn)行幀間穩(wěn)像及配準(zhǔn);若采用突出目標(biāo)的方法,則需要在配準(zhǔn)的基礎(chǔ)上進(jìn)行多幀能量積累和噪聲抑制。從處理方法上看,一般是采用突出目標(biāo)或消除背景的思想。 從公式( )能看出,圖像序列可以看成具有兩個(gè)空域坐標(biāo)和一個(gè)時(shí)域坐基于參數(shù)模型的運(yùn)動(dòng)目標(biāo)分割方法研究 標(biāo)的三維物體,既圖像體,像素被擴(kuò)展成體素,表示小體積單元的灰度。 ? ?0 1 1( , , ) , ( , , ) , . . . , ( , , )i j i j i j NI x y t I x y t I x y t ? () i=0,1… ,M1,j=0,1… N1 所謂相對(duì)次序一般是指時(shí)刻 tk 在 tk1 之后的( k=1,2,… ,n1)。 差分法 圖像序列又成為動(dòng)態(tài)圖像,它由一系列圖像組成,它們具有給定的活著假設(shè)的相對(duì)次序,并給出相鄰圖像獲取的時(shí)間間隔關(guān)系。下面將對(duì)一些基本的分割方法或思想進(jìn)行簡(jiǎn)略分析和介紹。其實(shí)很多方法都是復(fù)合的方法,最常見的是將運(yùn)動(dòng)的特征應(yīng)用到傳統(tǒng)的圖像分 割中去達(dá)到目的,或是將傳統(tǒng)的圖像分割技術(shù) (如形態(tài)學(xué)方法 )與運(yùn)動(dòng)檢測(cè)相結(jié)合,要想完全清晰的對(duì)各種方法進(jìn)行分類是一件很困難的事情,業(yè)內(nèi)也沒有一個(gè)很好的方法。 目前利用各種手段的分割方法層出不窮,它們的各種組合也在各種環(huán)境下發(fā)揮著各自的作用。然而,眾所周知,圖像分割本身就是一個(gè)病態(tài)問題,因?yàn)榈讓訑?shù)據(jù)所提供的信息總是少于分割本身所需的信息,所以分割沒有唯一的結(jié)果,沒有最優(yōu)的結(jié)果,沒有正確的結(jié)果,沒有錯(cuò)誤 的結(jié)果,分割應(yīng)視具體應(yīng)用的不同而有不同的策略、準(zhǔn)則,沒有一個(gè)通用的方法。在實(shí)際應(yīng)用過程中,有很多影響因素都對(duì)分割算法造成了困難口。同時(shí),從最基本的理論框架開始,對(duì)混合高斯模型 算法進(jìn)行了詳細(xì)的分析, 并基于混合高斯模型算法對(duì)視頻圖像中的運(yùn)動(dòng)目標(biāo)分割進(jìn)行研究。 本文的研究?jī)?nèi)容 在運(yùn)動(dòng)目標(biāo)分割方面 :運(yùn)動(dòng)目標(biāo)的有效分割對(duì)于目標(biāo)分類、特征提取、特征表達(dá)與最后的識(shí)別等處理非常重要,因?yàn)楹笃谔幚淼倪^程僅僅考慮圖像中對(duì)應(yīng)于運(yùn)動(dòng) 目標(biāo) 的像素。現(xiàn)在我們不知道背景和前景的準(zhǔn)確定義,因?yàn)槭裁词潜尘笆裁词乔熬笆呛途唧w應(yīng)用環(huán)境密切相關(guān)的,背景和前景的區(qū)分是高層的語義,屬于圖 像理解的層面。從貝葉斯的觀點(diǎn)來看,這種判斷應(yīng)該是基于后驗(yàn)概率的。參數(shù)模 型是一個(gè)很籠統(tǒng)的概念,實(shí)際中有著各種各樣的參數(shù)模型,而本文主要以其中的高斯混合模型為基礎(chǔ),來實(shí)際進(jìn)行操作?;趨?shù)模型的運(yùn)動(dòng)目標(biāo)分割方法研究 瞬態(tài)響應(yīng) 曲線和 頻率響應(yīng)曲線 稱為非參數(shù)模型。 高斯混合模型 本 文主要研究基于參數(shù)模型的運(yùn)動(dòng) 目標(biāo)分割方法,而 參數(shù)模型是指采用某特定形式的 概率密度函數(shù) 來描述語音 特征矢量 在 特征空間 的分布情況以該概率密度函數(shù)的一組參數(shù)作為模型的特征 [6]。再基于某種均勻性標(biāo)準(zhǔn)來確定分割決策,根據(jù)所提取特征將視頻數(shù)據(jù)歸類 。目前進(jìn)行視頻 目標(biāo) 分割的一般步驟是 :先對(duì)視頻圖像數(shù)據(jù)進(jìn)行預(yù)處理以利于分割,這可通過低通濾波、中值濾波、形態(tài)濾波來完成 。同時(shí)關(guān)于計(jì)算機(jī)視覺的研究也表明要實(shí)現(xiàn)正確的圖像分割需要在更高層次上對(duì)視頻內(nèi)容進(jìn)行理解。 而 運(yùn)動(dòng)目標(biāo) 分割涉及對(duì)視頻內(nèi)容的分析和理解,這與人工智能、圖像理解、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺等學(xué)科有密切聯(lián)系。當(dāng)遇到運(yùn)動(dòng) 目標(biāo) 與背景顏色相近、背景中的物體突然移動(dòng)、產(chǎn)生陰影或是背景擾動(dòng) [1]等情況時(shí),混合高斯模型的效果就會(huì)受到影響。就拿以運(yùn)動(dòng)為特征對(duì)視頻流進(jìn)行的運(yùn)動(dòng) 目標(biāo) 分割來說,從幀差法 [ 5]再到光流法以及混合的方法,其中,以 StauLuffeGrimson 的混合高斯模型方法效果最為出眾,以它為基礎(chǔ)進(jìn)行改進(jìn)的運(yùn)動(dòng) 目標(biāo) 分割算法應(yīng)用也最為廣泛 [ 7]。盡管圖像分割的研究已有幾十年的歷史,得到了廣泛重視、研究和應(yīng)用,但至今尚無通用的分割理論,現(xiàn)已提出的分割算法大都是針對(duì)具體問題的,并沒有適合于所有圖像的通用的分割算法。要想為分割建立起一個(gè)系統(tǒng)的理論架構(gòu)比較難,其 中的一個(gè)原因就是,很難從比舉例更實(shí)用的層次去評(píng)價(jià)一個(gè)分割方法。 分割是一個(gè)很大而且比較難的話題,針對(duì)分割的 目標(biāo) 數(shù)據(jù)集的不同,可以把分割分為對(duì)靜態(tài)圖像的分割、對(duì)視頻流的分割和對(duì)樣本 (感興趣模式的標(biāo)識(shí)符,如圓點(diǎn)、直線等 )的分割。這些區(qū)域常稱為 目標(biāo) 、目標(biāo)或前景 (相對(duì) 前景來說其他部分稱為背景 ),它們一般對(duì)應(yīng)圖像中特定的、具有獨(dú)特性質(zhì)或意義的區(qū)域。 國(guó)內(nèi)外研究現(xiàn)狀 圖像分割是圖像工程中一項(xiàng)十分重要的技術(shù)。但是視頻分割技術(shù)一直是計(jì)算機(jī)視覺及多媒體應(yīng)用中最困難的問題之一。大體上可分為底層視覺模塊、中間層數(shù)據(jù)融合模塊和高層視覺模塊。 附 錄 ............................................... 39 基于參數(shù)模型的運(yùn)動(dòng)目標(biāo)分割方法研究 第一章 緒論 研究背景及意義 人體目標(biāo)的視覺分析是把計(jì)算機(jī)視覺方法應(yīng)用到傳統(tǒng)的視覺監(jiān)控領(lǐng)域中,用計(jì)算機(jī)實(shí)現(xiàn)人體目標(biāo)的視覺分析,來提高監(jiān)控系統(tǒng)的智能化,在實(shí)際應(yīng)用方面非常有意義。 EM algorithm。 關(guān)鍵詞: 運(yùn)動(dòng)目標(biāo)分割;高斯混合模型 ; EM 算法 ; 背景分割 基于參數(shù)模型的運(yùn)動(dòng)目標(biāo)分割方法研究 Abstract The abstract recent years, along with the correspondence and the puter technology daily progress, as well as the global safe guard work urgent need, the intelligent video frequency supervisory system has obtained day by day the extensive research and the intelligent video frequency monitoring is refers through to the video frequency content analysis, divides goals and so on human, animal and vehicles, and gives each goal the behavior and the movement description, judges the thunderbolt the occurrence, and has policymaking behaviors and so on following the technology has included movement aspects and so on goal examination division, extraction, track, target category and behavioral analysis,