【正文】
................................................... 55 本文結(jié)論......................................................................................................................... 55 工作展望......................................................................................................................... 56參考文獻(xiàn)................................................................... 57致謝..................................................................... 59V汕頭大學(xué)工學(xué)院 2012 屆碩士學(xué)位論文第 1 章 緒論 引言目前,隨著我國(guó)平安城市、平安奧運(yùn)、平安世博會(huì)等概念的深入推廣,數(shù)字視頻監(jiān)控技術(shù)已經(jīng)深入商業(yè)、工業(yè)、環(huán)境、家居等領(lǐng)域。常用的濾波算法有線性濾波算法、卡爾曼濾波及其擴(kuò)展算法、粒子濾波算法等。針對(duì)常見(jiàn)算法運(yùn)算量大、實(shí)時(shí)性差的特點(diǎn),將幾種常見(jiàn)算法的各自的優(yōu)勢(shì)進(jìn)行比較分析,最終采用基于碼本的目標(biāo)檢測(cè)算法。在視頻監(jiān)控、智能交通、軍事等領(lǐng)域,目標(biāo)檢測(cè)和跟蹤技術(shù)都得到了廣泛的應(yīng)用,是進(jìn)行相關(guān)領(lǐng)域后續(xù)研究的一個(gè)重要的基礎(chǔ)。對(duì)于保密的論文,按照保密的有關(guān)規(guī)定和程序處理。論文中除了特別加以標(biāo)注和致謝的地方外,不包含其他人或其它機(jī)構(gòu)已經(jīng)發(fā)表或撰寫過(guò)的研究成果。對(duì)本文的研究做出貢獻(xiàn)的個(gè)人和集體,均已在論文中以明確方式標(biāo)明。本論文屬于:保密(),在年解密后適用本授權(quán)聲明。本文利用研究的目標(biāo)檢測(cè)和跟蹤內(nèi)容,最終實(shí)現(xiàn)一個(gè)可以在視頻監(jiān)控中應(yīng)用的目標(biāo)檢測(cè)和跟蹤系統(tǒng)。其次,本文分析了目標(biāo)跟蹤領(lǐng)域的幾個(gè)主要算法,基于模板匹配的跟蹤、基于顏色直方圖的跟蹤、基于主動(dòng)輪廓線的跟蹤。每種濾波算法都有一定的特點(diǎn),也有一定的適應(yīng)范圍,卡爾曼濾波算法適合于線性的高斯模型,它給出的解總是最優(yōu)的;粒子濾波就可以適用于任何形式的模型。為提高社會(huì)生產(chǎn)效率、減少損失、保障社會(huì)公共安全發(fā)揮了重要了重要作用。圖像給人帶來(lái)的信息,讓人們更加直觀、豐富和真切。運(yùn)動(dòng)檢測(cè)、目標(biāo)識(shí)別和跟蹤屬于較低層次的處理,屬于圖像處理的范疇;圖像分析和理解屬于高層次的處理,屬于人工智能的范疇[1]。本文旨在通過(guò)對(duì)比和研究現(xiàn)行的各種運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤的算法進(jìn)行研究和分析,從而以工程應(yīng)用為目標(biāo)提出自己的算法,在嵌入式終端上進(jìn)行算法的實(shí)現(xiàn)。國(guó)內(nèi)外的很多相關(guān)公司和研究單位也進(jìn)行了大量的相關(guān)項(xiàng)目研究。在交通場(chǎng)景的視覺(jué)監(jiān)控(基于三維線性模型定位、基于 KALMAN 濾波器的車輛跟蹤算法),人的運(yùn)動(dòng)視覺(jué)監(jiān)控和行為模式識(shí)別等方面進(jìn)行了深入的研究[1],并且取得了一定的成果。但是在具體的應(yīng)用的時(shí)候,運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤的算法仍面臨這很多問(wèn)題和難點(diǎn),主要問(wèn)題和難點(diǎn)有:①運(yùn)動(dòng)目標(biāo)之間相互遮擋,導(dǎo)致無(wú)法完全提取運(yùn)動(dòng)目標(biāo)的特征。目前,國(guó)內(nèi)外關(guān)于該問(wèn)題的研究,都是圍繞這些相關(guān)問(wèn)題展開(kāi)。就目前而言,不存在一個(gè)通用的算法來(lái)解決這個(gè)問(wèn)題。針對(duì)運(yùn)動(dòng)目標(biāo)的正確識(shí)別與分割、物體之間的相互遮擋和重疊、處理的實(shí)時(shí)性等難點(diǎn)進(jìn)行研究,著力解決這幾個(gè)難點(diǎn)。另外,本文所研究的很多問(wèn)題,都涉及圖像處理的相關(guān)問(wèn)題,如果每個(gè)實(shí)現(xiàn)過(guò)程都完全自己用代碼實(shí)現(xiàn),那必然是個(gè)龐大的過(guò)程,工作量也是十分驚人的、不太可能的,所以我們采用 Intel 的 OpenCV(Open Source ComputerVision Library)進(jìn)行這些過(guò)程的實(shí)現(xiàn)。Ubuntn 是基于 Debian 發(fā)行版和 GNOME桌面環(huán)境,目標(biāo)在于為用戶提供最新的、最穩(wěn)定的主要由自由軟件構(gòu)建而成的操作系統(tǒng)。另外,OpenCV 還具有開(kāi)源的特性,所有使用者都可以免費(fèi)獲得 Opencv 的源代碼和安裝包,使用者可以方面的使用,不需要其他外部支持也可以完整的編譯連接并生成可執(zhí)行的程序。這里,我也把 Opencv 移植到嵌入式 linux 上面,作為畢業(yè)設(shè)計(jì)的基本算法庫(kù)。從系統(tǒng)軟件和依賴的基本庫(kù) 2 個(gè)方面,說(shuō)明我們的開(kāi)發(fā)環(huán)境。 系統(tǒng)功能分析目標(biāo)檢測(cè)和跟蹤系統(tǒng),這里就是對(duì)監(jiān)控系統(tǒng)中,出現(xiàn)在視場(chǎng)內(nèi)的運(yùn)動(dòng)目標(biāo)(如人、車輛)進(jìn)行檢測(cè),然后隨著目標(biāo)的移動(dòng),實(shí)時(shí)地跟蹤運(yùn)動(dòng)的目標(biāo)。這里我們也采用嵌入式系統(tǒng)進(jìn)行實(shí)現(xiàn),主芯片采用三星的 S3C6410,片上運(yùn)行 linux 操作系統(tǒng),采用 Intel 的 Opencv 作為圖像處理的基本圖形庫(kù)。5系統(tǒng)介紹和總體設(shè)計(jì)網(wǎng)口串口LCD 彩屏ARM11( S3C6410)核心板攝像頭觸摸屏圖 21 嵌入式硬件結(jié)構(gòu)圖Fig. 21 Hardware structure of embedded systemS3C6410 處理器是一個(gè)強(qiáng)大的處理器,尤其它的 MFC(Multi Foramt Codec)單元。系統(tǒng)用到的片上設(shè)備有:①Camera Interface:外接 Camera,支持 ITUR 。③ AC97:AC97 控制器,支持獨(dú)立的 PCM 立體聲音頻輸入,單聲道 MIC 輸入和 PCM立體聲音頻輸出,通過(guò) ACLink 接口與 Audio Codec 相連。系統(tǒng)軟件使用當(dāng)前大量使用的開(kāi)源 linux 系統(tǒng);基本的圖像處理算法庫(kù)采用 Intel 的 Opencv。它誕生于 1991 年(這是第一次正式向外公布的時(shí)間)。目前,在嵌入式市場(chǎng)上,具有很大的占有率。組織在考慮許可成本,特別是大量使用者和大量計(jì)算機(jī)設(shè)備的許可成本時(shí),都驚奇發(fā)現(xiàn)在成本上有著重大的優(yōu)勢(shì)。并承認(rèn)其合法性。Linux 的使用者幾乎不用考慮系統(tǒng)崩潰的問(wèn)題,因?yàn)閘inux 完全不會(huì)崩潰,linux 沒(méi)有像其他操作系統(tǒng)一樣內(nèi)核如此龐大、充滿漏洞,具有可靠的系統(tǒng)結(jié)構(gòu)。目前大量采用的 X8ARM、MIPS 架構(gòu)的主芯片,對(duì) linux 操作系統(tǒng)都具有很好的支持。為了能夠在我們的開(kāi)發(fā)板跑 linux 系統(tǒng),必須進(jìn)行操作系統(tǒng)的移植,這里為了減少我們的工作量,從網(wǎng)上下載了已經(jīng)完成大部分移植工作的 linux 操作系統(tǒng)。這 3 部分相互協(xié)作,行程非常通用、可適應(yīng)性很強(qiáng)的IIC 框架[5]。static __init int saa7113_init(void)8汕頭大學(xué)工學(xué)院 2012 屆碩士學(xué)位論文{returni2c_add_driver(amp。}module_init(saa7113_init)。 基本圖像處理庫(kù)的移植Opencv(Open Source Computer Vision Library)是 Intel 開(kāi)發(fā)的機(jī)遇 BSD 許可證授權(quán)發(fā)行的開(kāi)源跨平臺(tái)計(jì)算機(jī)視覺(jué)庫(kù),可以運(yùn)行在 Linux、 Windows 以及 Mac 等操作系統(tǒng)上,主要用 C 完成,可以說(shuō)是一個(gè)輕量級(jí)但是很高效的庫(kù),實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺(jué)方面的眾多通用的算法。①libjpeg 的交叉編譯(版本:)./configureprefix=/home/david/work/opencv/opencvarm/build/libjpeg9系統(tǒng)介紹和總體設(shè)計(jì)execprefix=/home/david/work/opencv/opencvarm/build/libjpegenablestaticenableshared修 改Makefile,修 改 其 中 的CC=armnone linux gnueabi gccAR=armnonelinuxgnueabiarAR2=armnonelinux gnueabiranlib在/home/david/work/opencv/opencvarm/targets/下建立 bin、 lib、 include、man/man1目錄。在對(duì)軟硬件進(jìn)行介紹分析的同時(shí),從軟硬件性能的角度,也說(shuō)明我們擬實(shí)現(xiàn)系統(tǒng)的可行性。目標(biāo)檢測(cè)和跟蹤也源于人們?cè)谝曨l監(jiān)控等領(lǐng)域的迫切需求,隨著電子科學(xué)技術(shù)的發(fā)展以及近年來(lái)人們安全意識(shí)是逐漸增強(qiáng),視頻監(jiān)控技術(shù)得到了很大程度的發(fā)展,也大量應(yīng)用于各種生活、生產(chǎn)活動(dòng)。為了提高目標(biāo)檢測(cè)的實(shí)時(shí)性和準(zhǔn)確性,人們也進(jìn)行了大量的研究,國(guó)內(nèi)的中科院自動(dòng)化所近年來(lái)在這個(gè)方面也取得了不少成果;國(guó)外起步較早,其中美國(guó)、日本、英國(guó)等國(guó)家尤其突出。主要的問(wèn)題有如下幾個(gè),一、運(yùn)動(dòng)目標(biāo)之間的相互遮擋,導(dǎo)致無(wú)法提取目標(biāo)的特征;二、多個(gè)運(yùn)動(dòng)目標(biāo)之間的相互干擾;三、視頻場(chǎng)景內(nèi)光線的變化;四、運(yùn)動(dòng)目標(biāo)的運(yùn)動(dòng)是否連續(xù),是否往返運(yùn)動(dòng)等。但是我們正在使用的真正的光流計(jì)算方法是將二維速度場(chǎng)與灰度相聯(lián)系,這是在 1981 年由 Horn 和 Schunck 提出的,使用了光流約束方程的算法,為光流算法的發(fā)展奠定了基礎(chǔ)。光流算法主要用來(lái)對(duì)圖像序列的光流場(chǎng)進(jìn)行實(shí)時(shí)、精確以及魯棒性的估計(jì),但是我們知道在光流場(chǎng)內(nèi),照明、光源的變化、運(yùn)動(dòng)的速度以及噪聲等很多因素嚴(yán)重影響光流算法的估計(jì)結(jié)果。詳細(xì)的流程如圖所示:計(jì)算獲得光流場(chǎng)光流場(chǎng)閾值分割形態(tài)學(xué)濾波開(kāi)、閉運(yùn)算光流場(chǎng)閾值分割圖 31 光流法流程圖Fig. 31 Flow diagram of optical flow 光流約束方程光流算法在建立在運(yùn)動(dòng)前后圖像灰度不變這個(gè)假設(shè)下的,假設(shè)圖像上點(diǎn) m = (x, y)T 在時(shí)刻 t 的灰度值為 I (x + dx, y + dy, t + dt),當(dāng) dt 傾向于 0 時(shí),在運(yùn)動(dòng)前后圖像灰度不變的假14汕頭大學(xué)工學(xué)院 2012 屆碩士學(xué)位論文設(shè)下,也就是:I (x + dx, y + dy, t + dt) = I (x, y, t)在圖像灰度隨著 x , y , t 緩慢變化時(shí),可以將(31)式左邊泰勒級(jí)數(shù)展開(kāi):(31)I ( x + dx, y + dy, t + dt) = I ( x, y, t) +182。ydy +182。 0 ,忽略 e ,可以得到:182。ydy +182。x, I y =182。t分別代表圖像灰度,也就是 x , y , t 的偏導(dǎo)數(shù),這樣的話式(33)就可以寫成:I xu + I y v + I t = 0這就是光流場(chǎng)的基本方程了。(35)就是我們所說(shuō)的光流約束方程了,是進(jìn)行光流計(jì)算的基礎(chǔ)。如 HornSchunck 算法、LucasKanade 算法、Negal算法,HornSchunck 認(rèn)為圖像上任一點(diǎn)的光流并不是獨(dú)立的,光流在整個(gè)圖像范圍內(nèi)平滑變化,這就是眾所周知的光流的平滑性約束,是一種全局約束的方法[8]。242。242。但是這種技術(shù)也存在著不足,甚至說(shuō)是缺陷。Wx206。I (x1 ), 209。由于開(kāi)始進(jìn)行運(yùn)動(dòng)值的預(yù)測(cè),也極大的提高了預(yù)算精度,而且在抗噪方面的性能也是十分卓越的。這么做,可以有效地避免在遮合的地方(即速度場(chǎng)突變的地方)的重要信息丟失。利用迭代法進(jìn)行求解,可得:uk +1kI x [I xx (u k ) + I yx (v k ) + I t ]I x2 + I y2 + a 2(318)vk +1kI y [I xx (u k ) + I yx (v k ) + I t ]I x2 + I y2 + a 2(319)其中,k 為迭代次數(shù),x (u k ) = u k 2I x I yu xy qT (209。 I yy234。 + 2231。I yy 247。(322)u xyk 和 v x。 xyI xy 246。232。v k )(320)(321)q =1I x + I y + 2s233。Ia 222[(u x I y u y I x )