【正文】
智能基礎(chǔ)設(shè)施系統(tǒng)和智能車輛系統(tǒng)。 關(guān)鍵詞 :數(shù)字圖像處理 車牌識別 字符識別 神經(jīng)網(wǎng)絡(luò) An Arithmetic Research Based On Neural Network for Car License Plate Recognition Abstract With the rapid development of domestic traffic management, these systems that are based on the license plate recognition appeared at the right moment, such as the traffic signal automation management system, intelligent traffic monitor system, GPS, automation parking toll system, and intelligence traffic system, . Because license plate is a important part of vehicle management system, so the research of license plate system is particularly important .The core of arithmetic of license plate system is how to improve the recognition, so it requires recognition algorithm has great robustness for the impact of light conditions of the environment and taken the position and vehicle speed it also can satisfy the timely requirement. In this paper, my work is focused on the image processing based on MATLAB emulator. Three problems were analyzed, which are license locating, segmentation and character recognition. Before license locating, artificial neural work (ANN) is adopted to handle the image, then the information of license plate is obtained in evidence. To locate the license plate, the inherent features of license plate being used, and then use mathematical morphology to locate the license plate accurately。由于汽車牌照是機動車輛管理的主要標志符號之一,因此對車輛牌照識別系統(tǒng)的研究就尤為重要,該研究的核心是提高車牌識別準確性,這就需要識別算法能夠?qū)Νh(huán)境光照條件,拍攝位置和車輛行駛速度等因素的影響有較大的魯棒性,并能夠滿足實時性的要求。最后在車牌字符識別階段,以現(xiàn)今比較流行的神經(jīng)網(wǎng)絡(luò)為理論基礎(chǔ),在原有的神經(jīng)網(wǎng)絡(luò)算法基礎(chǔ)上進行有效改進。該系統(tǒng)的應(yīng)用要求對車牌正確識別具有較高的識別率。在不影響汽車狀態(tài)的情況下,大部分 LPR 系統(tǒng)的工作由計算機自動完成,從而可降低工作復(fù)雜度。目前這三方面的研究情況大致如下: 車牌定位技術(shù) 在對實際車牌區(qū)域定位之前,需要進行相應(yīng)的預(yù)處理。 ( 5)車牌的幾何特征,即車牌的高、寬以及高寬比,應(yīng)在一定的范圍內(nèi)。在理論上,利用垂直投影法對斷裂字符 進行分割應(yīng)具有較好效果;但是對于字符區(qū)域連接緊密的字符的分割利用投影法可能效果比較差,可以利用模板的方法或者回溯的方法來進行處理?;谔卣髌ヅ涞乃惴ㄐ时饶0?匹配算法效果更好,但是特征的正確提取比較困難。 。另外日本,加拿大、德國、意大利、英國等各個西方發(fā)達國家都有適合本國車牌的識別系統(tǒng)。 本文研究的內(nèi)容 由于神經(jīng)網(wǎng)絡(luò)具有較強的自組織學習能力、容錯性、魯棒性及非線性處 6 理等優(yōu)點,所以本文選擇了神經(jīng)網(wǎng)絡(luò)技術(shù)作為研究的主要方法,在此基礎(chǔ)上,詳細研究了車牌識別算法的實現(xiàn)方法,主要包括車輛牌照的分割與提取和車牌字符的識別。之后用投影特征圖得到分割后的字符,為了方便下步的處理,本文隨后采用了字符歸一化的技術(shù)。彩色圖像包含大量的顏色信息,它的每個像素都包含三個不同的顏色分量 R、 G、 B,占用的存儲空間比較大,對其進行處理時會降低系統(tǒng)的執(zhí)行速度。 二值化效果如圖 22 所示 圖 22 二值化處理 均值濾波 濾波是一種對圖像進行增強的算法,通過對圖像進行濾波處理可以實現(xiàn)圖像的光滑、銳化。數(shù)學形態(tài)學運算的效果由結(jié)構(gòu)元素的大小和邏輯運算決定,通常有膨脹運算、腐蝕運算、開運算和閉運算。目前廣泛使用的邊緣檢測的方法有以下幾種: Robert 算子, Sobel 算子, Canny 算子, Prewitt 算子, log 算子等。牌照的規(guī)格也各不相同,各種字符的組合多種多樣,概括起來具有以下一些特征: ①車牌 中均為七個字符,常規(guī)情況第一個字符為漢字,第二個字符為字母,第三個到第七個字符為字母或者數(shù)字; ②車牌中七個字符的外接矩形相同,高度和寬度的比例相同(除“ 1”外); ③車牌的牌照架,以前是根據(jù)車主的要求牌照架有所不同,有的還沒有安裝牌照架,這不適合利用邊框信息進行字符分割。 ( 2)從左到右取投影圖外圍包絡(luò)線的波谷點,并將這些波谷點按照橫坐標值升序排列。 基于連通域的字符分割算法 車牌上的字符除了第一個是漢字外,其它的都是字母或數(shù)字,即在理想狀態(tài)下是“全”連通的。 ( 5)輸出分割后的字符圖像。 圖像預(yù)處理 傾斜校正和水平切割后,需要牌照圖像二值化,轉(zhuǎn)化為黑底色白字對不同顏色的牌照處理,采用 CASDA 算法進行二值化處理,然后計算二值化后的圖像垂直投影,結(jié)果如圖 31 所示。為此,引入優(yōu)割字符的概念。由于優(yōu)割字符并不一定就是最后分割出的字符,有時車牌的邊框等也滿足優(yōu)割字符的條件,但它并不是一個車牌字符,因此,需要將這些偽字符在后續(xù)處理中剔除。調(diào)整的方法為:首先計算除該字符外的其余六個字符的平均字符寬度及平均字符空隙寬度。圖像分割結(jié)果如表 31 所示。 a 定位結(jié)果圖像 b 分割結(jié)果圖像 圖 35 部分圖像分割效果圖 從圖 35 可以看出,本文研究的方法對圖像中字符模糊及光照不均勻等 19 有很強的魯棒性能,分割效果良好。為了提高字符識別的正確率,對發(fā)生傾斜角度的牌照進行糾正是非常必要的。通過判斷這個局部最大值,可得到與該直線對應(yīng)的一對參數(shù) ? ???, ,從而檢測出該直線。為了從字符行傾斜度恢復(fù)車牌原貌,本文采取從多個角度來對圖像傾斜的方向掃描,然后分別記錄個掃描平行線組中具有車牌字符信息的行數(shù),對應(yīng)的字符行數(shù)目 最多的掃描角度就是圖像的傾斜角度。對定位后的牌照圖像進行行組掃描,初始化一個數(shù)組。這種分割的方法成功率較高,且受圖像的噪聲干擾較小,但是這種方法須進行預(yù)定 義,不能夠自適應(yīng)。 本文采用垂直投影法,對于二值化后的圖像,由于每個字符塊在垂直方向的投影必然在字符間或字符內(nèi)的間隙處取得 局部最小值,依據(jù)此并結(jié)合字符牌照固有的上述特征等先驗知識,采取如下步驟來實現(xiàn)字符的分割。根據(jù)已計算出的 charwidth,從第二個字符右邊界開始,向左檢測出第二個字符的左邊界,并依次類推,結(jié)合 charspace 得到第一個字符的左右邊界;同理,以第三個字符的左邊界為基準得到后 5 個字符的左右邊界。歸一化的過程有兩步,分別是:分裂 (split)和合并 (merge)。 鄰近插值法中歸一化的圖像 g(x, y),其點 (x1, y1)是由 (x0, y0)鄰接的4 個點 (m, n), (m+1, n), (m, n+1), (m+1, n+1)中幾何距離最接近它的點的灰度值來近似。 圖 51 汽車牌照字符識別的流程 車牌字符特征提取 基于字符特征的字符識別算法一般包括以下 3 個步驟 [11]: ( 1)提取字符的特征,建立一個字符特征向量空間,每個字符對應(yīng)向量空間中的一個向量; ( 2)定義分類函數(shù); ( 3)對輸入的字符圖像自動提取相應(yīng)的特征,根據(jù)分類函數(shù)進行特征匹配,識別出相應(yīng)的字符。 字符的統(tǒng)計特征,是從原始數(shù)據(jù)中提取與分類最相關(guān)的信息,這些信息使得類內(nèi)差距最小,類間差距最大,同時這些信息對同一類字符的形變應(yīng)盡量保持不變。它首先將歸一化后字符圖像向不同的方向進行投影,然后對文字黑像素的個數(shù)做累加運算,形成筆畫密度直方圖 [13]。它可以在外界環(huán)境的刺激作用下 調(diào)整網(wǎng)絡(luò)自由參數(shù),并以新的方式來響應(yīng)外部環(huán)境。各層信號之間的數(shù)學關(guān)系如下: 對于隱含層,有如下公式: )( jj n etfy ? ( 51) iijnij xvne t 0??? ( 52) 對于輸出層有如下公式: )( kk n e tfo ? ( 53) jjkmjk ywn e t 0??? ( 54) (4)利用誤差反饋調(diào)整權(quán)值,用遞歸的方法從輸出節(jié)點開始返回到中間隱層,按下式進行調(diào)整權(quán)值: 35 首先計算網(wǎng)絡(luò)輸出值與期望輸出值之間的誤差 E: 21 )(21)(21kklk odODE ????? ? ( 55) 將該式展開至隱含層,可得: 2012121 )]([21)]([ jjkmjklkkklk ywfdn e tfdE ??? ??????? ( 56) 將該式展開至輸入層,可得: 2iij0ijk0jk1 ) ] }xvf(wf[{d21 nmlkE ??? ???? ( 57) 由上式可看出,通過調(diào)整權(quán)值 wij, vjk,可以改變誤差 E。 BP 神經(jīng)網(wǎng)絡(luò)采用 WidrowHoff 學習算法和非線性可微轉(zhuǎn)移函數(shù)的多層網(wǎng)絡(luò)。首先判斷訓練學習后的誤差是否達到預(yù)定要求,如果沒有達到,則返回第( 2)步輸入新的樣本輸入集;如果己經(jīng)達到預(yù)定目標或某一給定值,則學習過程結(jié)束。 神經(jīng)網(wǎng)絡(luò)的工作方式,由兩個階段構(gòu)成: ( 1)學習期:神經(jīng)元之間的連接權(quán)值可由學習規(guī)則進行修改,以使目標函數(shù)達到最小; ( 2)工作期:在此期間,保持連接權(quán)值不變,由網(wǎng)絡(luò)的輸入得到相應(yīng)的輸出。它源于物理學、心理學和神經(jīng)生理學的跨學科研究。對英文和阿拉伯數(shù)字的特征提取,采用具有統(tǒng)計性質(zhì)的,根 據(jù)局部特征的,適應(yīng)性較好的 13 特征提取法,也就是直接利用每個點的像素值作為特征提取的基礎(chǔ),從構(gòu)成該字符的像素點中,統(tǒng)計提取出 13 個特征點。分類后的樣本要實現(xiàn) :類內(nèi)各樣本具有較好的一致性,類間各樣本的區(qū)分度應(yīng)盡量大; ( 2)具有較好的魯棒性,穩(wěn)定性??紤]到算法復(fù)雜性和實時性的處理要求,本文選用了鄰近插值法來進行字符歸一化。隨后進 入合并階段,將 MI NJ 陣列中劃分成陣列大小為劃分成陣列大小為 M N 的 I J 個區(qū)域,對 M N區(qū)域的像素進行平均,陣列 M N 縮成一個點像素,這樣 M N 尺寸的原始圖像就歸一化為 I J 大小的圖像。 車牌字符分割前后對比圖如下: 圖 46 待分割的車牌 27 圖 47 分割后的單個車 牌字符 實踐證明結(jié)合牌照固有特征進行車牌字符分割,算法簡單,處理速度快,適合實時處理的環(huán)境,而且分割準確率也較高。 ,分析車牌在 Y 軸方向上的投影,確定字符區(qū)域的上邊界 upline 和下邊界 downline; 。通常,提取后的牌照,其字符塊在豎直方向上的投影會在字符間取得局部最小值,這樣,字符的正確分割位置應(yīng)該是在上述局部最小值附近。然后根據(jù)此角度,選擇合適的旋轉(zhuǎn)方法,對車牌進行校正。也就是 說,該行組偏離水平方向的掃描角度,即是車牌圖像在水平方向上的傾斜角度。 (2)通過模板匹配尋找牌照區(qū)域的四個頂點,再通過雙線形空間變換重建矩形車牌區(qū)域 [7]。 HOUGH 變換最早是 1962 年由 Paul Hough[6]首先提出,用來實現(xiàn)一種直線從圖像空間到參數(shù)空