【正文】
red with the approaches using appearance features of the whole image (Method 2, M2), our system (M1) uses local salient regions to localize and map, which makes it have more tolerance of scale, viewpoint changes caused by robot?s movement and higher ratio of recognition and fewer amount of vertices on the topological map. So, our system has better performance in dynamic environment. These can be seen in Table 2. Laneways 1, 2, 4, 5 are in operation where some miners are working, which puzzle the robot. 6 Conclusions 1) Salient local image features are extracted to replace the whole image to participate in recognition, which improve the tolerance of changes in scale, 2D rotation and viewpoint of environment image. 2) Fuzzy logic is used to recognize the local image, and emphasize the individual feature?s contribution to recognition, which improves the reliability of landmarks. 3) HMM is used to capture the structure or relationship of those local images, which converts the scene recognition problem into the evaluation problem of HMM. 4) The results from the above experiments demonstrate that the mine rescue robot scene recognition system has higher ratio of recognition and localization. Future work will be focused on using HMM to deal with the uncertainty of localization. 附錄 B 中文翻譯 基于視覺(jué)的礦井救援機(jī)器人場(chǎng)景識(shí)別 CUI Yian(崔益安 ), CAI Zixing(蔡自興 ), WANG Lu(王 璐 ) 摘要: 基于模糊邏輯和隱馬爾可夫模型( HMM), 論文 提出了一個(gè)新的場(chǎng)景識(shí)別系統(tǒng),可 應(yīng)用于 緊急情況 下 礦山救援機(jī)器人 的 定位。通過(guò)這種方式,定位問(wèn)題, 即 系統(tǒng)的現(xiàn)場(chǎng)識(shí)別問(wèn)題,可以轉(zhuǎn)化為對(duì) HMM 的評(píng)價(jià)問(wèn)題。礦 井 救援機(jī)器人的開(kāi)發(fā)是為了在緊急情況下進(jìn)入 礦井為被困人員 查找可能的逃生路線,并確定 該線路 是否安全。 目前,大多數(shù)場(chǎng)景識(shí)別方法是基于 全局圖像 特征,有兩個(gè)不同的階段: 離線培訓(xùn) 和在線匹配。另一種方法使用外觀特征包括顏色 、 紋理和邊緣密度來(lái)表示圖像。 LOWE提出了 SIFT方法,該方法利用關(guān)注點(diǎn)尺度和方向所形成的描述的相似性獲得特征。 但是它并不能捕捉到個(gè) 別 特征 對(duì) 場(chǎng)景 識(shí)別的貢獻(xiàn)。 在這個(gè)系統(tǒng)中,我們 通過(guò) 提取突出的圖像局部區(qū)域 作為位置標(biāo)志用以替 代整個(gè)圖像 ,改善了信息的穩(wěn)定性,從而處理比率、 二維旋轉(zhuǎn)和 視角的變化 。 因此,場(chǎng)景識(shí)別可以轉(zhuǎn)化為對(duì) HMM評(píng)價(jià)問(wèn)題 ,這使得 識(shí)別具有 魯棒性。 計(jì)算 顏色和 紋理 的 相似度用以繪制突出區(qū)域的地 圖。為了驗(yàn)證我們方法對(duì)位置標(biāo)志檢測(cè)的的可重復(fù)性,我們已經(jīng)在圖像比例、二維旋轉(zhuǎn)和視角等變化時(shí),做了一些實(shí)驗(yàn)。換句話說(shuō), 在前進(jìn)中,我們不必對(duì)場(chǎng)景分類(lèi) 。 在論文中 隱馬爾可夫模型是用來(lái)組織從 當(dāng)前 的現(xiàn)場(chǎng)提取的 位置標(biāo)志 , 并且設(shè)置 拓?fù)?圖的頂點(diǎn)用以實(shí)現(xiàn) 部分 信息的 恢復(fù)能力。 在我們的系統(tǒng) 中 EVI D70相機(jī)擁有一個(gè) 177。 取一張 , 一共得到 8個(gè) 圖像 。 圖 2 機(jī)器人所處環(huán)境的 HMM 至于拓 撲圖的邊緣,我們 用 兩個(gè)頂點(diǎn)之間的距離 信息設(shè)置 。 因此, 選擇的 描述或 特征相應(yīng)于比例、旋轉(zhuǎn)和視角的變化應(yīng)該在 一定 范圍內(nèi)保持恒定不變 , 在本文中, 我們使用 社會(huì)上通常采用的四個(gè)特征, 簡(jiǎn)單地描述 如下: GO:漸變的方向。 匹配問(wèn)題的另一個(gè)關(guān)鍵問(wèn)題是選擇一個(gè)好的 匹配方法 或算法。 而在數(shù)據(jù)庫(kù)中的融合相似程度 最 高 的位置標(biāo)志 , 可以當(dāng)作 最佳匹配。 該視覺(jué)系統(tǒng)是由一個(gè)CCD相機(jī)和一幀采集卡 IVC4200。 圖 3 使用模糊邏輯方法計(jì)算的相似度 由于采用 HMM的 描述 和 識(shí)別場(chǎng)景 ,我們的系統(tǒng)有能力捕捉圖像局部區(qū)域分布的區(qū)別,并且能 有效區(qū)分類(lèi)似的 場(chǎng)景 。這個(gè)過(guò)程可以概括為:當(dāng)定位成功, 當(dāng)前 的 位置標(biāo)志序列根據(jù)他們的方向 添加到 伴隨觀察的 匹配頂點(diǎn) 的序列(包括 從突出局部區(qū)域和機(jī)器人頂部所觀測(cè)的 圖像角度 )。 6 結(jié)論 1)提取突出 局部 圖像特征,以取代整體 圖像 參與的 識(shí)別 ,這 提高 了 對(duì)比例大小 的變化,二維旋轉(zhuǎn)和環(huán)境 圖像視角 的容 許 。 。 4)實(shí)驗(yàn)結(jié)果表明,該礦山救援機(jī)器人場(chǎng)景識(shí)別系統(tǒng)具有較高的識(shí)別和定位的比例。 相對(duì)于使用 整體圖像 外觀特征的 方法 (方法 2, M2),我們的系統(tǒng)( M1)使用局部 突出 區(qū)域定位和識(shí)別 地圖,這使得它 能有 更多 對(duì) 變化 的容許,這些變化由 機(jī)器人的運(yùn)動(dòng) 、 高 頻率的識(shí)別 和 拓?fù)鋱D上較少的 頂點(diǎn)數(shù)量所造成。 然后收集 20個(gè)場(chǎng)景時(shí) 為 機(jī)器人隨后進(jìn)入每 一 個(gè)環(huán)境, 用 以形成 60個(gè)以上 HMMs。 該電腦系統(tǒng)是由 1千兆赫處理器和 512M內(nèi)存,由機(jī)器人 攜帶 。如上所述,該方法可以有效地測(cè)量?jī)?部分圖像 的相似性。但我們 在實(shí)驗(yàn)中 發(fā)現(xiàn) , 神經(jīng)網(wǎng)絡(luò)不能充分展現(xiàn)個(gè) 體 描述或 特征對(duì) 相似性度量的 作用 。 ASM和 ENT:角二階矩和熵,這是兩個(gè)紋理描述符。 4 基于模糊邏輯的匹配方法 圖像匹配的關(guān)鍵問(wèn)題之一,是要選擇最有效的 特征 或描述代表原始圖像。 HMM的參數(shù) aij和 bjk是通過(guò)使用 Baulm Welch算法 學(xué)習(xí)獲得 。 視野 。 從每一 張圖像 , 探測(cè) 突出 的局部 區(qū)域 ,并形成 一個(gè) 命名為“ 位置標(biāo)志序列”的 序列, 其順序和圖像序列相同 。 雖然地圖的幾何布局被定位系統(tǒng)忽視,但它對(duì)可視化調(diào)試是有用的,并對(duì)路徑規(guī)劃很有益處。關(guān)于比率和旋轉(zhuǎn)更詳細(xì)的分析和結(jié)果可以在我們以前的論文中發(fā)現(xiàn)。位置標(biāo)志區(qū)域的大小可以根據(jù)該區(qū)域圖像梯度方向的變化自適應(yīng)決定。這些區(qū)域可以當(dāng)作天然的位置標(biāo)志有效地表示和區(qū)別不同環(huán)境。 模糊識(shí)別 算法用以識(shí)別鄰近位置的位置標(biāo)志, 它可以 增 強(qiáng)個(gè)別 特征對(duì)場(chǎng)景 識(shí)別的 作用 。此外,所選的 特征 并不能 徹底地按照國(guó)家模式識(shí)別標(biāo)準(zhǔn)表示場(chǎng)景 ,這使得 識(shí)別結(jié)果 不可靠。但 SIFT可能產(chǎn)生 1 000個(gè)或更多的興趣點(diǎn),這可能 使處理器 大大減慢。 此方法簡(jiǎn)單,但