【正文】
( state)集,該集合反映機(jī)器人通過(guò)傳感器測(cè)得的當(dāng)前狀態(tài)。 ( action)集,該集合反映了機(jī)器人當(dāng)前可以采取的動(dòng)作。 系。 ? 在基于邏輯推理的路徑規(guī)劃方法基礎(chǔ)進(jìn)行改進(jìn): ? 傳感器的一次測(cè)量值與多個(gè)狀態(tài)對(duì)應(yīng),每個(gè)狀態(tài)有一個(gè)隸屬度對(duì)應(yīng)。 ? 根據(jù)模糊推理結(jié)果確定行為。 ? 在基于邏輯推理的路徑規(guī)劃方法基礎(chǔ)進(jìn)行改進(jìn): ? 具有在線學(xué)習(xí)功能(通過(guò) Q學(xué)習(xí)算法實(shí)現(xiàn)) ( 1) 建模: 對(duì) 2維路徑規(guī)劃問(wèn)題,將待規(guī)劃的路徑看成是 n個(gè)點(diǎn)組成的點(diǎn)集,除初始點(diǎn)和目標(biāo)點(diǎn)外其余 n2個(gè)點(diǎn) {( xi, yi ) } i=2,3,4…n 1都未知,共有 2(n2)個(gè)未知參數(shù)。 ( 2) 112 2 22 , 2 , 3 , 3 , 1 , 1 1 122m i n ( ... ) [ ( ) ( ) ]nnl n n i i i i iiiE f x y x y x y L x x y y??? ? ? ???? ? ? ? ? ???優(yōu)化目標(biāo): 約束: ( xi, yi )必須在障礙物外部。 采用懲罰函數(shù)法轉(zhuǎn)化為 無(wú)約束優(yōu)化問(wèn)題進(jìn)行處理: m in lcE E wE??(EC為懲罰項(xiàng)) ( 3) ? 遺傳算法具有全局尋優(yōu)性能,對(duì)上述無(wú)約束優(yōu)化問(wèn)題可以得到全局最優(yōu)解。 ? 當(dāng)然,其他的優(yōu)化算法同樣可以用于路徑規(guī)劃。 ,轉(zhuǎn)化為優(yōu)化問(wèn)題。 。 3根據(jù) E遞減推導(dǎo)出相應(yīng)的反向傳播算法用于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練 . 優(yōu)勢(shì): 神經(jīng)元可以并行計(jì)算 障礙物對(duì)機(jī)器人施加排斥力,目標(biāo)點(diǎn)對(duì)機(jī)器人施加吸引力合力形成勢(shì)場(chǎng),機(jī)器人移動(dòng)就像球從山上滾下來(lái)一樣 機(jī)器人在合力作用下向目標(biāo)點(diǎn)移動(dòng)