【文章內(nèi)容簡(jiǎn)介】
了小型機(jī)器人賽,他們是:CMU(USA) 、 ParisVI(France)、University of Girona(Spain)和Nara Advanced Institute of Science and Technology(Japan)。參加中型機(jī)器人比賽的5個(gè)隊(duì)為:ISI/USC(USA)、Osaka University(Japan) 、Ullanta Performance Robotics(USA) 、RMIT(Australia) 和Uttori UnitedA joint team of Riken,Tokyo Univ. (Japanand) Utsunomiya Univ. (Japan)。仿真組比賽的冠軍為來(lái)自德國(guó)Humbolt 大學(xué)的ATHumbolt隊(duì),它擊敗了東京理工學(xué)院的AndHill 隊(duì)。第三和第四名分別為ISI/USC和CMU。獲得小型組冠軍的是CMU,它以3:0的比分擊敗了Nara Advanced Institute of Science and Technology,Japan。中型組的冠軍由ISI/USC和Trackies of Osaka University同時(shí)獲得,因?yàn)樗鼈儍纱螒?zhàn)平0:0和2:2。同時(shí)還頒發(fā)工程挑戰(zhàn)獎(jiǎng)和科學(xué)挑戰(zhàn)獎(jiǎng)。1998年7月48日,在法國(guó)巴黎舉辦了第二屆RoboCup比賽及會(huì)議。共有超過(guò)80支球隊(duì)參加比賽(40支仿真隊(duì)、12支小型機(jī)器人隊(duì)、16支中型機(jī)器人隊(duì)和3支有腿機(jī)器人隊(duì))目標(biāo)RoboCup提供了一些重大的長(zhǎng)期挑戰(zhàn),將會(huì)需要幾十年的時(shí)間來(lái)完成。然而,由于最后目標(biāo)很明確,我們可以得到幾個(gè)子目標(biāo),這就是中短期的挑戰(zhàn)。RoboCup吸引了這么多研究者的主要原因就是它需要將很大范圍的技術(shù)集成到一個(gè)完整的智能體團(tuán)隊(duì)中,這就有別于一些基于專門(mén)任務(wù)的功能模塊。長(zhǎng)期的研究問(wèn)題實(shí)在太廣泛,難以編撰成一系列條目的列表。雖然如此,我們還是可以說(shuō),這些挑戰(zhàn)包括了從物理部件的開(kāi)發(fā)(如高性能電池、馬達(dá))到高智能化的實(shí)時(shí)感知和控制軟件這些極其廣泛的技術(shù)問(wèn)題。中期技術(shù)挑戰(zhàn)是今后十年的目標(biāo),可以說(shuō)得更具體一些,也就可以編撰出一個(gè)部分列表。以下就是RoboCup中涉及到的研究領(lǐng)域的部分列表,主要以中期時(shí)間段為目標(biāo):(1)通用的智能體體系結(jié)構(gòu);(2)綜合反應(yīng)式方法和建模/規(guī)劃式方法;(3)實(shí)時(shí)識(shí)別、規(guī)劃和推理;(4)在動(dòng)態(tài)環(huán)境中推理和行動(dòng);(5)傳感器數(shù)據(jù)融合;(6)通用的多智能體系統(tǒng);(7)復(fù)雜任務(wù)中的行為學(xué)習(xí);(8)策略獲?。唬?)通用的認(rèn)知模型。除了這些技術(shù),提供一個(gè)帶有高質(zhì)量3D圖形能力的網(wǎng)絡(luò)足球服務(wù)器需要在模擬足球運(yùn)動(dòng)員的實(shí)時(shí)動(dòng)畫(huà)和基于網(wǎng)絡(luò)的交互式多用戶系統(tǒng)方面有一定的技術(shù)進(jìn)步。這些都是今后幾年基于網(wǎng)絡(luò)的服務(wù)中的關(guān)鍵技術(shù)。RoboCup的挑戰(zhàn)應(yīng)該理解為更大、更長(zhǎng)期的挑戰(zhàn),而不是一個(gè)一次性的挑戰(zhàn)。因此,我們希望提供一系列的短期挑戰(zhàn),這將會(huì)很自然的引導(dǎo)中長(zhǎng)期挑戰(zhàn)的完成。RoboCup挑戰(zhàn)主要分為三類:(1)合成智能體挑戰(zhàn);(2)物理智能體挑戰(zhàn);(3)基礎(chǔ)組織挑戰(zhàn)。RoboCup合成智能體挑戰(zhàn)處理可以用軟件模擬器開(kāi)發(fā)的技術(shù);RoboCup物理智能體挑戰(zhàn)的意圖是促進(jìn)使用實(shí)際機(jī)器人的研究,因此需要更長(zhǎng)的時(shí)間來(lái)完成每一項(xiàng)挑戰(zhàn)。它們將和RoboCup合成智能體挑戰(zhàn)同時(shí)進(jìn)行研究,但需要更長(zhǎng)的時(shí)間。提出基礎(chǔ)組織挑戰(zhàn)是為了方便研究而建立一個(gè)關(guān)于RoboCup、人工智能和機(jī)器人學(xué)的總的基礎(chǔ)組織。這些挑戰(zhàn)包括教育計(jì)劃、通用機(jī)器人平臺(tái)和部件標(biāo)準(zhǔn)、自動(dòng)評(píng)論員系統(tǒng)和進(jìn)行RoboCup比賽的智能體育場(chǎng)系統(tǒng)。RoboCup合成智能體挑戰(zhàn)對(duì)于RoboCup合成智能體挑戰(zhàn)97,我們提供一個(gè)明確的目標(biāo),這不但對(duì)RoboCup是重要的,對(duì)總的人工智能的研究來(lái)說(shuō)也很重要。這些挑戰(zhàn)將專門(mén)用于軟件智能體聯(lián)賽,而不是實(shí)際機(jī)器人聯(lián)賽。對(duì)于想設(shè)計(jì)一個(gè)參加RoboCup球隊(duì)的研究者來(lái)說(shuō),根本問(wèn)題是設(shè)計(jì)一個(gè)多智能體系統(tǒng),能夠進(jìn)行實(shí)時(shí)的反應(yīng),表現(xiàn)出目標(biāo)制導(dǎo)的理性行為。目標(biāo)與環(huán)境動(dòng)態(tài)的變化并且是實(shí)時(shí)的。由于足球比賽的狀態(tài)空間極大,不可能用手工的方法來(lái)編碼所有可能的情形和智能體的行為,因此使智能體能學(xué)習(xí)如何有策略的進(jìn)行比賽變得極為重要。在這個(gè)方面的挑戰(zhàn)包括以下的研究問(wèn)題:(1)在多智能體合作及對(duì)抗環(huán)境中的機(jī)器學(xué)習(xí)(2)多智能體體系結(jié)構(gòu),為了團(tuán)隊(duì)合作而進(jìn)行實(shí)時(shí)的多智能體規(guī)劃和規(guī)劃執(zhí)行(3)對(duì)手建模。主要挑戰(zhàn)我們提出以下三個(gè)挑戰(zhàn)作為RoboCup合成智能體挑戰(zhàn)的中心任務(wù):學(xué)習(xí)挑戰(zhàn)、團(tuán)隊(duì)合作挑戰(zhàn)和對(duì)手建模挑戰(zhàn)。RoboCup學(xué)習(xí)挑戰(zhàn)的目的是征求理解性學(xué)習(xí)模式,它能用于需要適應(yīng)環(huán)境的多智能體系統(tǒng)的學(xué)習(xí);并能用標(biāo)準(zhǔn)任務(wù)來(lái)評(píng)價(jià)所提供方法的優(yōu)點(diǎn)和缺點(diǎn)。學(xué)習(xí)是智能系統(tǒng)的重要方面,在RoboCup學(xué)習(xí)挑戰(zhàn)中,任務(wù)是為一組智能體創(chuàng)建一種學(xué)習(xí)和訓(xùn)練的方法。這個(gè)領(lǐng)域的學(xué)習(xí)機(jī)會(huì)可以分為以下幾類:(1)單個(gè)智能體的離線技術(shù)學(xué)習(xí)(2)智能體團(tuán)隊(duì)的離線合作學(xué)習(xí)(3)在線技術(shù)和合作學(xué)習(xí)(4)在線對(duì)抗學(xué)習(xí)這個(gè)領(lǐng)域離線和在線學(xué)習(xí)的區(qū)別特別重要,因?yàn)楸荣愔怀掷m(xù)大約20分鐘,所以在線技術(shù),特別是學(xué)習(xí)某場(chǎng)特定比賽中的概念時(shí),必須很快的產(chǎn)生結(jié)果。例如,如果一個(gè)隊(duì)要學(xué)習(xí)針對(duì)某個(gè)對(duì)手變換它的行為,它必須能在比賽結(jié)束前提高自己的性能,然后再對(duì)付下一個(gè)對(duì)手。學(xué)習(xí)中的這種區(qū)別可以應(yīng)用到很多具有學(xué)習(xí)能力的多智能體系統(tǒng)中。RoboCup團(tuán)隊(duì)合作挑戰(zhàn)提出了在動(dòng)態(tài)對(duì)抗環(huán)境中多智能體團(tuán)隊(duì)合作中的實(shí)時(shí)規(guī)劃、重規(guī)劃、執(zhí)行等問(wèn)題。9799階段這個(gè)挑戰(zhàn)中主要感興趣的問(wèn)題是在團(tuán)隊(duì)背景下(特別是RoboCup的團(tuán)隊(duì)合作)進(jìn)行實(shí)時(shí)規(guī)劃和規(guī)劃執(zhí)行的體系結(jié)構(gòu)。另外,體系結(jié)構(gòu)在非RoboCup應(yīng)用中等通用性也是一個(gè)重要的因素。在類似足球這樣復(fù)雜、動(dòng)態(tài)的多智能體領(lǐng)域中需要極為靈活的協(xié)調(diào)和通訊來(lái)克服其中的不確定性。例如,團(tuán)隊(duì)目標(biāo)的動(dòng)態(tài)變化,團(tuán)隊(duì)成員意外的不能完成應(yīng)盡的責(zé)任,或機(jī)會(huì)的意外發(fā)現(xiàn)。不幸的是,實(shí)現(xiàn)多智能體經(jīng)常依賴于預(yù)先規(guī)劃的、領(lǐng)域相關(guān)的協(xié)調(diào)方法,不可能提供這種靈活性。第一,很難預(yù)計(jì)并規(guī)劃所有的協(xié)調(diào)失敗,特別在上升到復(fù)雜情形時(shí),這樣的系統(tǒng)對(duì)象足球比賽這種動(dòng)態(tài)的任務(wù)就不夠健壯。第二,得到領(lǐng)域相關(guān)的系統(tǒng)后,可重用性就很差。更進(jìn)一步,動(dòng)態(tài)的規(guī)劃協(xié)調(diào)很難,特別是在具有這么多可能的行動(dòng)和這么大的狀態(tài)