freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

2d 仿真機器人足球整體性能的優(yōu)化與實現(xiàn)_畢業(yè)論文-預覽頁

2025-08-21 04:15 上一頁面

下一頁面
 

【正文】 the agent architecture, it apply the hybird agent architecture in the team. The architecture consists of modeling, munication, actions, domain knowledge, deliberative reasoning and reactive module. Acplished the assignment and recognition of heterogeneous agent by an online coach in chapter four, some essential guidelines are abstracted and the framework of assignment is set up with these guidelines. Refined the typical actions with heterogeneous agents in chapter five. It optimization the simulation system as a whole. Key words:RoboCup。從第三章開始切入本文正題,首先從團隊整體策略和智能體體系結(jié)構(gòu)兩方面講解了多智能體系統(tǒng)架構(gòu),其中應(yīng)用了混合型的智能體體系結(jié)構(gòu) 將智能體架構(gòu)分為建模模塊、通訊模塊、 動作模塊、知識庫模塊、規(guī)劃決策模塊和反應(yīng)模塊。本人完全意識到本聲明的法律后果由本人承擔。除了文中特別加以標注引用的內(nèi)容外,本論文不包含任何其他個人或集體已經(jīng)發(fā)表或撰寫的成果。 本文首 先介紹了 RoboCup 的研究背景,然后介紹了 rcssserver 的的仿真環(huán)境。 整體上對仿真機器人足球系統(tǒng)進行了優(yōu)化。 Agent的理論和研究技術(shù)最早源于分布式人工智能,但從 80 年代末開始, Agent理論及技術(shù)研究從分布式人工智能中拓展出來,并與許多其他領(lǐng)域的知識互相借鑒,在許多不同于人工智能領(lǐng)域得到了廣泛的應(yīng)用。與單個Agent相比, MAS具有以下特點:每個 Agent僅擁有不完全的信息和問 題求解能力,不存在全局控制,數(shù)據(jù)是分布的,計算過程是并行的。 RoboCup機器人世界杯 RoboCup機器人世界杯是國際上一項為促進分布式人工智能、智能機器人技術(shù)及相關(guān)領(lǐng)域的研究與發(fā)展而舉行的大型比賽和學術(shù)活動。日本學者立即對這一想法進行了系統(tǒng)的調(diào)研和可行性分析。 1997 年,在國際最權(quán)威的人工智能系列學術(shù)大會 第 15 屆國際人工智能聯(lián)合大會( The 15th International Joint Conference on Artificial Intelligence,簡稱 IJCAI 97)上,機器人足球被正式列為人工智能的一項挑戰(zhàn)。而在機器人足球中則較易兼顧二者,易于深入。 RoboCup仿真比賽 RoboCup仿真機器人足球比賽是在 RoboCup官方提供的仿真平臺上進行的,因此設(shè)計者不必考慮硬件實現(xiàn),而將研究集中在動態(tài)不確定環(huán)境下的問題求解與多智能體合作 [4][5][6]。如何獲得更多的有效信息,如何利用有限信息進行合理的決策,是 RoboCup球隊決策的一個重要問題。如何 使 球員間協(xié)商、規(guī)劃以實現(xiàn)合作完成任務(wù)并在對抗中取得最大效益,這是 RoboCup仿真足球的一個重要研究問題。 論文組織結(jié)構(gòu) 第 1 部分,緒論,介紹機器人足球的研究背景及 RoboCup。 第 5 部分,智能體間的配合與對抗,介紹仿真機器人足球系統(tǒng)的決策方法以及實現(xiàn)。比賽的執(zhí)行采用的是服務(wù)器客戶端( server/client)模式,服務(wù)器端程序 rcssserver提供了一個虛擬場地并且模擬包括球和球員在內(nèi)的所有物體的移動,每個客戶端程序相當于一個球員的大腦,控制場上該球員的移動??蛻舳酥g的通訊必須通過服務(wù)器端根據(jù)規(guī)則來進行轉(zhuǎn)發(fā),任何不經(jīng)過服務(wù)器客戶端直接聯(lián)系的行為都是違反規(guī)則的。 rcssmonitor是一個程序?qū)膔cssserver那里獲得的場上比賽信息顯示到一個虛擬的足球場地上,由客戶端程序控制的隊員可以在場上跑動、踢球等。其中球和球員都具有大小、位置、速度、加速度等屬性,球員則還有方向、耐力等屬 性。由于仿真比賽環(huán)境具有動態(tài)、實時、不確定、多主體對抗等特點,比賽不可能按照事先的設(shè)計按部就班的進行,還需要在比賽中有一個 “ 智能 ” 裁判。 消息板模塊負責客戶端之間的通訊。在每個仿真周( simulatorstep,缺省為 100毫秒)結(jié)束前, server 收集所有球員程序的行為請求,直到每個周期末才統(tǒng)一執(zhí)行并更新場上信息。 在 rcssserver 平臺上比賽時,所有仿真比賽場景都可以通過一個可視化程序 rcssmonitor 顯示在電腦屏幕上。場上每個隊員用一個圓圈表示,從圓心處引出兩條線段,紅色線段代表球員脖子的朝向,黑色線段代表球員身體的朝向。通過這個接口,客戶端程序可以發(fā)送命令來控制場上的一個球員行動以及接收到這名球員 的感知信息。一個球隊最多可以連接 12 名隊員,其中包括 11 名隊員(其中一個是守門員)和 1 名場上教練。這就要求球員決策要有比較高的實時性。仿真比賽平臺的一個目的就是要評估多智能體系統(tǒng),智能體之間 的高效通訊也是其中的一個判別標準。 仿真平臺主要特點 通過上面的介紹可以看到, RoboCup 仿真平臺提供了一個很好的、全分布的、包括合作與對抗的多智能體實時環(huán)境,非常有挑戰(zhàn)性。 ( 4)球員能力受限:場上所有球員的能力都是參照真實球員有所限制的,如體力、加速度、最滁州學院本科畢業(yè)設(shè)計 7 大速度、慣性等。 RoboCup 仿真比賽充分體現(xiàn)了人類足球的特點,也集中了許多人工智能領(lǐng)域關(guān)注的重點問題。本章首先 站在團隊整體的高度,結(jié)合具體的領(lǐng)域知識,探討基于站位和通訊的 協(xié)作 策略;然后介紹了智能體所采用的混合型體系結(jié)構(gòu);最后從程序設(shè)計的角度說明系統(tǒng)架構(gòu)的具體實現(xiàn)。在仿真比賽中,預定義模式一般由陣型體現(xiàn),通過陣型的概念對智能體進行角色分配,使其在全場比賽中保持協(xié)調(diào)。每種角色都包括了這個角色的一些性質(zhì),如活動區(qū)域、初始位置等,當然不同角色的活動區(qū)域可以相互重疊。我們基于 FCP 的 SBSP 策略進行站位的訓練, SBSP 要求陣型在定義角色的同時,定義每個角色的基本位置 Home( x,y),對足球的吸引權(quán)重 Weight( x,y),還有對雙方越位線的考慮等。比賽時,由于控球、盯人等原因,使智能體偏離原扮演角色所處的區(qū)域,導致場上出現(xiàn)空當無人防守,此時就需要其他智能體能夠彌補這個角色缺失引起的危險。 智能體除了因為角色變化產(chǎn)生站位調(diào)整外 ,智能體的異構(gòu)類型也可作調(diào)整。因此,隊員間的合作無法主要依靠通 訊完成,通訊只能作為配合的輔助作用。通過視覺參數(shù)的設(shè)置和視覺動作的調(diào)整來維護世界模型是智能體的底層工作。 通 過 球 的 位 置 及 吸引 力 得 到 站 位 位 置Y 位 置 是 否 超 出邊 場是 否 需 要 在 球后 面是 否 在 球 的 后面是 否 超 出 X 最 大值 是 否 小 于 X 最 小值是 否 越 位得 到 最 終 站 位 位 置把 邊 場 設(shè) 置 為 Y 位置把 球 的 X 位 置 設(shè) 置為 自 身 的 X把 X 最 大 值 設(shè) 置 為自 身 的 X把 X 最 小 值 設(shè) 置 為自 身 的 X把 越 位 線 設(shè) 置 為 自身 的 X 圖 31 陣型決定站位流程圖 由于每條通訊消息長度的限制,不可能交流全部的世界模型;另一方面,智能體的全局協(xié)調(diào)由陣型指導,而智能體的動作只能影響局部環(huán)境。除了對世界模型的共享外,通訊還用來提供部分的輔助決策信息,用來對某些非正常隊友的提醒,如接球點。 基于符號推理系統(tǒng)的慎思體系結(jié)構(gòu)采用傳統(tǒng)人工智能中符號推理的基本原理,試圖通過建立比較完整的符號系統(tǒng)進行知識推理來使智能體具有自主思考的能力以及與其他智能體和環(huán)境進行協(xié)調(diào)行動的能力。智能體通過感知模塊來獲取外部環(huán)境,并對環(huán)境信息做出一定的抽象,根據(jù)信息的類型,感知模塊將經(jīng)過抽象的信息送到不同的處理模塊。智能體在感知的基礎(chǔ)上條件反射產(chǎn)生動作,構(gòu)成了反應(yīng)模塊。 在仿真比賽中,世界模型 在初始化時就產(chǎn)生了很多靜止對象,比如球門、邊線以及固定標志等,這是用來自定位的。根據(jù)動作模塊中記錄的已請求執(zhí)行指令的次數(shù),對照 sense_body 消息中反饋的基本指令已執(zhí)行次數(shù),可以推知該指令是否被仿真平臺 丟失,決策規(guī)劃模塊可以據(jù)此決定是否需要重發(fā)該指令,反應(yīng)模塊也據(jù)此進行發(fā)送時機的動態(tài)調(diào)整。因此,智能體首先根據(jù)視覺消息中靜止對象信息完成自定位,然后進行對其他運動對象的更新。根據(jù)當前世界模型預測將可能出現(xiàn)的情況,并將行動的建議遞交給決策模塊。 在 節(jié)中描述的局部通訊模型可以保證系統(tǒng)的魯棒性,在通訊功能故障時,不會很大的影 響系統(tǒng)的表現(xiàn)性能。決策給出最終選擇的動作后,需要分解成更基本的符合仿真平臺動作接口的指令序列,這個工作由動作模塊完成。 跑位:智能體根據(jù)陣型和角色計算出自己的期望位置,向其靠攏。 帶球:智能體保證對足球控制的同時,推進足球的位置。 過人:一對一的技術(shù)體現(xiàn),在晃過對手的同時,保持對足球的控制。 封斷:封球和斷球,當對方控球時,封死其傳球、帶球路線,必要時可以從其腳下?lián)寯嘧闱?,進而反擊。 局部配合進攻包括 “二過一 ”戰(zhàn)術(shù)配合、 “三過二 ”戰(zhàn)術(shù)配合和反切配合等。由于這種配合有兩個隊友可以同時接應(yīng)傳球,因此使控球者的傳球路線更多,且進攻面擴大,但是較難在機器人足球比賽中達到流暢的配合實現(xiàn)。造越位技術(shù)是利用規(guī)則而設(shè)計的一種防守戰(zhàn)術(shù),但由于其配合難度大,一旦不成功會給對手很大的機會,因此較少使用。中路進攻是利用球場中間區(qū)域組織的進攻,由于中路防守最為嚴密,因此難度較大。盯人緊逼防守即人盯人防守,各自都有明確的防守對象,在規(guī)定的范圍內(nèi)盯人緊逼, 不交換看守,此方法主要用戶在非play_on 模式下使用來阻止對手順利拿到球。滁州學院本科畢業(yè)設(shè)計 14 定位球戰(zhàn)術(shù)包括中圈開球、角球、任意球、界外球等,有時起決定勝負作用。智能體的規(guī)劃是一個局部的規(guī)劃。 “從上到下 ”是傳統(tǒng)的層次結(jié)構(gòu),層次向上,智能增加,但是精度降低;層次向下則相反??紤]到我們一開始對領(lǐng)域知識缺乏透徹的理解,難以找到有效的評價函數(shù),所以從整體上選擇了從上到下的決策結(jié)構(gòu),也借鑒了從下而上的思路完成對某些動作的評價和選擇,以更好的進入機器人足球仿真比賽領(lǐng)域。 ( 1)自己是本方能最快截球的隊員 這種情況意味著我方尚無其他人控制足球,所以足球處于無人控制狀態(tài)或者足球已被對方隊員所控制。如果自己是所有隊員中最快截球的,那么執(zhí)行相應(yīng)的截球動作即可。當足球靠近我方禁區(qū)附近,就需要先考慮盯人,由于我們采用 433 陣型,有四個后衛(wèi),必要時三個中場也可以回撤,防守人數(shù)將超過對方進攻人數(shù),因此,只要實現(xiàn)人盯人的防守,就可以減少對方的傳接球配合,降低被破門的概率。 對于控球狀態(tài)的隊員,則體現(xiàn)在帶球、傳球、過人、射門等動作的選擇上,對各個動作的選擇采用從上到下結(jié)構(gòu),而每個動作內(nèi)部的參數(shù)調(diào)整則參考從下到上的思路。 4異構(gòu)智能體的選擇和辨識 從仿真平臺版本 7 開始,引入了異構(gòu)智能體的概念,可以根據(jù)球隊的整體策略,配備更能發(fā)揮特長的異構(gòu)智能體。 球 不 可 踢找 球 射 門 傳 球 帶 球進 攻 防 守跑 位 截 球 防 守 跑 位滁州學院本科畢業(yè)設(shè)計 16 的補充,異構(gòu)智能體的選擇建立在角色的基礎(chǔ)上 ,并為規(guī)劃決策模塊中的策略服務(wù)。 RoboCup仿真比賽中的教練程序分成 兩類:離線教練( Trainer)和在線教練( Online Coach)。由于在線教練并不能具體指導隊員的行動,并且在線教練發(fā)出的信息在play_on 模式下有 50 個周期的延遲,避免了由于過度使用在線教練而造成的實際上的集中式控制,所以允許在線教練的存在并不違反智能體個體自治的原則。這樣,在線教練就可以通過統(tǒng)計和對手建模等方法對本方球隊進行全局性的重新規(guī)劃,也可以調(diào)整隊 員的個體動作技術(shù)。因此,在比賽開始前,在線教練根據(jù)球隊的整體策略,賦予不同的角色不同的異構(gòu)類型。 基于第三章 介紹的普通球員的智能體結(jié)構(gòu),在線教練的體系結(jié)構(gòu)以此為基礎(chǔ),感知 口稍作變動,建模模塊維持不變,得到完備的世界模型,包括賽場上足球和所有隊員的準確位置和速度;根據(jù)在線教練的功能調(diào)整規(guī)劃決策模塊、動作模塊;取消反應(yīng)模塊。其中類型 0 是默認類型,對應(yīng)的參數(shù)是固定而且廣為人知的。此表來自對于仿真平臺源代碼的分析,隨機參數(shù)服從均勻分布。本節(jié)首先將異構(gòu)參數(shù)滁州學院本科畢業(yè)設(shè)計 18 提煉出三個指標:奔跑啟動時間、全速 時的體力消耗量、踢球能力;為了能夠?qū)@三個指標進行綜合評價,進行了指標歸一化操作;最后給出了分配算法。異構(gòu)智能體的參數(shù)表中表明球員的最大速度 player_speed_max 是固 定數(shù)值為 ,實際上,并不是所有異構(gòu)類型都能達到 , player_speed_max 只是一個速度的上限。因此,為了讓所有異構(gòu)類型的 player_start_cyc可以相互比較,公式 46 做了特別處理,對最大速度達不到 的異構(gòu)類型,額外增加了啟動周期數(shù)。這兩個參數(shù)共同構(gòu)成了踢球能力指標,在我們 的實現(xiàn)中這個指標僅對前兩個指標起輔助選擇作用。則 m 被歸一化為: ( 48) 對所有的指標
點擊復制文檔內(nèi)容
研究報告相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1