【正文】
, 一般這是也就是關(guān)鍵的時(shí)候 , 如已經(jīng)攻入了對(duì)方禁區(qū) , 或進(jìn)行戰(zhàn)術(shù)配合的時(shí)候 , 這時(shí) Agent就不在考慮在進(jìn)行高層的決策直接采用反應(yīng)式的方式 , 如進(jìn)入禁區(qū)面對(duì)守門員形成單刀 , 這是只有一個(gè)動(dòng)作選擇 , 那就是射門 。 如我們已經(jīng)攻入對(duì)方禁區(qū)或?qū)κ止ト胛曳降慕麉^(qū)采取緊急動(dòng)作。 RoboCup球隊(duì)策略綜述 ? 此外,球隊(duì)的整體策略還應(yīng)該考慮其他一些因素。 ? (3).對(duì)于每種類型的球員(后衛(wèi),中場(chǎng),前鋒等)球隊(duì)策略應(yīng)該根據(jù)它的角色確定分配給他哪些相應(yīng)的行為。 ? 一般進(jìn)攻體系的設(shè)計(jì),主要包含進(jìn)攻隊(duì)員的動(dòng)作選擇,一般隊(duì)員的協(xié)同以及跑位。 當(dāng) Agent間的意愿一致的時(shí)候他們就會(huì)進(jìn)行協(xié)作 , 當(dāng)他們的意愿不一致的時(shí)候 , 就要進(jìn)行協(xié)商 , 處理矛盾 。 比如在特定 的策略下 , 一個(gè)球員在對(duì)自己的動(dòng)作進(jìn)行選擇的時(shí)候應(yīng)該考慮到位置和位置所在的區(qū)域 , 同時(shí)還要考慮隊(duì)友和對(duì)手的位置 。 ? (2).對(duì)方球隊(duì)的整體傾向。 ? 在設(shè)計(jì)的時(shí)候應(yīng)盡量考慮到上面的情況。 這時(shí)使用的也是 SBSP。 球員涉及的動(dòng)作主要有: ? HoldBall( ):持球 , 持球保持靜止并盡可能遠(yuǎn)離對(duì)手 。 ? 狀態(tài)評(píng)價(jià)函數(shù) ? 這里 γ 是學(xué)習(xí)率,一個(gè)固定的參數(shù), T是從 s開(kāi)始的時(shí)間段內(nèi)經(jīng)過(guò)了 T個(gè)時(shí)間步。 ? counter=1。 counter=0。這也是我們以后的研究方向。如何恰當(dāng)?shù)剡x擇合適的動(dòng)作是比較重要的問(wèn)題。 對(duì)策論 ? Robocup中對(duì)策論的方法實(shí)際上解決的就是在對(duì)抗條件下 (在考慮多方面 影響因素 )怎么使自己 (本方球隊(duì) )的利益最大化。 在真實(shí)的足球比賽中 , 隊(duì)員之間的屬性是不同的 。 (4)對(duì)手模型。 ? Intercept(截球 ) ? 其它 ? [注 ]:盯人的目的是防止被盯的對(duì)手接到傳球; Block的目的是阻礙對(duì)方控球隊(duì)員帶球前進(jìn);跑本位點(diǎn)是指球員站在本位點(diǎn)處防守,即進(jìn)行區(qū)域防守。 即針對(duì)同一名對(duì)方隊(duì)員防守隊(duì)員的動(dòng)作是互斥的 。 如果是對(duì)方控球或者無(wú)人控球但對(duì)方會(huì)先得球 , 我方隊(duì)員就采取防守策略 , 并預(yù)測(cè)球下一次被控制的位置 。守門員的防守在 Robocup中的影響也很大??梢猿浞值睦眠@ 25個(gè)周期進(jìn)行開(kāi)球的判斷。 防守體系的設(shè)計(jì)思路: ? 引入防守時(shí)的核心球員(如中衛(wèi)) ? 考慮守門員的防守體系 ? 如何考慮防守動(dòng)作的合理分配。否則,將球直接開(kāi)到中場(chǎng)位置的邊線附近。 守門員的一般決策過(guò)程: ? (1)判斷比賽是否開(kāi)始;如果沒(méi)有則調(diào)整站位 , 否則轉(zhuǎn) (2) ? (2)判斷球的位置是否不可信 , 如果不可信則搜索球的位置 , 否則轉(zhuǎn) (3) ? (3)判斷是不是我方開(kāi)球 , 是則尋找好的開(kāi)球點(diǎn) , 然后開(kāi)球 。 根據(jù)世界模型和內(nèi)部狀態(tài) , 判斷有進(jìn)攻威脅的對(duì)方球員并確定防守任務(wù)和確定可用來(lái)防守的我方球員 。首先對(duì)所有的進(jìn)攻 防守隊(duì)員配對(duì)以及防守隊(duì)員 本位點(diǎn)配對(duì)生成防守動(dòng)作。威脅程度大致可以用被防守的對(duì)手離球門的遠(yuǎn)近來(lái)衡量,離球門越近,威脅程度越大。 ? 注:清華采用把隊(duì)員的跑位點(diǎn)通過(guò)神經(jīng)網(wǎng)絡(luò)做成關(guān)于球的位置和本身球員號(hào)碼的一個(gè)函數(shù) P(B,i). 體系 ? 防守是從本方失球以后就開(kāi)始的,一直到本方球員重新獲得控球權(quán)。 Attackness區(qū)分隊(duì)員的任務(wù)偏重于進(jìn)攻的程度 。 m a x ( | 1 , 2 , ..., ) ( )a ac t i ons e tP a c ond c ond c ond n U a? ?影響因素: (1)戰(zhàn)術(shù) 。 ? 基于效用的對(duì)策論是 MAS協(xié)作是的一種常用的方法 。 ? 戰(zhàn)術(shù)觸發(fā)條件 ? 戰(zhàn)術(shù)的實(shí)施過(guò)程 ? 戰(zhàn)術(shù)的終止條件 ? ………… 戰(zhàn)術(shù)的設(shè)計(jì)主要涉及到 2個(gè)方面: ? 戰(zhàn)術(shù)本身的設(shè)計(jì) ? 通訊協(xié)議 ? 持球隊(duì)員(進(jìn)攻的核心球員)的動(dòng)作選擇設(shè)計(jì)。 11= + Ma x ( Ac ti o nVa lu e( ) ) Ac ti o nVa lu e ( )c ount e r c ount e rT dErr or ra, c urr e nt , st at e , v ari abl e s L ast Ac ti on, L ast Vari abl e s?? ???注意事項(xiàng): ? 為了鼓