freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

基于神經(jīng)網(wǎng)絡(luò)的人機(jī)對(duì)抗人工智能系統(tǒng)-資料下載頁(yè)

2025-06-27 21:05本頁(yè)面
  

【正文】 個(gè)未露面棋子的整體實(shí)力的大小比較。如果自身棋子的整體 實(shí)力比一個(gè)敵方棋子強(qiáng)大,對(duì)應(yīng)的輸入就為1,否則為0.神經(jīng)元依次把五個(gè)輸入與其對(duì)應(yīng)的權(quán)重(電腦角色對(duì)于每個(gè)敵方角色的實(shí)力預(yù)估)相乘,并求積的總和。如果最終 激勵(lì)值超過(guò)神經(jīng)元的閾值,則去目標(biāo)地點(diǎn)探索承擔(dān)的風(fēng)險(xiǎn)可以接受;否則表示去目標(biāo)地點(diǎn)探索承擔(dān)的風(fēng)險(xiǎn)太大,不 可接受。3)提升棋子實(shí)力功能提升棋子實(shí)力主要通過(guò)兩點(diǎn),技能的(多選一)學(xué)習(xí)和物品的(多選一)購(gòu)買。技能的學(xué)習(xí):技能可以提升棋子的生命力或戰(zhàn)斗力。每個(gè)棋子每一等級(jí)可以學(xué)習(xí)一個(gè)技能(從自身技能庫(kù)中五選一),由于一個(gè)技能不會(huì)同時(shí)提升生命力和戰(zhàn)斗力,因 此需要評(píng)估所有類別的技能的各項(xiàng)數(shù)據(jù),找出學(xué)習(xí)哪一個(gè)技能后,棋子整體實(shí)力提升最明顯。對(duì)于一些棋子的部分技能,存在一些常識(shí)性學(xué)習(xí)規(guī)則,這些規(guī)則是人類角色通過(guò)無(wú)數(shù)次試驗(yàn),得到的常識(shí)。如果一 個(gè)棋子技能學(xué)習(xí)部分存在常識(shí)性學(xué)習(xí)規(guī)則,技能將優(yōu)先按照該規(guī)則以固定的方式學(xué)習(xí)技能。如果一個(gè)棋子沒(méi)有或只有很少常識(shí)性學(xué)習(xí)規(guī)則,那么就需要使用一個(gè)通用技能學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),通過(guò)該網(wǎng)絡(luò)求最優(yōu)解 。由于通用技能學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)需要做到五選一,存在競(jìng)爭(zhēng)關(guān)系,因此需要使用競(jìng)爭(zhēng)網(wǎng)絡(luò)。構(gòu)建一個(gè)只有輸入層和競(jìng)爭(zhēng)層的雙層競(jìng)爭(zhēng)網(wǎng)絡(luò)。輸入層由處理單元構(gòu)成,處理單元的作用是將輸入的,可以完整描述一個(gè)棋子自身實(shí)力的所有數(shù)據(jù),轉(zhuǎn)化為一個(gè)輸 入模式。對(duì)于每一個(gè)棋子,輸入模式是通用的,但因?yàn)槊總€(gè)技能都不相同,所以競(jìng)爭(zhēng)單元也不相同。競(jìng)爭(zhēng)層由五個(gè)競(jìng)爭(zhēng)單元組成。每個(gè)競(jìng)爭(zhēng)神經(jīng)單元都與輸入層的處理單元相連接,如果一個(gè)競(jìng)爭(zhēng)單元輸入的加權(quán)和最 大,則該競(jìng)爭(zhēng)單元對(duì)應(yīng)的技能成為優(yōu)勝者,被棋子學(xué)習(xí)。由于技能的復(fù)雜性,這個(gè)競(jìng)爭(zhēng)網(wǎng)絡(luò)必須由人工監(jiān)督訓(xùn)練。物品的購(gòu)買:物品也可以提升棋子的生命力或戰(zhàn)斗力。物品總量眾多,而且物品的購(gòu)買不受棋子種類限制(就是說(shuō)對(duì)于每一個(gè)棋子,它能購(gòu)買的物品都是相同的)。物品 的購(gòu)買僅僅受限于電腦角色的金錢資源,和棋子所攜帶物品總量(一個(gè)棋子最多可以攜帶6個(gè)物品) 。電腦角色在為棋子購(gòu)買物品時(shí),不可能把每一個(gè)物品都買一遍,因此需要評(píng)估所有類別的物品的各項(xiàng)數(shù)據(jù),找出購(gòu) 買哪一個(gè)物品后,棋子整體實(shí)力提升最明顯。對(duì)于一些棋子的部分物品,也存在一些常識(shí)性購(gòu)買規(guī)則,這些規(guī)則是人類角色通過(guò)無(wú)數(shù)次試驗(yàn),得到的常識(shí)。如果 一個(gè)棋子物品購(gòu)買部分存在常識(shí)性購(gòu)買規(guī)則,物品將優(yōu)先按照該規(guī)則以固定的方式購(gòu)買。如果一個(gè)棋子沒(méi)有或只有很少常識(shí)性學(xué)習(xí)規(guī)則,那么就需要使用一個(gè)通用物品購(gòu)買神經(jīng)網(wǎng)絡(luò),通過(guò)該網(wǎng)絡(luò)求最優(yōu)解 。由于通用物品購(gòu)買神經(jīng)網(wǎng)絡(luò)需要做到多選一,存在競(jìng)爭(zhēng)關(guān)系,因此需要使用競(jìng)爭(zhēng)網(wǎng)絡(luò)。構(gòu)建一個(gè)只有輸入層和競(jìng)爭(zhēng)層的雙層競(jìng)爭(zhēng)網(wǎng)絡(luò)。輸入層由處理單元構(gòu)成,處理單元的作用是將輸入的,可以完整描述一個(gè)棋子自身實(shí)力的所有數(shù)據(jù),轉(zhuǎn)化為一個(gè)輸 入模式。對(duì)于每一個(gè)棋子,輸入模式都通用,競(jìng)爭(zhēng)單元也通用的。無(wú)論棋子是什么種類的,只要它的輸入模式與已 知的符合,就可以購(gòu)買對(duì)應(yīng)的物品。競(jìng)爭(zhēng)層由多個(gè)競(jìng)爭(zhēng)單元組成,數(shù)量取決與物品總數(shù)。每個(gè)競(jìng)爭(zhēng)神經(jīng)單元都與輸入層的處理單元相連接,如果一個(gè)競(jìng) 爭(zhēng)單元輸入的加權(quán)和最大,則該競(jìng)爭(zhēng)單元對(duì)應(yīng)的物品成為優(yōu)勝者,被棋子購(gòu)買。由于物品的復(fù)雜性,這個(gè)競(jìng)爭(zhēng)網(wǎng)絡(luò)必須也由人工監(jiān)督訓(xùn)練。4)實(shí)時(shí)評(píng)估功能發(fā)生遭遇戰(zhàn)時(shí),巡查系統(tǒng)會(huì)對(duì)每個(gè)電腦角色進(jìn)行通告,并為其提供戰(zhàn)況情報(bào)與數(shù)據(jù)。對(duì)敵我雙方臨近戰(zhàn)場(chǎng)棋子整體實(shí)力的評(píng)估,是通過(guò)一個(gè)神經(jīng)元進(jìn)行的。這個(gè)神經(jīng)元構(gòu)造與實(shí)現(xiàn)“探索活動(dòng)區(qū)域”功 能的神經(jīng)元相似,只不過(guò)目的地坐標(biāo)被自動(dòng)設(shè)定為戰(zhàn)場(chǎng)。這個(gè)評(píng)估是告訴一個(gè)電腦角色,加入戰(zhàn)斗有多大風(fēng)險(xiǎn),多大的勝算。電腦角色將評(píng)估結(jié)果于自身的性格值結(jié)合,最 后決定是否加入戰(zhàn)斗。電腦角色謀略的使用,是靠一個(gè)競(jìng)爭(zhēng)網(wǎng)絡(luò)實(shí)現(xiàn)的。這個(gè)競(jìng)爭(zhēng)網(wǎng)絡(luò)的處理單元,將戰(zhàn)場(chǎng)的地形、坐標(biāo)、范圍,以及參與戰(zhàn)斗的敵我雙方的棋子整體實(shí)力等詳細(xì)數(shù)據(jù),轉(zhuǎn) 化成一個(gè)輸入模式。對(duì)于每一個(gè)棋子,輸入模式都通用,競(jìng)爭(zhēng)單元也通用。無(wú)論棋子是什么種類的,只要它的輸入 模式與已知的符合,控制它的電腦角色就會(huì)做出相應(yīng)的一系列動(dòng)作(即實(shí)施謀略)。競(jìng)爭(zhēng)層有多個(gè)競(jìng)爭(zhēng)單元組成,數(shù)量取決與一個(gè)角色可以做出的謀略或配合的總數(shù)。對(duì)于電腦角色,它們一開始并不 了解,也不能識(shí)別不同輸入模式對(duì)應(yīng)的行為的意義。所以這個(gè)競(jìng)爭(zhēng)網(wǎng)絡(luò)必須由監(jiān)督人工訓(xùn)練,由人告訴電腦角色, 什么樣的行為是迂回、是誘敵深入或埋伏落單敵方棋子等,以及什么樣的輸入模式對(duì)應(yīng)什么樣的行為 ,等等。第五章 總結(jié)上述全部?jī)?nèi)容就是一個(gè)DOTA人工智能系統(tǒng)的構(gòu)建理論和實(shí)現(xiàn)思路。理論的核心內(nèi)容是通過(guò)三大系統(tǒng),即巡查系統(tǒng)、控制系統(tǒng)和命令中心,來(lái)實(shí)現(xiàn)一個(gè)人工智能的完整功 能。1)巡查系統(tǒng)就像是個(gè)裁判,它為電腦角色提供知覺(jué)能力,同時(shí)每時(shí)每刻監(jiān)督電腦角色的行為,如果發(fā)現(xiàn)電腦角色 違規(guī),就會(huì)警告該角色并責(zé)令改正。2)控制系統(tǒng)是一個(gè)帶有反饋環(huán)節(jié)的控制手段,它為電腦角色提供對(duì)棋子的絕對(duì)控制權(quán)力,使電腦角色能夠有效地 將思維通過(guò)棋子的行為表現(xiàn)出來(lái)。3)命令中心類似于人類的大腦,它為電腦角色提供思維能力,電腦角色通過(guò)這個(gè)系統(tǒng)產(chǎn)生意識(shí),會(huì)對(duì)感知環(huán)境, 并對(duì)對(duì)各種復(fù)雜狀況做出反應(yīng)。整個(gè)人工智能實(shí)際制作起來(lái)的難點(diǎn),一是理論的建立,二是算法的設(shè)計(jì),而算法的設(shè)計(jì)又依賴于現(xiàn)有 數(shù)據(jù)的輸入。理論為實(shí)際算法和程序代碼提供思路,反過(guò)來(lái)實(shí)際算法和程序代碼會(huì)通過(guò)自身的設(shè)計(jì)、執(zhí)行來(lái)支持理 論的正確性。編寫一個(gè)DOTA人工智能系統(tǒng)雖然是非常費(fèi)時(shí)的工作,但它由于使用了人工神經(jīng)網(wǎng)絡(luò)系統(tǒng),因此不論是功能方面 、排錯(cuò)維護(hù)方面,還是算法復(fù)雜度、實(shí)際代碼所需量,都比完全工程學(xué)方法編寫的人工智能系統(tǒng)強(qiáng)大 。目前,整個(gè)DOTA AI的程序代碼已經(jīng)實(shí)現(xiàn)了第一大系統(tǒng)巡查系統(tǒng)的“信號(hào)轉(zhuǎn)化”功能,和第二大系統(tǒng)控制系統(tǒng)的全部功能“指令的 發(fā)布/響應(yīng)與執(zhí)行結(jié)果反饋”。所有系統(tǒng)中,以第三大系統(tǒng)命令中心“實(shí)施評(píng)估”功能最為重要??梢哉f(shuō)一切其他的智能,都建立在電腦角色正確 識(shí)別當(dāng)前環(huán)境、當(dāng)前棋子實(shí)力等數(shù)據(jù)的基礎(chǔ)上。要完整、精確地實(shí)現(xiàn)第第三大系統(tǒng)的功能,需要以各種數(shù)據(jù)錄入完畢、各個(gè)算法設(shè)計(jì)完畢、所有神經(jīng)網(wǎng)絡(luò)正確訓(xùn)練 完畢為前提。目前整個(gè)DOTA AI的制作正在進(jìn)行的階段,就是數(shù)據(jù)的錄入。只有將所有必要的數(shù)據(jù)錄入完畢后,所有依賴于數(shù)據(jù)完整的后續(xù)功 能(算法設(shè)計(jì)、神經(jīng)網(wǎng)絡(luò)訓(xùn)練)才有實(shí)現(xiàn)的可能。總體來(lái)說(shuō),新版人工智能系統(tǒng)編程已經(jīng)完成了40%,進(jìn)度快速增長(zhǎng)中。這個(gè)全新的,與舊版有著本質(zhì)不同的人工 智能,預(yù)計(jì)完成時(shí)間——2009年年底。參考文獻(xiàn)[1]Mat Buckland[美].游戲編程中的人工智能技術(shù)(AI Techniques for Game Programming).清華大學(xué)出版社. [2]JASS使用教程附錄目前整個(gè)系統(tǒng)已完成控制系統(tǒng),和巡查系統(tǒng)部分功能。已經(jīng)完成的DOTA AI代碼如下(JASS語(yǔ)言,以DOTA ):
點(diǎn)擊復(fù)制文檔內(nèi)容
職業(yè)教育相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1