freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

共同進(jìn)化博弈-文庫(kù)吧

2025-08-26 13:53 本頁面


【正文】 到效果,因?yàn)檫@可能影響到 A或 B的聲譽(yù)。 博弈的結(jié)構(gòu) 承諾或者威脅能在多人博弈中起到作用的支付矩陣滿足的條件: 1個(gè)子博弈完美納什均衡 2個(gè)威脅 1個(gè)子博弈完美納什均衡 4個(gè)承諾 交流目標(biāo): B希望 A選擇相反策略 b3 b1 b4 b1 交流需要: B承諾的行動(dòng)并不能使得它得到較高的支付 b1 b2 b3 b4 交流影響 : A最好選擇與 B承諾的相反選擇如果他相信 B a1 a3 a2 a4 a1 a3 演化規(guī)則和過程 為了研究這個(gè)博弈,我們的想法是考慮一個(gè)空間博弈,這個(gè)博弈建立在方格上,右圖是這個(gè)一部分博弈空間的示意: A B A B B A B A A B A B B A B A 演化規(guī)則和過程 在每一輪博弈,博弈者以 1/4的概率挑選一個(gè)鄰居(諾依曼鄰居)博弈一次。當(dāng)所有的博弈者都進(jìn)行完一次博弈后,他們將在這一輪獲得一個(gè)支付。連同之前的支付,將有一個(gè)支付總值。在學(xué)習(xí)的過程中,他們總可以以如下方式繼承四角的同類博弈者的策略: 這里以 A為例,記周圍同類鄰居為 Ai( i=1, 2, 3,4),在這一輪過后 Ai的支付總值為 Fi, Pi為繼承該博弈者周圍同類鄰居 Ai的概率,則: ??? 41kkiiFFP演化規(guī)則和過程 什么是策略? 策略是一個(gè)有限狀態(tài)機(jī),狀態(tài)欄表示博弈的對(duì)手在過去 M個(gè)記憶深度的下的行為,即守信程度或者相信程度,策略欄表示自己在這一次所做的行為,如果是 A型,就是相信或者不相信,如果是 B型,就是守信或者不守信。 演化規(guī)則和過程 A的一個(gè)可能的有限狀態(tài)機(jī)如右圖。守信程度欄中表示 B的守信歷史, 0代表守信, 1代表不守信;在策略欄中是 A的策略, 0代表相信, 1代表不相信。記憶深度m=3。 守信程度 策略 000 1 001 1 010 0 011 1 100 0 101 0 110 1 111 0 演化規(guī)則和過程 B的可能的一個(gè)有限狀態(tài)機(jī)表如右圖,其中狀態(tài)欄的第一列表示 A在本輪是否相信,如果相信則為 0,不相信則為 1;第二列表示在記憶深度 m=3時(shí) A的相信狀況,編碼規(guī)則同上;策略欄中是 B的相應(yīng)的策略, 0表示守信,1表示不守信。 狀態(tài) 策略 0 000 1 0 001 1 0 010 0 0 011 1 0 100 0 0 101 0 0 110 1 0 111 0 1 000 1 1 001 1 1 010 0 1 011 1 1 100 0 1 101 0 1 110 0 1 111 1 演化規(guī)則和過程 注意到這樣一個(gè)博弈中,相信與守信恰好能夠與左或者右進(jìn)行一一映射,于是這種博弈結(jié)構(gòu)能夠推廣到更加一般的情形。這個(gè)映射如
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1