freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

納什均衡的擴(kuò)展與精煉四川大學(xué)-展示頁(yè)

2024-12-17 11:39本頁(yè)面
  

【正文】 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 25有限重復(fù)博弈 ? 假設(shè)廠商違背策略,只能在第一階段違背,因?yàn)榈诙A段采用的是 納什均衡策略 。 ? 假設(shè)博弈只進(jìn)行一次,則有 兩個(gè)純策略納什均衡 (中價(jià),中價(jià))和(低價(jià),低價(jià)),對(duì)應(yīng)的均衡結(jié)果 分別是( 3, 3)和( 1, 1) 1, 2i ?iS?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 24假設(shè)博弈進(jìn)行 兩次 ,貼現(xiàn)率為 ?,則出現(xiàn)這樣的策略組合: ? 廠商 1:第一階段選取高價(jià);若第一階段博弈結(jié)果是( 5, 5),第二階段采取中價(jià),否則采取低價(jià)。 ? 在例 ,若 5位船主的協(xié)調(diào)策略選擇 ,可以計(jì)算出 這樣降低了對(duì)合作的限制,增加了合作的可能性。 ? 越小,對(duì)合作的限制就越小,即合作的可能性就越大。 ? 現(xiàn)在將( )式表示的支付函數(shù)為 5人非合作博弈記為 G,并將 G作為原博弈進(jìn)行 無(wú)限次重復(fù)博弈 ,將 ( , )作為 觸發(fā)策略組合 ,由( )式有 無(wú)限重復(fù)博弈 90s? ?( ) 81 00 , 1 , 2 , 3 , 4 , 5iu s i? ??i90s? ?45is ? ( ) 14 58 0i s? ? ?s? cs9 0 .6 4 314?? ??*2( ) m a x ( ) m a x ( 1 8 0 5 3 6 0 )iii i i i i i isss u s s s s s? ? ?? ? ? ?,( ) 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 22? 因此,當(dāng) 時(shí) , 觸發(fā)策略組合 ( , )是 子博弈完美納什均衡 。 is 1, 2 , 3 , 4 , 5i ?521( ) ( ) 1 8 0 6i i i i i i i jju s D s s s s s s?? ? ? ? ? ?1 , 2 , 3 , 4 , 5i ?51( ) 1 8 0 6i i jjD s s s?? ? ? ?() 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 20 無(wú)限重復(fù)博弈 ? 令 ,并由博弈方收益對(duì)稱性,不難得出,有唯一的 純策略納什均衡和均衡結(jié)果 : ? 若 5條游船達(dá)成合作,統(tǒng)一定價(jià)為 , 此時(shí)行動(dòng)組合為 則共同的收益為 0iius? ??( 30 , 30 , 30 , 30 , 30)cs ? ( ) 4500cius ? 1, 2 , 3 , 4 , 5i ?5 21( ) 5 ( 1 8 0 )iiu s s s? ? ??? ? ??( , , , , )s s s s s s? ? ? ? ? ??s?( ) 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 21? 由( )式, 最優(yōu)統(tǒng)一定價(jià) 為 ,代回到( )式,則每位船主 收益 為 。船主對(duì)自己游船定價(jià)為每小時(shí) 元, 。若對(duì)于貼現(xiàn)率有:對(duì)任意 有 () 則觸發(fā)策略組合是無(wú)限重復(fù)博弈 G的 子博弈完美納什均衡。 若每個(gè)局中人都采用觸發(fā)策略,稱為一個(gè) 觸發(fā)策略組合 , 記為 ( , ) [ , { }, { }]iiG N S P? 12( , , , )c c c s s s s?12( , , , )ns s s s? ? ? ??( ) ( )ciiP s P s? ?iisS? ? is?\ { }j N i?js?s? csiN?cisii《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 17 無(wú)限重復(fù)博弈 定義 最好反應(yīng)支付 在原博弈 中,對(duì)給定的策略組合 ,記 () 稱 為局中人 對(duì)策略組合 的 最好反應(yīng)支付 。局中人 的策略為: ( 1)第一階段選擇 ,以后也一直選擇行動(dòng) ; ( 2)若第 t 階段博弈前有任意其它局中人 選擇不是 ,則它將選擇 ,并一直進(jìn)行到最后。這種行為組合序列有兩個(gè)特征: ( 1)這是一個(gè)“胡蘿卜加大棒”的策略組合,遵守了有胡蘿卜吃,違背了將受到“大棒”的懲罰; ( 2)這是可信的威脅(由貼現(xiàn)因子的大小決定),以至于沒有局中人愿意單獨(dú)地違背,這就遵循了納什均衡的原則。 例 價(jià)格戰(zhàn)重復(fù)博弈(續(xù)) 1/3? ?1/3??1/3??《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 14167。由于時(shí)期 t是任意的,因此這個(gè)策略組合也是一個(gè) 子博弈完美納什均衡。 ? 在這種情況下,我們分析局中人是否愿意 單獨(dú)地違背 自己的策略。 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 11? 在閉環(huán)策略情況下,局中人 1可選擇的策略:先選擇“不降價(jià)”行為,但當(dāng)他發(fā)現(xiàn)對(duì)方采取的是“降價(jià)”行為后,他立即在下一期也選擇“降價(jià)”行為,并永不改變。 {1, 2}N ?1 1 2 2 1 2{ , }, { , }S a a S b b??1 1 1 2 1 2[ , ] [ , ]S S a a a a? ? ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 10例 價(jià)格戰(zhàn)重復(fù)博弈 某城區(qū)有兩個(gè)商店出售同一商品,他們之間進(jìn)行價(jià)格戰(zhàn),原博弈的情況見下表 若博弈只進(jìn)行一次,有 唯一的納什均衡 (降價(jià),降價(jià)),其均衡結(jié)果為( 2, 2)。 iSit isS?i?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 9 開環(huán)策略集和閉環(huán)策略集 關(guān)于開、閉環(huán)策略集的例子 設(shè)原博弈中, 若 T=2,則局中人 1的開環(huán)策略集為 , 一共有 4個(gè)純策略。 顯然,對(duì) T次重復(fù)博弈,局中人 的開環(huán)策略集為 iSit isS?1TiitS??? ?ii《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 8 開環(huán)策略集和閉環(huán)策略集 閉環(huán)策略集 若局中人在 t 階段進(jìn)行行動(dòng)決策時(shí),他知道該階段前其它局中人的行動(dòng)選擇,再在自己的原博弈行動(dòng)集 中選擇一個(gè)行動(dòng) ,這時(shí)他的策略稱為 閉環(huán)策略 ,全部閉環(huán)策略稱為 閉環(huán)策略集 。 ? 該定理的證明比較簡(jiǎn)單,只需驗(yàn)證它符合定義 定的子博弈完美納什均衡的條件就可以了。 ? 當(dāng) T是有限時(shí)稱 有限 重復(fù)博弈,當(dāng) T是無(wú)限時(shí),稱為 無(wú)限重復(fù)博弈。 重復(fù)博弈的應(yīng)用 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 4167。 基本概念 167。 不完全信息的動(dòng)態(tài)博弈 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 3 167。 完全且完美信息動(dòng)態(tài)博弈 167。202233 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 博弈論及其應(yīng)用 第 3章 納什均衡的擴(kuò)展與精煉 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 2 第 3章 納什均衡的擴(kuò)展與精煉 ? 主要內(nèi)容: 167。 不完全信息的靜態(tài)博弈 167。 重復(fù)博弈 167。 重復(fù)博弈 167。 觸發(fā)策略 167。 基本概念 ※ 重復(fù)博弈 ※ 定理 一種子博弈完美納什均衡的求解方法 ※ 開環(huán)策略集和閉環(huán)策略集 ※ 例 價(jià)格重復(fù)博弈 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 5 定義 重復(fù)博弈 ? 設(shè) G是一個(gè)基本博弈( G可以是靜態(tài)博弈,也可以是動(dòng)態(tài)博弈),重復(fù)進(jìn)行 T次, T可以是有限的,也可以是無(wú)限的,這樣的博弈稱為 重復(fù)博弈, 并記為 G( T) ? G稱為 G( T)的一個(gè) 原博弈, 每次原博弈稱為一個(gè) 階段博弈。 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 6定理 一種子博弈完美 納什均衡的求解方法 ? 定理 :如果階段博弈 G有納什均衡,對(duì)任意有限或無(wú)限階段的 T,重復(fù)博弈 G( T) 有子博弈完美納什均衡 :即在 每一階段重復(fù)采用階段博弈 G的納什均衡。 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 7 開環(huán)策略集和閉環(huán)策略集 開環(huán)策略集 若局中人 在 t 階段進(jìn)行行動(dòng)決策時(shí),不知道該階段前其它局中人的行為選擇,而又要在自己的原博弈行動(dòng)集 中選擇一個(gè)行動(dòng) , 這時(shí)他的策略稱為 開環(huán)策略 ,全部開環(huán)策略稱為 開環(huán)策略集 。閉環(huán)策略集記為 這里閉環(huán)是指有 t1個(gè)前期的信息反饋。 類似地局中人 2也只有 4個(gè)純策略 圖右是局中人 1在 G( T)中的閉環(huán)策略集有 8個(gè)策略 。若博弈進(jìn)行 無(wú)窮多次 ,則情況發(fā)生變化。而局中人 2也可以選擇與局中人 1同樣的策略。 例 價(jià)格戰(zhàn)重復(fù)博弈(續(xù)) 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 12? 若局中人 1不改變 策略行為,他的總收益為: ? 當(dāng)局中人 1在第 t期 改變 策略,其總收益為: ? ( ) 例 價(jià)格戰(zhàn)重復(fù)博弈(續(xù)) 2 1 11 4 4 4 5 2 2t t t t? ? ? ? ? ?? ? ?? ? ? ? ? ? ? ? ?11???? 4 4 5 211????? ? ? ? ??? 13? ?2144 4 41? ? ? ?? ? ? ? ? ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 13結(jié)論: ? 當(dāng)貼現(xiàn)率 時(shí),局中人 1不愿單獨(dú)改變自己的策略; ? 當(dāng)貼現(xiàn)率 時(shí),局中人 2也不愿單獨(dú)改變自己的策略; ? 因此,當(dāng) 時(shí),上述策略組成的策略組合是一個(gè)均衡點(diǎn)。 ? 從該例中可以看出,在閉環(huán)策略下進(jìn)行策略選擇,每個(gè)階段的收益都會(huì)達(dá)到( 4, 4),但( 4, 4)并不是原博弈的納什均衡結(jié)果 。 觸發(fā)策略 ※ 無(wú)限重復(fù)博弈 ※ 有限重復(fù)博弈 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 15無(wú)限重復(fù)博弈 例 的啟示 ? 從例 ,若原博弈有某種行為組合 ,使得其納什均衡點(diǎn)對(duì)每一個(gè)局中人 都有 ,將會(huì)產(chǎn)生一種將行為組合 和納什均衡 相結(jié)合的行為組合序列。 s?i ( ) ( )ciiP s P s? ?s?cs《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 16無(wú)限重復(fù)博弈 定義 觸發(fā)策略 在重復(fù)博弈 G( T)中,原博弈為 , 是原博弈的納什均衡點(diǎn),
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1