freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

納什均衡的擴(kuò)展與精煉四川大學(xué)(參考版)

2024-12-11 11:39本頁面
  

【正文】 例題 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 90? 在該信號(hào)博弈中,自然賦予每個(gè)類型的可能性是相同的,接收者在收到 L信號(hào)后的信息集 有兩個(gè)結(jié)點(diǎn),設(shè)接收者的信念分別為 ,在圖中用 [ ]標(biāo)記;在收到 R信號(hào)后的信息集 。對(duì)應(yīng)接收者也有 4個(gè)純策略,( u,u),( u, d),( u, d),( d, d)。因此,發(fā)送者有4個(gè)純策略( L, L),( L, R),( R, L),( R, R)。 如果 發(fā)送者 的策略是混同或分離的,我們稱均衡分別為混同均衡和分離均衡。亦即 為下式的解 ? 要求 3 對(duì)信號(hào)集 M中的每一 ,如果在類型集 T中存在 ,則接收者對(duì)應(yīng)于 的信息集 中所持有的信念必須取決于貝葉斯法則和發(fā)送者的戰(zhàn)略: )( jma? ()imt?))(,(m a xa rg)( jjismimamtUtmj?? ?jmjm()jhmji mtm ?? )(( | ) ( )( | )()j i iijjp m t p ttmpm???1( ) ( | ) ( )mj j i iip m p m t p t????()imt?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 87 信號(hào)博弈的精煉貝葉斯均衡要求 ? 要求 4 對(duì)處于均衡路徑之外的信息集,信念由貝葉斯法則及可能情況下局中人的均衡策略組合決定。 11( , )aa12( , )aa 21( , )aajm12aa和22( , )aa《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 85信號(hào)博弈的精煉貝葉斯均衡要求 ? 要求 1 當(dāng)接收者在觀測(cè)到 M中的任何信號(hào) 之后,依據(jù)對(duì)哪些類型可能發(fā)送信號(hào) 有一個(gè)信念概率表示 且 , ? 要求 2R 對(duì)接收者,他對(duì)每一個(gè)信號(hào) ,依據(jù)對(duì)哪些類型可能發(fā)送信號(hào) 的信念概率 的條件下,選擇行動(dòng) ,并使自己效用最大化。當(dāng)接收者在觀察到某一信息 后,隨機(jī)地選擇 ,也有相對(duì)應(yīng)的混合策略,同樣,我們也將此稱為接收者的 雜合策略 。 12mm和21( , )mm12( , )mm11( , )mm 22( , )mm《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 83信號(hào)博弈的接收者純策略 1. :如果收到發(fā)送者信號(hào) ,選擇 ; 如果收到發(fā)送者信號(hào) ,選擇 ; 2. :如果收到發(fā)送者信號(hào) ,選擇 ; 如果收到發(fā)送者信號(hào) ,選擇 ; 3. :如果收到發(fā)送者信號(hào) ,選擇 ; 如果收到發(fā)送者信號(hào) ,選擇 ; 4. :如果收到發(fā)送者信號(hào) ,選擇 ; 如果收到發(fā)送者信號(hào) ,選擇 。 當(dāng)發(fā)送者在同一類型下,隨機(jī)地選擇 ,也有相對(duì)應(yīng)的混合策略 ,對(duì)此,我們稱為 雜合策略 。 },{, 1 Ii ttTTt ???()ipt0)( ?itp( ) 1ii pt ??it },{ 1 JmmM ??jmjm },{ 1 KaaA ??ka),( kjis amtu ( , , )r i j ku t m ait《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 81信號(hào)博弈的發(fā)送者純策略 1. :如果自然賦予類型 ,選擇信號(hào) ; 如果自然賦予類型 ,選擇信號(hào) ; 2. :如果自然賦予類型 ,選擇信號(hào) ; 如果自然賦予類型 ,選擇信號(hào) ; 3. :如果自然賦予類型 ,選擇信號(hào) ; 如果自然賦予類型 ,選擇信號(hào) ; 4. :如果自然賦予類型 ,選擇信號(hào) ; 如果自然賦予類型 ,選擇信號(hào) 。 3.接收者 r觀測(cè)到 ,然后從可行的行動(dòng)集 中選擇一個(gè)行動(dòng) 。對(duì)發(fā)送者類型的先驗(yàn)信念 是共同知識(shí),且 , 。 信號(hào)博弈 ※ 信號(hào)博弈的時(shí)間順序 ※ 信號(hào)博弈的發(fā)送者純策略 ※ 信號(hào)博弈的接收者純策略 ※ 信號(hào)博弈的精煉貝葉斯均衡要求 ※ 精煉貝葉斯均衡定義 ※ 例題 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 80 信號(hào)博弈的時(shí)間順序 1.自然賦予發(fā)送者某種類型 是發(fā)送者的類型空間。 ? 在不完全信息動(dòng)態(tài)博弈中,若局中人在某一中類型有多個(gè)行動(dòng),并在同一信息集中,則先驗(yàn)判斷概率直接用于對(duì)信息集中所處結(jié)點(diǎn)的后續(xù)結(jié)果和可能的均衡,進(jìn)行各節(jié)點(diǎn)出現(xiàn)信息的概率判斷,如例 。 ? 因此,精煉貝葉斯均衡是一個(gè)對(duì)應(yīng)的不動(dòng)點(diǎn) : ( ) 12( , , )np p p p? ? ? ?? ))(,),(()( 11 nnsss ??? ??? ? ?))(,),(()( 11 nnsss ??? ??? ? ?( , )sp??( ( ) ) 。如果 不是均衡策略下的行動(dòng),則是前面敘述中要求 4所提及的“不在均衡路徑上”,那么對(duì)任意 都是允許的,但它必須與均衡策略組合相容。它表明在其它局中人策略 和局中人 的后驗(yàn)信念 給定以后,局中人 的戰(zhàn)略從信息集 開始以后的后續(xù)博弈上都是最優(yōu)的,因此,在信息集 開始的后續(xù)博弈中構(gòu)成了貝葉斯均衡。 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 73精煉貝葉斯納什均衡正式定義 符號(hào)規(guī)定 1 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 74精煉貝葉斯納什均衡正式定義 符號(hào)規(guī)定 2 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 75定義 在不完全信息動(dòng)態(tài)博弈中,精煉貝葉斯均衡是 一個(gè)策略組合 和 一 個(gè)后驗(yàn)概率組合 它們滿足: ( 1)對(duì)每一個(gè)局中人 和每個(gè)信息集有 ( ) ( 2) 是使用貝葉斯法則從先驗(yàn)信念 ,觀測(cè)到的 和最優(yōu)戰(zhàn)略 得到的(在可能的情況下)。 ? 該博弈滿足要求 1到要求 4的精練貝葉斯納什均衡為 (D,L,R’) 1p?0p?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 72精煉貝葉斯納什均衡的四個(gè)要求( 4) ? 綜合上面要求 1到 4,在完全但不完美信息動(dòng)態(tài)博弈中,精練貝葉斯均衡要求不只是一個(gè)簡(jiǎn)單的均衡策略組合,而且還要求相對(duì)應(yīng)的每個(gè)信息集中決策結(jié)點(diǎn)的信度推斷??疾榧{什均衡( A,L,L’ )和局中人 3的推斷 ,這個(gè)納什均衡也滿足要求 1和要求 2,但它不是子博弈納什均衡。這一組策略組合和局中人 3的推斷 滿足了 ,要求 1到 3,也滿足了要求 4。 見例 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 70精煉貝葉斯納什均衡的四個(gè)要求( 4) 例 考慮下面的三人博弈,其擴(kuò)展式表示及規(guī)范式表示如下: 2,0,0 2,0,0 3,3,3 0,1,1 2,0,0 2,0,0 1,2,1 0,1,2 1 2 2 3 A D R L R L 圖 三人博弈擴(kuò)展式 表 三人博弈規(guī)范式 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 71精煉貝葉斯納什均衡的四個(gè)要求( 4) ? 該博弈有一個(gè)子博弈:它始于局中人 2 的單點(diǎn)信集。 這時(shí) 。右邊決策結(jié)點(diǎn)是在( R,B)均衡路徑上;因此,局中人 2對(duì)右邊決策結(jié)點(diǎn)的 置信推斷 必然是 ,即 。反之,我們稱之為處于均衡路徑之外的信息集。 2 (1 ) 1 1p p p? ? ? ? ? ?1 pp??p1 ( 1 ) 0p p p? ? ? ? ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 66精煉貝葉斯納什均衡的四個(gè)要求( 3) 要求 3 在 處于均衡路徑上 的信息集,其 推斷 由貝葉斯法則及局中人的均衡戰(zhàn)略 給出 。 1pp?和 [0,1]p ?精煉貝葉斯納什均衡的四個(gè)要求( 2) 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 65精煉貝葉斯納什均衡的四個(gè)要求( 2) ? 按照 2的要求,給定局中人 2的推斷, 局中人 2選擇 A的數(shù)學(xué)期望為: 局中人 2選擇 B的數(shù)學(xué)期望為: 由于對(duì)任意 都有 ,因此局中人 2必定選 B,因而排除了 A。 ? 按照 1的要求,若博弈進(jìn)行到局中人 2行動(dòng)時(shí),它的兩個(gè)決策結(jié)點(diǎn)是在同一個(gè)信息集中。因此( L,A)和( R,B)都是子博弈完美納什均衡。 其博弈的過程和結(jié)果用 擴(kuò)展式表示為 用規(guī)范式表示為 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 64? 從博弈規(guī)范式可以得到,該博弈有兩個(gè)純策略納什均衡( L,A)和( R,B)。后續(xù)博弈策略是指,后續(xù)博弈的每一種情況的完全的行動(dòng)計(jì)劃。即每一個(gè)局中人對(duì)于給定的信息集上的信息推斷以及 后續(xù)博弈的策略都必須是 最優(yōu) 反應(yīng)。 2a1a 1 6p ?2b1b 2k?2 8p ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 60 博弈過程和兩階段兩人的總收入圖 精煉貝葉斯納什均衡的四個(gè)要求( 1) 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 61? 由上圖可知局中人 2必須要有一個(gè)對(duì)所在結(jié)點(diǎn)的置信度。 局中人 1在第一階段有收入,第二階段也有收入,而局中人 2只在第二階段有收入。 博弈的第二階段是局中人 2在知道局中人 1的定價(jià)后,決定是否進(jìn)入。 精煉貝葉斯納什均衡的四個(gè)要求( 1) 1t 2t1( ) 0. 3pt ?2( ) ?21cc?2c《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 59精煉貝葉斯納什均衡的四個(gè)要求( 1) 博弈進(jìn)行的第一階段是生產(chǎn)廠商對(duì)產(chǎn)品定價(jià)。 局中人 2為進(jìn)入廠商,他不知道局中人 1的具體類型,只有一個(gè)共同知識(shí),即類型方面的概率分布: 和 。新廠商對(duì)該廠生產(chǎn)成本的高低具有一個(gè)共同知識(shí)的概率分布,但當(dāng)他看到產(chǎn)品的定價(jià)以后,將對(duì)生產(chǎn)廠商的類型分布給出一個(gè)新的修訂評(píng)價(jià),以決定它是進(jìn)入該種產(chǎn)品生產(chǎn)還是不進(jìn)入該種產(chǎn)品生產(chǎn)。 見例 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 57精煉貝葉斯納什均衡的四個(gè)要求( 1) 例 有
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1