freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

納什均衡的擴(kuò)展與精煉四川大學(xué)-資料下載頁(yè)

2024-12-08 11:39本頁(yè)面
  

【正文】 g m a x ( | ) ( , , )i ihi i i i i i i i i is ts s t p t a u s s t?? ? ? ?? ? ? ?? ?( | )hi i ip t a? ?? ( , )iip t t?hia? (.)is??精煉貝葉斯納什均衡正式定義 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 76? 第一個(gè)條件稱為 精煉條件 ,它是前面敘述的要求 2的數(shù)學(xué)表示。它表明在其它局中人策略 和局中人 的后驗(yàn)信念 給定以后,局中人 的戰(zhàn)略從信息集 開(kāi)始以后的后續(xù)博弈上都是最優(yōu)的,因此,在信息集 開(kāi)始的后續(xù)博弈中構(gòu)成了貝葉斯均衡。 ? 第二個(gè)條件稱為 信念條件 ,它是前面敘述的要求 1, 3, 4的綜合表示,它表明局中人在其應(yīng)行動(dòng)的信息集中的信念是 上的一個(gè)后驗(yàn)概率分布,它依賴于先驗(yàn)概率,觀察到的其它局中人的 以及博弈的均衡策略組合 。如果 不是均衡策略下的行動(dòng),則是前面敘述中要求 4所提及的“不在均衡路徑上”,那么對(duì)任意 都是允許的,但它必須與均衡策略組合相容。 1 1 1( , , , , , )i i i ns s s s s? ? ??i( | )hi i ip t a??ihhhhia?()is?? hia?( / ) [ 0 , 1 ]i i ipa? ?? ?精煉貝葉斯納什均衡正式定義 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 77 在上述定義中,我們知道 精煉貝葉斯納什均衡 是 均衡戰(zhàn)略 和均衡信念 的結(jié)合: ? 給定信念 ,策略組合 是最優(yōu)的; ? 給定策略組合 ,信念是使用貝葉斯法則從均衡戰(zhàn)略和所觀測(cè)到的行動(dòng)得到的。 ? 因此,精煉貝葉斯均衡是一個(gè)對(duì)應(yīng)的不動(dòng)點(diǎn) : ( ) 12( , , )np p p p? ? ? ?? ))(,),(()( 11 nnsss ??? ??? ? ?))(,),(()( 11 nnsss ??? ??? ? ?( , )sp??( ( ) ) 。 ( ( ) )s s p s p p s p? ? ? ???精煉貝葉斯納什均衡正式定義 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 78 精煉貝葉斯均衡和 一般貝葉斯均衡的比較 ? 與不完全信息靜態(tài)博弈不同的是,在完全但不完美的動(dòng)態(tài)博弈中,局中人 不能單靠類型集空間上的概率分布 來(lái)推算出其它局中人的類型 的概率分布 ,而要從它所觀察到的其它局中人的行動(dòng) 來(lái)修正對(duì)其它人類型的信念(也是一種概率分布 ),即對(duì)其它局中人的后驗(yàn)概率。 ? 在不完全信息動(dòng)態(tài)博弈中,若局中人在某一中類型有多個(gè)行動(dòng),并在同一信息集中,則先驗(yàn)判斷概率直接用于對(duì)信息集中所處結(jié)點(diǎn)的后續(xù)結(jié)果和可能的均衡,進(jìn)行各節(jié)點(diǎn)出現(xiàn)信息的概率判斷,如例 。 i 12( , , , )np t t tit? ( | )i i iP t t?hia?( / )hi i ip t a??《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 79167。 信號(hào)博弈 ※ 信號(hào)博弈的時(shí)間順序 ※ 信號(hào)博弈的發(fā)送者純策略 ※ 信號(hào)博弈的接收者純策略 ※ 信號(hào)博弈的精煉貝葉斯均衡要求 ※ 精煉貝葉斯均衡定義 ※ 例題 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 80 信號(hào)博弈的時(shí)間順序 1.自然賦予發(fā)送者某種類型 是發(fā)送者的類型空間。 是發(fā)送者的私人信息。對(duì)發(fā)送者類型的先驗(yàn)信念 是共同知識(shí),且 , 。 2.發(fā)送者 s知道自己的類型 ,然后從可行的信號(hào)集 中選擇一個(gè)發(fā)送信號(hào) 。 3.接收者 r觀測(cè)到 ,然后從可行的行動(dòng)集 中選擇一個(gè)行動(dòng) 。 4.雙方支付函數(shù)分別為 和 ,且是共同知識(shí)。 },{, 1 Ii ttTTt ???()ipt0)( ?itp( ) 1ii pt ??it },{ 1 JmmM ??jmjm },{ 1 KaaA ??ka),( kjis amtu ( , , )r i j ku t m ait《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 81信號(hào)博弈的發(fā)送者純策略 1. :如果自然賦予類型 ,選擇信號(hào) ; 如果自然賦予類型 ,選擇信號(hào) ; 2. :如果自然賦予類型 ,選擇信號(hào) ; 如果自然賦予類型 ,選擇信號(hào) ; 3. :如果自然賦予類型 ,選擇信號(hào) ; 如果自然賦予類型 ,選擇信號(hào) ; 4. :如果自然賦予類型 ,選擇信號(hào) ; 如果自然賦予類型 ,選擇信號(hào) 。 11( , )mm12( , )mm21( , )mm22( , )mm1t1t1t1t1m1m2m2m2t2t2t1m1m2m2m2t《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 82信號(hào)博弈的發(fā)送者純策略 其中, 和 稱為 混同策略, 即不同類型的發(fā)送者選擇了相同的信號(hào); 和 稱為 分離策略 ,即不同類型的發(fā)送者選擇了不同的信號(hào)。 當(dāng)發(fā)送者在同一類型下,隨機(jī)地選擇 ,也有相對(duì)應(yīng)的混合策略 ,對(duì)此,我們稱為 雜合策略 。在本節(jié)中,我們只考慮 純策略 的情況。 12mm和21( , )mm12( , )mm11( , )mm 22( , )mm《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 83信號(hào)博弈的接收者純策略 1. :如果收到發(fā)送者信號(hào) ,選擇 ; 如果收到發(fā)送者信號(hào) ,選擇 ; 2. :如果收到發(fā)送者信號(hào) ,選擇 ; 如果收到發(fā)送者信號(hào) ,選擇 ; 3. :如果收到發(fā)送者信號(hào) ,選擇 ; 如果收到發(fā)送者信號(hào) ,選擇 ; 4. :如果收到發(fā)送者信號(hào) ,選擇 ; 如果收到發(fā)送者信號(hào) ,選擇 。 11( , )aa12( , )aa21( , )aa22( , )aa1m1m1m1m1a1a2a2a2m2m2m2m1a1a2a2a《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 84信號(hào)博弈的接收者純策略 其中, 和 稱為 混同策略 , 即不論觀察到何種信息,都選擇同一行動(dòng); 和 稱為 分離策略 ,即觀察到不同的信息,采取相對(duì)應(yīng)的不同行動(dòng)。當(dāng)接收者在觀察到某一信息 后,隨機(jī)地選擇 ,也有相對(duì)應(yīng)的混合策略,同樣,我們也將此稱為接收者的 雜合策略 。本節(jié)中,我們只考慮純策略的情況。 11( , )aa12( , )aa 21( , )aajm12aa和22( , )aa《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 85信號(hào)博弈的精煉貝葉斯均衡要求 ? 要求 1 當(dāng)接收者在觀測(cè)到 M中的任何信號(hào) 之后,依據(jù)對(duì)哪些類型可能發(fā)送信號(hào) 有一個(gè)信念概率表示 且 , ? 要求 2R 對(duì)接收者,他對(duì)每一個(gè)信號(hào) ,依據(jù)對(duì)哪些類型可能發(fā)送信號(hào) 的信念概率 的條件下,選擇行動(dòng) ,并使自己效用最大化。亦即 為下式的解 : 上式中 jmjm( | )ijtm?( | ) 0ijtm? ?1( | ) 1mijitm????jmjm( | )ijtm?)( jma?)( jma?( ) a r g m a x ( , , ( ) )kj R i j k jaa m E U t m a m? ?1( , , ( ) ) ( , , ( ) ) ( | )nR i j k j R i j k j i jiE U t m a m u t m a m t m?????— 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 86 信號(hào)博弈的精煉貝葉斯均衡要求 ? 要求 2S 對(duì)發(fā)送者,他對(duì)自己的每一個(gè)類型 ti,在給定的接收者戰(zhàn)略 的條件下,它選擇的信號(hào) ,并使自己的效用最大化。亦即 為下式的解 ? 要求 3 對(duì)信號(hào)集 M中的每一 ,如果在類型集 T中存在 ,則接收者對(duì)應(yīng)于 的信息集 中所持有的信念必須取決于貝葉斯法則和發(fā)送者的戰(zhàn)略: )( jma? ()imt?))(,(m a xa rg)( jjismimamtUtmj?? ?jmjm()jhmji mtm ?? )(( | ) ( )( | )()j i iijjp m t p ttmpm???1( ) ( | ) ( )mj j i iip m p m t p t????()imt?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 87 信號(hào)博弈的精煉貝葉斯均衡要求 ? 要求 4 對(duì)處于均衡路徑之外的信息集,信念由貝葉斯法則及可能情況下局中人的均衡策略組合決定。 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 88精煉貝葉斯均衡定義 定義 信號(hào)博弈 中一個(gè)純戰(zhàn)略的 精煉貝葉斯均衡 為 一對(duì) 策略組合 以及相對(duì)應(yīng)的 信念概率分布 滿足信號(hào)要求( 1),( 2R),( 2S) ,( 3) 及 (4)。 如果 發(fā)送者 的策略是混同或分離的,我們稱均衡分別為混同均衡和分離均衡。 { ( )}imt? ( | )ijtm?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 89 在該信號(hào)博弈中,發(fā)送者有兩個(gè)類型,其信號(hào)集 J=2。因此,發(fā)送者有4個(gè)純策略( L, L),( L, R),( R, L),( R, R)。第 1和第 4策略是混同策略,而第 2和第 3是分離策略。對(duì)應(yīng)接收者也有 4個(gè)純策略,( u,u),( u, d),( u, d),( d, d)。第 1和第 4是混同策略,第 2和第 3是分離策略。 例題 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 90? 在該信號(hào)博弈中,自然賦予每個(gè)類型的可能性是相同的,接收者在收到 L信號(hào)后的信息集 有兩個(gè)結(jié)點(diǎn),設(shè)接收者的信念分別為 ,在圖中用 [ ]標(biāo)記;在收到 R信號(hào)后的信息集
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1