freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

[經(jīng)濟(jì)學(xué)]2yan完全信息動(dòng)態(tài)博弈-資料下載頁

2024-10-19 02:17本頁面
  

【正文】 ? 重復(fù)博弈中的戰(zhàn)略 ? 由于在重復(fù)博弈中,每個(gè)參與人在每個(gè)階段都必須行動(dòng),因此重復(fù)博弈中的戰(zhàn)略是針對每個(gè)階段博弈如何行動(dòng)的行動(dòng)計(jì)劃 ? 如果博弈不是一次的,而是重復(fù)進(jìn)行的,參與人過去行動(dòng)的歷史是可以觀察到的,參與人就可以將自己的選擇依賴于其他人之前的行動(dòng),因而有了更多的戰(zhàn)略可以選擇,均衡結(jié)果可能與一次博弈大不相同。 11 重復(fù)博弈 Ⅳ 8, 8 0, 10 10, 0 1, 1 坦白 抵賴 坦白 抵賴 ? AllD:不論過去什么發(fā)生,總是選擇不合作; ? AllC:不論過去什么發(fā)生,總是選擇合作; 合作 不合作交替進(jìn)行; ? titfortat:從合作開始,之后每次選擇對方前一階段的行動(dòng); ? trigger strategies:從合作開始,一直到有一方不合作,然后永遠(yuǎn)選擇不合作。 ? 假定囚徒困境博弈重復(fù)多次或無限次;那么,每個(gè)參與人有多個(gè)可選擇的戰(zhàn)略。僅舉幾例: 11 重復(fù)博弈 Ⅴ ? 重復(fù)博弈中的子博弈 ? 從某個(gè)階段(不包括第一階段)開始,包括此后所有的重復(fù)博弈部分 ? 均衡路徑 ? 動(dòng)態(tài)博弈中各參與人的戰(zhàn)略組合對應(yīng)一條路徑,均衡戰(zhàn)略組合則對應(yīng)一條均衡路徑 ? 重復(fù)博弈中:路徑由每個(gè)階段博弈的戰(zhàn)略組合串聯(lián)而成。 11 重復(fù)博弈 Ⅵ ? 博弈的第 N個(gè)階段:雙方都會(huì)坦白 ? 逆向推理,在每一階段博弈:雙方都會(huì)坦白 ? 結(jié)論:無論博弈重復(fù)多少次,只要重復(fù)次數(shù)是有限次的,雙方在每一階段都會(huì)坦白。唯一的 SPNE為 ({坦白,坦白, … }, {坦白,坦白, … }) ? 有限次重復(fù)博弈 ? 例 1,囚徒困境博弈重復(fù) N次 11 重復(fù)博弈 Ⅶ ? 唯一的 SPNE為進(jìn)入者進(jìn)入,在位者默許 ? 假定在位者有 N個(gè)連鎖店 —— 博弈重復(fù) N次 ? 有限次重復(fù)博弈中,斗爭不是一個(gè)可置信戰(zhàn)略。因?yàn)槟嫦驓w納法得到唯一的 SPNE為在位者在每個(gè)市場選擇默許,進(jìn)入者選擇進(jìn)入。 打擊 進(jìn)入 (0,300) (40,50) (10,0) 默認(rèn) 不進(jìn)入 進(jìn)入者 在位者 Chain Store Paradox ? 市場進(jìn)入博弈 11 重復(fù)博弈 Ⅷ ? 定理: 如果階段博弈只有 唯一的納什均衡 ,那么重復(fù) N次的重復(fù)博弈唯一的子博弈納什均衡是,階段博弈的納什均衡重復(fù) N次。 ? 如果階段博弈有多個(gè)納什均衡,那么上述結(jié)論不再成立。 11 重復(fù)博弈 Ⅸ 三價(jià)博弈 ? 三價(jià)博弈的重復(fù)博弈 ? 2個(gè)純戰(zhàn)略 NE( M,M)和( L,L) ? 該三價(jià)博弈重復(fù) 2次 ,存在第一階段包含( H, H)的 SPNE。 L M H 0, 2 0, 2 1, 1 H 廠商 2 M L 廠 商 1 3, 3 0, 6 2, 0 6, 0 5, 5 2, 0 ? 參與人 2 戰(zhàn)略:第一階段選擇 H;如果第一次看到結(jié)果為( H,H),則第二次選擇 M。如果第一次結(jié)果為任意其他策略組合,則第二次選擇 L 觸發(fā) 策略:兩博弈方先試探合作,一旦發(fā)現(xiàn)對方不合作則也用不合作報(bào)復(fù) 11 重復(fù)博弈 Ⅹ L M H 0, 2 0, 2 1, 1 H 廠商 2 M L 廠 商 1 3, 3 0, 6 2, 0 6, 0 5, 5 2, 0 ? 第二階段( M, M)實(shí)際上是原博弈的 NE,無人愿意偏離 ? 第一階段:如果有人單獨(dú)偏離( H,H),采用 M能增加 1個(gè)單位支付,但在第二階段就會(huì)損失 2個(gè)單位支付 ? 雙方都采用觸發(fā)戰(zhàn)略構(gòu)成該博弈的SPNE L M H 1, 3 1, 3 2, 2 H 廠商 2 M L 廠 商 1 4, 4 1, 7 3, 1 7, 1 8, 8 3, 1 2次重復(fù)三價(jià)博弈的等價(jià)模型 11 重復(fù)博弈 Ⅺ ? (A,B)+(A,B) OR (B,A)+(B,A)—— (1,4)(4,1) ? 連續(xù)兩次采用混合策略 —— (2,2) ? 輪換策略: (A,B)+(B,A) OR (B,A)+(A,B)—— (,) ? 一次純策略 +一次混合策略 —— (,3)(3,) 0, 0 4, 1 1, 3 3, 3 廠 商 1 廠商 2 B A A B 兩市場博弈 ? 該博弈存在 2個(gè)純戰(zhàn)略 NE( A,B)、(B,A)和一個(gè)混合戰(zhàn)略 NE{(,),(,)} ? 如果該博弈重復(fù)兩次,則存在許多均衡路徑 ? 兩市場博弈 11 重復(fù)博弈 Ⅻ ? 不同策略組合、均衡得益圖示 廠商 2 得益 廠商 1得益 (1,4) (3,3) (,) (2,2) (3,) (4,1) (,3) Pareto最優(yōu)結(jié)果 2次重復(fù)使博弈結(jié)果表現(xiàn)出更多的可能性,但與 Pareto最優(yōu)結(jié)果 11 重復(fù)博弈 (13) ? 兩市場博弈重復(fù)三次 ? 廠商 1:第一階段選 A;如果第一階段結(jié)果是( A,A),則第二階段選擇 A,如果第一階段結(jié)果是( A,B),則第二階段選 B,第三階段無條件選擇 B ? 廠商 2:第一階段選 A,第二階段選擇 B,如果第一階段結(jié)果是( A,A),則第三階段選擇 A;如果第一階段結(jié)果是( B,A),則第三階段選擇 B ? 均衡路徑為( A,A) (A,B)(B,A),第二、三階段本身就是 NE,無人愿意偏離;第一階段:若 1偏離,則在后面引起 2在第三階段報(bào)復(fù),偏離不可??;若 2偏離,則引起 1在第二階段報(bào)復(fù)。 ? 雙方總的支付為:( 3+4+1) /3= 是眾多 SPNE 中效率最高的均衡 11 重復(fù)博弈 (14) ? 有限次重復(fù)博弈的無名氏定理 :設(shè)原博弈的一次性均衡有均衡支付向量 w,那么在博弈的有限次重復(fù)中,所有不小于個(gè)人理性支付的可行支付,都至少可通過有一個(gè) SPNE來實(shí)現(xiàn)。 ? w={wi},wi為 i在一次性博弈中最差的均衡支付 ? 當(dāng)原博弈有多個(gè)純戰(zhàn)略 NE時(shí),有限次重復(fù)博弈存在許多效率差異很大的的 SPNE。 ? 設(shè)計(jì)特定的戰(zhàn)略,主要是包含報(bào)復(fù)機(jī)制的觸發(fā)戰(zhàn)略,實(shí)現(xiàn)效率較高的均衡,挖掘一次性博弈無法實(shí)現(xiàn)的合作利益。 11 重復(fù)博弈 (15) ? 兩市場博弈的可行支付集合 (1,1) (4, 1) (3,3) (1, 4) 個(gè)人理性( individual rationality)支付 或保留 (reservation)支付 可行支付:所有純戰(zhàn)略組合的加權(quán)平均 11 重復(fù)博弈 (16) 8, 8 0, 10 10, 0 1, 1 坦白 抵賴 抵賴 ?? 冷酷戰(zhàn)略 (grim strategies)或觸發(fā)戰(zhàn)略 (trigger strategies) ? 開始選擇抵賴;如果對方也選擇抵賴,將繼續(xù)選擇抵賴;一旦對方選擇坦白,將永遠(yuǎn)選擇抵賴 ? 無限次重復(fù)中不能再用逆向歸納法求解 SPNE。 假設(shè)雙方貼現(xiàn)因子為 1 2 ? 無限次重復(fù)博弈 坦白 11 重復(fù)博弈 (17) 23 1( tr igg e r ) ( 1 ) ( 1 ) ( 1 ) ( 1 ) .. .1V ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ?抵 ,23 8( tr igg e r ) 0 ( 8 ) ( 8 ) ( 8 ) .. .1V?? ? ??? ? ? ? ? ? ? ? ? ? ?坦 白 ,1811???? ? ???? 給定別人選擇觸發(fā)戰(zhàn)略且未首先選擇坦白, “ 我 ” 一直選擇抵賴的支付為 ? 給定別人選擇觸發(fā)戰(zhàn)略, “ 我 ” 選擇坦白的支付為 ? 給定別人選擇觸發(fā)戰(zhàn)略, “ 我 ” 一直選擇抵賴的條件是 18? ?當(dāng) 如果對方一直選擇抵賴, “ 我 ” 最好 “ 抵賴 ” 。 18? ?? 證明雙方采用觸發(fā)戰(zhàn)略是一個(gè) NE 對 δ的理解: 耐心程度; 博弈繼續(xù)的概率; 一般化:未來收益的重要程度 11 重復(fù)博弈 (18) ? 如果對方偏離 “ 抵賴 ” , “ 我 ” 也必須選擇 “ 坦白 ” 懲罰對方。 ? “ 我 ” 對對方選擇觸發(fā)戰(zhàn)略的最優(yōu)反應(yīng)是選擇同樣的觸發(fā)戰(zhàn)略 ? 雙方都選擇觸發(fā)戰(zhàn)略 是 NE。 ? 重復(fù)博弈的子博弈是是重復(fù)一定次數(shù)之后的全部重復(fù)博弈過程,那么無限次重復(fù)博弈的子博弈還是無限次重復(fù)博弈。因此,觸發(fā)戰(zhàn)略必然在子博弈上構(gòu)成 NE ? 觸發(fā)戰(zhàn)略組合構(gòu)成無限次重復(fù)博弈的 SPNE,均衡路徑就是 2個(gè)參與人在每個(gè)階段均選擇“抵賴”。 11 重復(fù)博弈 (19) ? 假定 : ,邊際成本都為 2。 ? 在無限次重復(fù)古諾模型中,當(dāng)貼現(xiàn)率 滿足一定條件時(shí),兩廠商采用下列觸發(fā)策略構(gòu)成一個(gè) SPNE: 21,8 qqP ???? 其中?? 無限次重復(fù)古諾模型 ? 在第一階段生產(chǎn)壟斷產(chǎn)量的一半 ;在第 t 階段,如果前 t1 階段結(jié)果都是 (,),則繼續(xù)生產(chǎn) ,否則生產(chǎn)古諾產(chǎn)量 2。 ? 設(shè)廠商 1已采用該觸發(fā)策略,若廠商 2也采用該觸發(fā)策略,則每期得益 ,無限次重復(fù)博弈總得益的現(xiàn)值為: ? ? ??? ????? 1 2 ?? 如果廠商 2偏離上述觸發(fā)策略,則他在第一階段所選產(chǎn)量應(yīng)為給定廠商 1產(chǎn)量為 ,自己的最大利潤產(chǎn)量,即滿足: 解得 ,此時(shí)利潤為 ,高于觸發(fā)策略第一階段得益 。 ? 但從第二階段開始,廠商 1將報(bào)復(fù)性地永遠(yuǎn)采用古諾產(chǎn)量 2,這樣廠商 2也被迫永遠(yuǎn)采用古諾產(chǎn)量,從此得利潤 4。因此,無限次重復(fù)博弈第一階段偏離的情況下總得益的現(xiàn)值為: ? ?? ? ? ? 2222 a a x222qqqqq qq ????? ?q11 重復(fù)博弈 (20) ? ? ???? ?????? 1 40 6 2 6 2 2 ?1791 ????? ???? 即? 當(dāng) 時(shí),上述策略是廠商 2對廠商 1的同樣觸發(fā)策略的最佳反應(yīng),否則偏離是最佳反應(yīng)。 11 重復(fù)博弈 (21) 11 重復(fù)博弈 (22) ? 無限次重復(fù)博弈的無名氏定理 ( Friedman1971):在無限次重復(fù)博弈中,當(dāng)貼現(xiàn)因子足夠大時(shí),任何帕累托優(yōu)于單階段博弈納什均衡的收益組合 (支付向量 )都可以實(shí)現(xiàn),即都能夠成為子博弈精煉納什均衡結(jié)果。 ? 含義:在無限次重復(fù)博弈中,如果參與人對未來足夠重視( 足夠大),那么,任何程度的合作都可以通過一個(gè)特定的子博弈精煉納什均衡得到。 ?11 重復(fù)博弈 (23) ? 囚徒困境博弈的可行支付集合 8, 8 0, 10 10, 0 1, 1 坦白 抵賴 坦白 抵賴 (10, 0) (8,8) (0,10) (1,1) 11 重復(fù)博弈 (24) ? 耐心程度; ? 博弈繼續(xù)的概率; ? 一般化:未來收益的重要程度 ? 對 δ 的解釋:
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1