freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

納什均衡的擴(kuò)展與精煉四川大學(xué)-在線瀏覽

2025-01-25 11:39本頁面
  

【正文】 為 G的一個(gè)行動(dòng)組合,且對(duì)任意 有: 。 這樣的策略,稱為局中人 的 觸發(fā)策略 。 [ , { }, { }]iiG N S P?12( , , , )ns s s s?( ) m a x ( , )iii i i isSs P s s? ??? ??()i s? i s《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 18無限重復(fù)博弈 定理 無限重復(fù)博弈 G的子博弈完美納什均衡 設(shè) 是一個(gè)閉環(huán)策略下的無限次重復(fù)博弈, 是原博弈的一個(gè)均衡點(diǎn), 是 G的一個(gè)行動(dòng)組合,且對(duì)任意 有 , ( , )是定義 。 [ , { } , { } , , ]iiG N S P ???css?iN? ( ) ( )ciiP s P s? ?s?csiN?( ) ( )( ) ( )iiciis P ss P s?????????《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 19 無限重復(fù)博弈 例 游船定價(jià)的博弈 有一用于旅游的湖,周圍有 5條供游客用的相同的游船,并分屬 5位船主。在每位船主定價(jià)后,每位船主的需求函數(shù)為: 其收入為: 現(xiàn) 5位船主對(duì)其自身的游船的定價(jià)進(jìn)行博弈,這是一個(gè) 靜態(tài)的 5人非合作博弈 。 ? 若船主 在大家共同約定統(tǒng)一定價(jià) 的情況下, 單獨(dú)降價(jià) ,則他的 最好反應(yīng)支付 為: 當(dāng) 時(shí),有 最好反應(yīng)支付 。 而當(dāng) 時(shí),觸發(fā)策略組合 ( , )不是子博弈完美納什均衡。從定理,“合作”下的協(xié)調(diào)政策 的選取,會(huì)影響 的確立。 無限重復(fù)博弈 ( 0. 64 3 ,1]? ?s? cs( 0 , 0. 64 3 ]? ?s? cs??s? ??80s?? ?( ) 12500i s? ?? ? 9 / 16? ?? ?( ) 8000ius ?? ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 23有限重復(fù)博弈 例 雙寡頭壟斷定價(jià)博弈 ? 現(xiàn)有兩個(gè)廠商壟斷生產(chǎn)某一產(chǎn)品,每一個(gè)廠商在定價(jià)上都有策略集, {高價(jià),中價(jià),低價(jià) }, ? 其收益函數(shù)如右表。 ? 廠商 2:第一階段選取高價(jià);若第一階段博弈結(jié)果是( 5, 5),第二階段采取中價(jià),否則采取低價(jià)。若在第一階段采取了中價(jià),第二階段只能采取低價(jià),他的總收益為 ? 比較廠商 是否愿意違背。 ? 該策略組合是 子博弈完美納什均衡 。 1 / 2? ?1 / 2? ?ii????i6i??? ??《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 26 這種不是由全部納什均衡組合構(gòu)成的子博弈完美納什均衡同樣具有兩個(gè)特征: ( 1)這是一個(gè)“ 胡蘿卜加大棒 ”的策略組合; ( 2)這是 可信的威脅 ,以至于沒有局中人愿意單獨(dú)地違背這種策略組合,這就遵循了納什均衡的原則。 局中人的這種策略稱為有區(qū)別的觸發(fā)策略,其組合稱為有區(qū)別的觸發(fā)策略組合,并記為 。 由于多重納什均衡的結(jié)果對(duì)每個(gè)局中人的結(jié)局不一樣,因此在策略組合違背后的懲罰選擇也不一樣。 ? 懲罰的時(shí)段效應(yīng) 。因而設(shè)置了一個(gè)階段 ,對(duì) 之前對(duì)該觸發(fā)策略的違背,至少 T— t*個(gè)階段進(jìn)行懲罰,從而保證有足夠的懲罰威脅 。原博弈 有 多重納什均衡 , 其納什均衡集為 , 在 G中有策略組合 ,且滿足 為貼現(xiàn)率。 [ , { } , { } , , ]iiG N S P T??[ , { }, { }]iiG N S P? cS0 , , 1 , ,ics s S i n??0( ) ( ) ( )ii i iP s P s P s? ?? ( ) m in ( )cciciisSP s P s??iN??0( ) ( ) ,( ) ( ) ( ) ( )iici i i is P s iNs P s P s P s??????????? ? ?()r? ()T t r ????01( , , , , , )ns s s s t? ??s?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 31 有限重復(fù)博弈 對(duì)例題 ? 該例中,對(duì)一次靜態(tài)博弈有 兩個(gè)納什均衡點(diǎn) (中價(jià),中價(jià))和(低價(jià),低價(jià))。 ? 令 (高價(jià),高價(jià)), (中價(jià),中價(jià)), (低價(jià),低價(jià)), ,經(jīng)計(jì)算有: ? 則 是 觸發(fā)策略 。 s?? 0s ? 1s ? 2s ?0 1 2,ccs s s S?0( ) ( ) 1( ) ( ) ( ) ( ) 3iicii i i is P ss P s P s P s??????????? ? ?0 1 2( , , , , )s s s s t? ?? 1/ 3? ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 32? 當(dāng) 。 在例 , T=2, 。這時(shí)觸發(fā)策略組合 是 子博弈完美納什均衡 。若局中人 在第 1階段違背觸發(fā)策略組合 ,總損失為: 因而局中人 不愿意違背 觸發(fā)策略組合。 ?22225 5 8 52 2 ( ) 2 ( ) 2 11 2 1 2 7 2??? ? ? ? ? ? ?ii55211 2 6? ? ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 34 有限重復(fù)博弈 ? 當(dāng) 時(shí),則觸發(fā)策略 永遠(yuǎn) 不可能是 子博弈完美納什均衡。而懲罰階段的大小,又與貼現(xiàn)率有關(guān)。 0 1 2( , , , , )s s s s t? ??31143? ??《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 35167。兩企業(yè)的貼現(xiàn)因子均為 。 ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 37其 觸發(fā)策略 為: 在第一階段生產(chǎn)壟斷產(chǎn)量的一半 ,第 階段時(shí),如果前面 個(gè)階段兩個(gè)企業(yè)的產(chǎn)量都為 ,則生產(chǎn) ;否則,生產(chǎn)古諾產(chǎn)量 。那么,要使兩企業(yè)采取上述觸發(fā)戰(zhàn)略成為納什均衡,必須滿足 ? 此時(shí)這一觸發(fā)策略是 子博弈完美納什均衡 例 無限次重復(fù)博弈的古諾模型 2mq2()28mac? ??cq 2()9cac? ??i2mq1m a x ( )2j j m jq a q q c q? ? ?3 ( )8jacq ??29 ( )64dac? ??917? ?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 39 如果 ,企業(yè)的行為將如何? ? 在重復(fù)無限次的古諾模型中,單階段的納什均衡產(chǎn)量為 ,對(duì)應(yīng)的均衡結(jié)果 。 不是單階段的納什均衡,也不是壟斷產(chǎn)量的 1/2。這里 12 3c c cacq q q ?? ? ? 212()9c c cac? ? ? ?? ? ?917??q?12qqq????? ( , )qq??12( , ) ( , ) ( , ) cq q q q q q? ? ? ?? ? ? ? ? ?? ? ?( , )qq?? ( , )ccqq( , ) ( 2 )q q a q c q? ? ? ? ?? ? ?例 無限次重復(fù)博弈的古諾模型 《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 40例 無限次重復(fù)博弈的古諾模型 ? 產(chǎn)量 和納什均衡產(chǎn)量 組成定義 觸發(fā)策略組合 ,記為 假定在 t階段企業(yè) 在對(duì)方生產(chǎn) 的情況下,違背約定,其最好反應(yīng)支付為: ? 即企業(yè) 在 t階段,的產(chǎn)量為 ,相對(duì)應(yīng)的利潤(rùn)所得 。因此企業(yè) 要不違背生產(chǎn) 的約定,其充分必要條件為: i( , )qq?? ( , )ccqqq?m a x ( )i iiqa q q c q?? ? ? ?i1 ()2iq a c q ?? ? ?2()4da c q? ????ii ( , )qq? ??d? c?i iq1 1111 ( , ) ( , )1t k t tdck k tq q q q? ? ? ? ? ? ?? ??? ? ? ? ? ???? ? ?? ??《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 41 上式等價(jià)于 將 和 代入有: ( ) ( ) 當(dāng) 時(shí),右邊 = ,即壟斷產(chǎn)量的一半;當(dāng) 時(shí),右邊 = 。夏皮羅和施蒂格里茨( 1984)就此建立了一個(gè)動(dòng)態(tài)模型,其中企業(yè)為激勵(lì)工人努力工作,一方面支付很高的薪水;同時(shí)又威脅一旦被發(fā)現(xiàn)偷懶,立即開除。失業(yè)工人的人數(shù)越多,一個(gè)被解雇的工人尋找新的工作崗位所需時(shí)間越長(zhǎng),于是解雇的威脅就更加有效。我們分析一個(gè)企業(yè)和一個(gè)工人的情況,從重復(fù)博弈的角度研究這一模型(而不考慮其競(jìng)爭(zhēng)均衡的特點(diǎn))。如果工人拒絕了 ,則工人成為個(gè)體戶,保留收益為 ,其中 ,如果工人接受了 ,則工人選擇是努力工作(會(huì)帶來 的負(fù)效用)還是偷懶(不會(huì)帶來任何負(fù)效用)。產(chǎn)出可能高也可能低,為簡(jiǎn)單起見,我們認(rèn)為低水平的產(chǎn)出為 0,高水平的產(chǎn)出為 。 ww0w 0ww? weey0y?p1 p?《 博弈論及其應(yīng)用 》 (汪賢裕) ?? 《 博弈論及其應(yīng)用 》 (汪賢裕) 44 例 有效工資率 ? 假設(shè)企業(yè)以 的工資雇傭了工人,那么如果工人努力工作,帶來高產(chǎn)出時(shí)企業(yè)和工人的收益分別為:企業(yè)為 ,工人為 。為討論方便,我們假定 。 ?因而單階段的貝葉斯納什均衡為(不雇傭,偷懶)。 首先建立由該階段博弈組成的無限重復(fù)博弈的觸發(fā)策略如下: ( 1)企業(yè)在第一階段給出工資 ,在以后各階段若觀察到產(chǎn)量為 ,在其后的下一階段給出工資 ;若觀察到產(chǎn)量為 ,則下一階段不雇傭工人(即單階段的貝葉斯納什均衡中企業(yè)的行為),并一直到結(jié)束。在以后各階段,若企業(yè)付出的工資 ,則一直努力工作;若企業(yè)付出的工資 時(shí),在下一階段偷懶,并一直到以后各階段。企業(yè)的威脅是,若一旦發(fā)現(xiàn)產(chǎn)出 ,則下一階段就不雇傭工人。 假設(shè)工人被解雇,企業(yè)收入為 0,而工人不解雇,企業(yè)的收入 (見前面假設(shè))。 ( 1)對(duì)工人進(jìn)行分析 。 ( 2)對(duì)企業(yè)進(jìn)行分析 。則企業(yè)遵循觸
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1