freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

[理學]第8章重復博弈(編輯修改稿)

2024-11-12 21:25 本頁面
 

【文章內容簡介】 Northwest University 121重復無限次: U D L R Department of Mathematics Northwest University (2)在有限重復博弈中,參與人的收益既可以是各階段 博弈收益的簡單相加,也可以是各階段的貼現(xiàn)和;在 無限重復博弈中,收益只能是貼現(xiàn)和。 無限重復博弈中,收益的計算: 其中, 為參與人 i在第 t階段的支付 1 2 1( ( , ) ) tti i i iG? ? ? ? ? ? ??? ? ? ? ? ?ti?Department of Mathematics Northwest University (3)無限與有限的界定:數學上將無限重復博弈看成博 弈人之間的一種長期博弈關系,而有限重復則理解為 一種短期的博弈關系。 一般來說,短期博弈是指那些參與人能夠預測到博弈 盡頭,明確知道博弈什么時候結束的博弈情形,而長 期博弈是指那些參與人無法預測到博弈盡頭,不知道 博弈什么時候會結束的博弈。 Department of Mathematics Northwest University 下列博弈重復無限次。 1 , 1 5 , 00 , 5 4 , 4UDL R12Department of Mathematics Northwest University 前面已經討論過,對于階段博弈為上述博弈的有限重復博弈,合作不可能形成。 Department of Mathematics Northwest University 構造如下觸發(fā)策略: S1:第 i階段選擇 D;如第 i階段結果為 (D,R), 則下一階段選 D;否則以后一直選擇 U。 S2:第 i階段選擇 R;如第 i階段結果為 (D,R), 則下一階段選 R;否則以后一直選擇 L。 Department of Mathematics Northwest University 對于上述觸發(fā)戰(zhàn)略,如果有人選擇合作,合作將一直進行下去,一旦有人選擇不合作,就會觸發(fā)其后所有階段都不再相互合作。 如果參與人雙方都采取上述觸發(fā)戰(zhàn)略,則此無限重復博弈的結果就將是每一階段都選擇 (D,R). 上面的觸發(fā)戰(zhàn)略能否構成子博弈精煉 Nash均衡? Department of Mathematics Northwest University 關于觸發(fā)戰(zhàn)略的分析: 假定參與人 1在博弈的第 t (t≥1) 階段首先偏離 (D,R),而選擇 U,則他對該行為的得失分別為: 得到:得到 5單位的收益而不是原來的選擇觸發(fā)戰(zhàn)略時的 4單位收益。 損失:參與人 2將會由于它的機會主義行為而永遠偏離 (D,R),選擇 L作為懲罰,從而使得參與人 1在以后每個階段的收益都是 1. Department of Mathematics Northwest University 參與人 1選擇觸發(fā)戰(zhàn)略的收益 : 2 44 + 4 + 4 + =1?? ?參與人 1選擇偏離觸發(fā)戰(zhàn)略的收益 : 25+ + + = 5+1????Department of Mathematics Northwest University 要使參與人 1不偏離觸發(fā)戰(zhàn)略,需 45+1 1 14?????? 上述的討論過程,對于參與人 2同樣成立,從而當貼現(xiàn)率滿足條件成立時,觸發(fā)戰(zhàn)略組合構成無限重復博弈的子博弈精煉 Nash均衡。 Department of Mathematics Northwest University 上面的結論說明,在一次性博弈和有限重復博弈中無法實現(xiàn)的合作,在無限重復博弈中是可能實現(xiàn)的。只要具有比較大的貼現(xiàn)率。 這是否可以解釋現(xiàn)實生活中一些“慣偷”, 被抓之后往往會選擇“抵賴”而非“坦白” 貼現(xiàn)率可以理解為參與人對未來收益的重視程度,也就是說,貼現(xiàn)率越大,對未來的重視程度越高,合作越有可能形成。 Department of Mathematics Northwest University 一般情況下,除了觸發(fā)戰(zhàn)略外,在無限重復博弈中還有其他戰(zhàn)略也能構成子博弈精煉 Nash均衡,而且不同的均衡戰(zhàn)略的收益也不同。 下面就對此問題做進一步的分析。 Department of Mathematics Northwest University 可行收益 一組收益 為階段博弈G的可行收益,如果它們是 G的純戰(zhàn)略收益的凸組合 (即純戰(zhàn)略收益的加權平均,權重非負且和為 1)。 12( , , , )nx x xDepartment of Mathematics Northwest University 前述階段博弈的可行收益集合: (0,5) (1,1) (0,0) (4,4) (5,0) Department of Mathematics Northwest University 在無限重復博弈中,參與人 i的收益一般用參與人在無限個階段博弈中收益的現(xiàn)值來表示。 還可以利用無限個收益值的平均收益來表示。 無限重復博弈收益的表示: Department of Mathematics Northwest University 平均收益 所謂平均收益,是指為得到與收益的現(xiàn)值相等的總收益而在每一階段都應該得到的等額收益。 Department of Mathematics Northwest University 平均收益的計算 給定貼現(xiàn)率 ,無限的收益序列 的平均收益 ?? ? ?1 2 3, , ?1111 1t t tiitt?? ? ? ? ????????? ? ????11( 1 ) tt it? ? ? ?????? ?Department of Mathematics Northwest University 從而對每一個參與人都有平均收益 11( 1 ) t tt? ? ? ?????? ?Department of Mathematics Northwest University 采用平均收益的目的是能夠將無限重復博弈和階段博弈的收益直接比較。 例如:在前面的例子中,采用觸發(fā)戰(zhàn)略參與人在每一階段都可得到 4的收益,這樣一個無限的收益序列的平均收益為 4,現(xiàn)值為 。由于平均收益只是現(xiàn)值的另一種度量形式,因此使平均收益最大化就等同于使現(xiàn)值最大化。 4 / (1 )??Department of Mathematics Northwest University ? 令 G為一個有限的完全信息靜態(tài)博弈,令 為 G的一個 Nash均衡下的收益,且用 表示 G的其它任何可行收益。 若存在 則存在足夠接近 1的貼現(xiàn)率 ,使無限重復博弈 存在一個子博弈精煉 Nash均衡,其平均收益可達到 定理: 12( , , , )ne e e12( , , , )nx x x, iii x e? ? ? ??12( , , , )nx x x( , )G ??Department of Mathematics Northwest University 子博弈精煉 Nash均衡的可行收益區(qū)間 (0,5) (1,1) (0,0) (4,4) (5,0) 為什么是圖中所示范圍? 注意到,在階段博弈的 Nash均衡收益為 (1,1),因而, 只要兩個參與人的收益都大于 1的可行收益,按照 上述定理,都存在一個無限重復博弈的子博弈精煉 Nash均衡的平均收益取到該可行收益。 Department of Mathematics Northwest University 對于貼現(xiàn)率的另一種理解: 可將貼現(xiàn)率看成是博弈在某個階段能夠繼續(xù)進行的可能性,假設博弈在每個階段繼續(xù)進行的可能性為貼現(xiàn)率,則博弈能夠到達 t階段的概率為 ,參與人能夠在 t階段得到的期望收益為 1t??1tti???Department of Mathematics Northwest University 從而上述定理可以表述為:在一個隨時可能結束的無限重復博弈中,如果博弈每次結束的可能性足夠小,則參與人的任何 Pareto有效的可行收益都能夠由博弈的一個子博弈精煉 Nash均衡得到。 Department of Mathematics
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1