freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

中南財(cái)經(jīng)政法大學(xué)微觀經(jīng)濟(jì)學(xué)精品課件第八章(編輯修改稿)

2025-02-13 09:48 本頁面
 

【文章內(nèi)容簡介】 均衡,但具有混合策略納什均衡。 純策略和混合策略納什均衡 : 如果一個(gè)策略規(guī)定參與人在每一個(gè)給定的信息情況下下只選擇一種特定的行動,則稱該策略為純策略。 若一個(gè)策略規(guī)定參與人在給定信息情況下以某種概率分布隨機(jī)地選擇不同的行動,則稱該策略為混合策略。在博弈的策略式表述中,混合策略可定義為在純策略空間上的概率分布。 定義: ? ????????KikikikikikiKiiiKiinnKksisissSKiuuSSGn11111.1,10,1,)(.),(},{:,},。,{????????????對于所有的的概率選是的一個(gè)混合策略稱為布則概率分個(gè)純策略有假定參與人中博弈個(gè)參與人的策略式表述在?? ?? ??????).(,),(),( 1???????iiini iii ii代表混合策略組合空間而的一個(gè)混合策略為其中代表混合策略組合的混合策略空間代表用 ??? ?? ?????????Ssnjijjiiiniiiiiiisusv iivv1111)())((),(:,),,([),()(???????????它可被定義為策略組合混合之外所有其他參與人的是除的期望效用函數(shù)表示參與人用?? 社會福利博弈的支付矩陣 流浪漢 找工作 游蕩 政府 救濟(jì) 3, 2 1, 3 不救濟(jì) 1, 1 0, 0 以社會福利博弈為例求解混合策略納什均衡。 假定政府的混合策略為 σ G=(θ ,1θ )(即政府以 θ 的概率選救濟(jì), 1θ 的概率選不救濟(jì)),流浪漢的混合策略為σ L=(r,1r)(即流浪漢以 r的概率選找工作,以 1r的概率選游蕩)。則政府的效用函數(shù)為 : 求其微分可得到政府最優(yōu)化的一階條件 : 因此 , 在混合策略均衡 ,流浪漢以 , 概率選游蕩。 ???????????????????????????????)15()1()14())1(0)(1()1)(1(3(),( v LGG015 ????? ??Gv* ?? 問題是,解政府的最優(yōu)化問題得到的卻是流浪漢的混合策略。對此的可作如下解釋:首先假定最優(yōu)混合策略是存在的。給定流浪漢選擇混合策略( r, 1r),政府選純策略救濟(jì)(即θ =1)的期望效用為: (這里省略了選擇第二個(gè)純策略的概率)選擇純策略不救濟(jì)(即 θ =0)的期望效用為: 14)1)(1(3),1( ?????? ????Gv???? ?????? )1(01),0(Gv 如果一個(gè)混合策略 是政府的最優(yōu)選擇,則一定意味著政府救濟(jì)與不救濟(jì)之間是無差異的,即: )1,0( ??),0(14),1( ???? GG vv ????? 上式意味著 。即若 政府將選擇不救濟(jì); * ?? ?? ,政府將選擇救濟(jì);只有當(dāng) 時(shí),政府才會選擇混合策略 或任何純策略。 要找出政府的均衡混合策略,需求流浪漢的最優(yōu)化問題。流浪漢的效用函數(shù)為: ?? ??)1,0( ?????????????????3)12()1(3)1())1(03)(1()1(12(),(??????????????? v LGL 最優(yōu)化一階條件為: 0)12( ?????? ??Lv 因此 , 該結(jié)論可解釋為:若 θ ,流浪漢的最優(yōu)選擇是找工作;若θ ,其最優(yōu)選擇是游蕩;只有當(dāng) θ =,他才選擇混合策略 或任何純策略。 * ??)1,0( ?? 納什均衡要求每個(gè)參與人的混合策略是給定對方的混合策略下的最優(yōu)選擇。故 θ *=, r*=。即在均衡時(shí),政府以 , ;流浪漢以 ,以 。 從反面進(jìn)行說明。假定政府認(rèn)為流浪漢找工作的概率嚴(yán)格小于 ,則政府的唯一最優(yōu)選擇是純策略不救濟(jì);但若政府以 1的概率選不救濟(jì),流浪漢的最優(yōu)選擇是找工作,這又將導(dǎo)致政府選擇救濟(jì),流浪漢則選游蕩, …… 。因此,r。類似地,假定政府認(rèn)為流浪漢找工作的概率嚴(yán)格大于 ,則政府的唯一最優(yōu)選擇是純策略救濟(jì);但若政府以 1的概率選救濟(jì),流浪漢的最優(yōu)選擇是游蕩。因此, r。容易驗(yàn)證 , θ θ 也都不構(gòu)成納什均衡。 納什均衡的弱點(diǎn): ? ( 1) 多重性。同一博弈里有時(shí)會出現(xiàn)多個(gè)納什均衡,即一般懷況下不能保證其唯一性 . ? ( 2)有些納什均衡并不合理。 女 足球 芭蕾 男 足球 2, 1 0, 0 芭蕾 0, 0 1, 2 如在 “ 性別戰(zhàn) ” 博弈中,有兩個(gè)純策略納什均衡:(足球,足球),(芭蕾,芭蕾)。事實(shí)上,可以驗(yàn)證,還有一個(gè)混合策略納什均衡,即男的以 2/3的概率選擇足球賽,以 1/3的概率選擇芭蕾舞;女的以 1/3的概率選擇足球賽,以 2/3的概率選擇芭蕾舞。 一、 博弈的擴(kuò)展式表述 [博弈樹的構(gòu)造(尤其是信息集的概念) ]。 二、將納什均衡應(yīng)用于擴(kuò)展式博弈。 三、定義和討論完全信息動態(tài)博弈的基本概率 ——子博弈精煉納什均衡及其求解方法。 四、子博弈精煉納什均衡的應(yīng)用舉例。 第三節(jié) 完全信息動態(tài)博弈 在靜態(tài)博弈中,所有參與人同時(shí)行動(或行動雖有先后,但沒有人在自己行動之前觀測到別人的行動);在動態(tài)博弈中,參與人的行動有先后順序,且后行動者在行動之前能觀測到先行動者的行動。 通常用擴(kuò)展式表述分析動態(tài)博弈。博弈的擴(kuò)展式表述“ 擴(kuò)展 ” 的主要是參與人的策略空間。策略式表述簡單地給出參與人有些什么策略可供選擇,而擴(kuò)展式博弈要給出每個(gè)策略的動態(tài)描述:誰在什么時(shí)候行動,每次行動有些什么具體行動可供選擇,以及知道些什么。 一、博弈的擴(kuò)展式表述 博弈的擴(kuò)展式表述包括以下要素: ( 1)參與人集合: i=1,2,… n ;此外,將用 N表示虛擬參與人 “ 自然 ” 。 ( 2)參與人的行動順序:誰在什么時(shí)候行動。 ( 3)參與人行動空間:每次行動時(shí),參與人有些什么選擇。 ( 4)參與人的信息集:每次行動時(shí),參與人知道些什么。 ( 5)參與人的支付函數(shù):行動結(jié)束后,參與人得到些什么(支付是所有行動的函數(shù))。 ( 6)外生事件(即自然的選擇)的概率分布。 如同兩人有限策略博弈的策略式表述可用博弈矩陣表述一樣, n人有限策略博弈的擴(kuò)展式表述可用博弈樹表示。 以房地產(chǎn)開發(fā)為例。假定該博弈的行動順序如下 :( 1)開發(fā)商 A先行動,選開發(fā)或不開發(fā);( 2)在 A決策后,自然選擇市場需求的大小;( 3)開發(fā)商 B在觀測到 A的決策和市場需求后,決定開發(fā)或不開發(fā)。其博弈樹如下表。 博弈樹給出了有限博弈的幾乎所有信息,其基本構(gòu)建包括: ( nodes):包括決策結(jié)(上面三個(gè))和終點(diǎn)結(jié)( B的四個(gè)策結(jié))。前者是參與人采取行動的時(shí)點(diǎn),后者是博弈行動路徑的終點(diǎn)。此例中,決策結(jié)包括 1個(gè)空心圓和 6個(gè)實(shí)心圓,終點(diǎn)結(jié)包括對應(yīng) 8個(gè)支付向量的點(diǎn)。 A ?( 4,4) ( 8,0) ( 3,3) ( 1,0) ( 0,8) ( 0,0) ( 0,1) ( 0,0) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) B B B B 大 大 小 小 開發(fā) 不開發(fā) N N ( 1/2) ( 1/2) ( 1/2) ( 1/2) ?? ? ?? ?圖 81 ( branches ):枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動選擇。如 A有兩個(gè)選擇,用 “ 開發(fā) ” 和 “ 不開發(fā) ” 兩個(gè)枝表示。 ( information sets)。博弈樹上的所有決策結(jié)分割成不同的信息集。每個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集滿足下列條件: ( 1)每個(gè)決策結(jié)都是同一參與人的決策結(jié);( 2)該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)。引入信息集的目的在于描述:當(dāng)一個(gè)參與人要作出決策時(shí),他可能并不知道之前發(fā)生的所有事件。 情形 1:圖 81 中,假定 B是在知道 A和自然的選擇后進(jìn)行決策,此時(shí),博弈樹的 7個(gè)決策結(jié)分割成 7個(gè)信息集(每個(gè)信息集只包含一個(gè)決策結(jié)),意味著所有參與人在決策時(shí)準(zhǔn)確地知道自己處于哪一個(gè)決策結(jié)。 情形 2:假定行動順序如前,但 B在決策時(shí)并不確切地知道自然的選擇。此時(shí), B的信息集由原來的 4個(gè)變成 2個(gè), 2個(gè)信息集分別對應(yīng)著 B的兩個(gè)不同決策:若 A開發(fā),自己是否開發(fā);若 A不開發(fā), B是否開發(fā)。用虛線將屬于同一信息集的兩個(gè)決策結(jié)連接起來(圖 82)。 情形 3: B知道自然的選擇,但不知道 A的選擇(如 B和 A同時(shí)決策)。此時(shí), B也有兩個(gè)信息集,每個(gè)信息集包含兩個(gè)決策結(jié):兩處信息集分別對應(yīng)兩種不同的決策:
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1