freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

中南財(cái)經(jīng)政法大學(xué)微觀經(jīng)濟(jì)學(xué)精品課件第八章-預(yù)覽頁(yè)

 

【正文】 ,其中的第一項(xiàng)和第二項(xiàng)表示甲和乙在其對(duì)應(yīng)策略下可獲得的支付或收益,如 f11和 g11 ,局中人的目標(biāo)是選擇使自己的收益最大化的策略。局中人按該原則所確定的策略叫做穩(wěn)妥策略。甲的報(bào)償矩陣如下表: 甲的策略 乙的策略 1 2 3 1 7 8 9 2 6 2 3 3 5 4 0 。 ——最大最小原理。甲必在收益最小值中選最大值。 “完全信息 ” 指的是每個(gè)局中人對(duì)所有其他參與人的特征(策略空間、支付函數(shù)等)有完全的了解, “ 靜態(tài) ” 指的是所有局中人同時(shí)選擇行動(dòng)且只選擇一次。前者適合于討論靜態(tài)博弈,后者適合于討論動(dòng)態(tài)博弈。,2,1,:.2)。該故事講的是,兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的房間里進(jìn)行審訊。如, B選擇坦白,若 A選擇坦白時(shí)支付為 8,選擇抵賴(lài)時(shí)支付為 10,因而坦白比抵賴(lài)好;若 B選擇抵賴(lài), A坦白時(shí)的支付為 0,抵賴(lài)時(shí)為 1,因而坦白比抵賴(lài)好。注意:這里 若對(duì)應(yīng)所有的占優(yōu)策略嚴(yán)格的為局中人 ,is i )(*:, * 即的嚴(yán)格最優(yōu)策略是 i ss ii?*39。 在一個(gè)博弈里,若所有參與人都有占優(yōu)策略存在,則占優(yōu)策略均衡是可以預(yù)測(cè)到的唯一均衡,因?yàn)闆](méi)有一個(gè)理性的參與人會(huì)選擇劣策略。 案例: “ 豬智博弈 ” 豬圈里有兩頭豬(大豬和小豬),豬圈一頭有一豬食槽 ,另一頭安裝著一個(gè)按制豬食供應(yīng)的按鈕,按一下鈕,有 8個(gè)單位的豬食進(jìn)槽,但需 2個(gè)單位的成本。 可能的均衡是什么呢?若小豬是理性的,他只會(huì)選 “ 等待 ” ,因?yàn)?“ 等待 ” 嚴(yán)格優(yōu)于 “ 按 ” 。該策略組合就是博弈的均衡解,稱(chēng)為 “ 重復(fù)剔除的占優(yōu)策略均衡 ” 。 正式定義: iSs ssuss uissssssissssuuSSGniiiiiiiiniiiininn????????????,),(),(:,),(,),(},。在兩人博弈中,有一簡(jiǎn)單的方法。 ( 2)納什均衡一定是在重復(fù)剔除嚴(yán)格劣策略過(guò)程中沒(méi)有被剔除掉的策略組合,但沒(méi)有被剔除掉的策略組合不一定是納什均衡,除非它是唯一的。即 是一個(gè)納什均衡,當(dāng)且僅當(dāng)對(duì)所有的 , 根據(jù)該定義,有些博弈不存在納什均衡。 兒童 B 正面 反面 兒童 A 正面 1, 1 1, 1 反面 1, 1 1, 1 該博弈是一個(gè)零和博弈,沒(méi)有納什均衡。 純策略和混合策略納什均衡 : 如果一個(gè)策略規(guī)定參與人在每一個(gè)給定的信息情況下下只選擇一種特定的行動(dòng),則稱(chēng)該策略為純策略。,{????????????對(duì)于所有的的概率選是的一個(gè)混合策略稱(chēng)為布則概率分個(gè)純策略有假定參與人中博弈個(gè)參與人的策略式表述在?? ?? ??????).(,),(),( 1???????iiini iii ii代表混合策略組合空間而的一個(gè)混合策略為其中代表混合策略組合的混合策略空間代表用 ??? ?? ?????????Ssnjijjiiiniiiiiiisusv iivv1111)())((),(:,),([),()(???????????它可被定義為策略組合混合之外所有其他參與人的是除的期望效用函數(shù)表示參與人用?? 社會(huì)福利博弈的支付矩陣 流浪漢 找工作 游蕩 政府 救濟(jì) 3, 2 1, 3 不救濟(jì) 1, 1 0, 0 以社會(huì)福利博弈為例求解混合策略納什均衡。對(duì)此的可作如下解釋?zhuān)菏紫燃俣ㄗ顑?yōu)混合策略是存在的。流浪漢的效用函數(shù)為: ?? ??)1,0( ?????????????????3)12()1(3)1())1(03)(1()1(12(),(??????????????? v LGL 最優(yōu)化一階條件為: 0)12( ?????? ??Lv 因此 , 該結(jié)論可解釋為:若 θ ,流浪漢的最優(yōu)選擇是找工作;若θ ,其最優(yōu)選擇是游蕩;只有當(dāng) θ =,他才選擇混合策略 或任何純策略。 從反面進(jìn)行說(shuō)明。因此, r。 女 足球 芭蕾 男 足球 2, 1 0, 0 芭蕾 0, 0 1, 2 如在 “ 性別戰(zhàn) ” 博弈中,有兩個(gè)純策略納什均衡:(足球,足球),(芭蕾,芭蕾)。 三、定義和討論完全信息動(dòng)態(tài)博弈的基本概率 ——子博弈精煉納什均衡及其求解方法。博弈的擴(kuò)展式表述“ 擴(kuò)展 ” 的主要是參與人的策略空間。 ( 3)參與人行動(dòng)空間:每次行動(dòng)時(shí),參與人有些什么選擇。 如同兩人有限策略博弈的策略式表述可用博弈矩陣表述一樣, n人有限策略博弈的擴(kuò)展式表述可用博弈樹(shù)表示。 博弈樹(shù)給出了有限博弈的幾乎所有信息,其基本構(gòu)建包括: ( nodes):包括決策結(jié)(上面三個(gè))和終點(diǎn)結(jié)( B的四個(gè)策結(jié))。如 A有兩個(gè)選擇,用 “ 開(kāi)發(fā) ” 和 “ 不開(kāi)發(fā) ” 兩個(gè)枝表示。引入信息集的目的在于描述:當(dāng)一個(gè)參與人要作出決策時(shí),他可能并不知道之前發(fā)生的所有事件。用虛線將屬于同一信息集的兩個(gè)決策結(jié)連接起來(lái)(圖 82)。 ( 0,0) 不開(kāi)發(fā) N ?( 4,4) ( 8,0) ( 3,3) ( 1,0) ( 0,8) ( 0,0) ( 0,1) 開(kāi)發(fā) 不開(kāi)發(fā) 開(kāi)發(fā) 不開(kāi)發(fā) 開(kāi)發(fā) 不開(kāi)發(fā) 開(kāi)發(fā) B B B B 開(kāi)發(fā) 開(kāi)發(fā) 不開(kāi)發(fā) 大 小 A A ( 1/2) ( 1/2) 不開(kāi)發(fā) ?? ? ?? ?圖 84 情形 5: A既不知道 N的選擇也不知道 B的選擇,但 B知道 N的選擇(圖 85)。 另外,擴(kuò)展式表述也可用來(lái)描述靜態(tài)博弈。假定博弈開(kāi)始之前自然就選擇了 “ 低需求 ” ,且已成為共同信息; A先決策, B在觀測(cè)到 A的選擇后再?zèng)Q策。若將 B的信息集從左到右排列,上述策略可寫(xiě)成: {開(kāi)發(fā),開(kāi)發(fā) }, {開(kāi)發(fā),不開(kāi)發(fā) }, {不開(kāi)發(fā),開(kāi)發(fā) }, {不開(kāi)發(fā),不開(kāi)發(fā) }(如下表)。注意:為什么第三列第二行不是納什均衡? 在擴(kuò)展式表述博弈中,所有 n個(gè)參與人的一個(gè)純策略組合 決定了博弈樹(shù)上的一個(gè)路徑。這樣,納什均衡就很難說(shuō)是動(dòng)態(tài)博弈的一個(gè)合理解,因?yàn)?,在?dòng)態(tài)博弈中,參與人的選擇有先有后,后行動(dòng)者的選擇空間依賴(lài)于先行動(dòng)者的選擇,而先行動(dòng)者在選擇自己的行動(dòng)時(shí)不能不考慮自己的選擇對(duì)后行動(dòng)者的影響。該博弈為一完美信息博弈, A先行動(dòng), B在知道 A的選擇后再行動(dòng)。該組合構(gòu)成一納什均衡,是因?yàn)?B威脅不論 A是否選擇開(kāi)發(fā),自己都將選擇開(kāi)發(fā); A相信了 B的威脅,不開(kāi)發(fā)是其最優(yōu)選擇。因而(不開(kāi)發(fā), {開(kāi)發(fā),開(kāi)發(fā) })是不可置信的。若 A選開(kāi)發(fā), B的信息集是 x ,最優(yōu)選擇是不開(kāi)發(fā)。這是一個(gè)合理的均衡。均衡結(jié)果是 A選開(kāi)發(fā), B選不開(kāi)發(fā),支付為( 1,0)。 )(39。 xhx ?)(39。顯然,一個(gè)完美信息博弈的每一個(gè)決策結(jié)都開(kāi)始一個(gè)子博弈。x( a )原博弈 ( 3,3) ( 1,0) 開(kāi)發(fā) 不開(kāi)發(fā) ? x( 0,1) ( 0,0) 開(kāi)發(fā) 不開(kāi)發(fā) ?39。圖 89。如圖 89,若從參與人 2的左邊開(kāi)始一個(gè)子博弈,則 參與人 3的信息集就由原來(lái)的 3個(gè)決策結(jié)變成 2個(gè)決策結(jié),他在子博弈中的選擇就不同于原博弈中的選擇。 ),( ***1* ni ssss ??? 如在圖 86中, “ A→ 不開(kāi)發(fā) → x’→B→ 開(kāi)發(fā)( 0, 1) ” 是納什均衡(不開(kāi)發(fā), {開(kāi)發(fā),開(kāi)發(fā) })的均衡路徑,其他路徑都是該納什均衡的非均衡路徑。這里的要點(diǎn)是,只有當(dāng)一個(gè)策略規(guī)定的行動(dòng)規(guī)則在所有可能的情況下都是最優(yōu)的時(shí),它才是一個(gè)合理的、可置信的策略。x( b)子博弈 Ⅰ ( c)子博弈 Ⅱ 以房地產(chǎn)開(kāi)發(fā)為例說(shuō)明子博弈精煉納什均衡概念。 在子博弈( b), B的最優(yōu)策略是不開(kāi)發(fā);在子博弈( c), B的最優(yōu)策略是開(kāi)發(fā)。也就有理由相信, “ A開(kāi)發(fā) B不開(kāi)發(fā) ” 是這個(gè)博弈唯一合理的均衡結(jié)果。滿足該假設(shè)的博弈稱(chēng)為 “ 完全信息博弈 ” 。通常私人信息決定參與人的特征或類(lèi)型。它是一種類(lèi)型依賴(lài)型策略組合,在給定自己的類(lèi)型和其他參與人類(lèi)型的分布概率的條件下,這種策略組合使得每個(gè)參與人的期望效用最大化。在完全信息下,若在位者是高成本,進(jìn)入者的最優(yōu)選擇是進(jìn)入;若在位者是低成本,進(jìn)入者的最優(yōu)選擇是不進(jìn)入。因 此, 進(jìn)入者的最優(yōu)選擇是:若 ,進(jìn)入;若 ,不進(jìn)入(當(dāng) 時(shí),進(jìn)入者進(jìn)入與不進(jìn)入無(wú)差異,可假定它進(jìn)入)。第二,博弈的行動(dòng)有先有后,后行動(dòng)者可觀察到先行動(dòng)者的行為。標(biāo)準(zhǔn)的貝葉斯公式為: P ( A | B ) P ( A )P ( A | B )P ( B )= 對(duì)應(yīng)于不完全信息動(dòng)態(tài)博弈的均衡概念是精煉貝葉斯均衡。
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1