freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

中南財(cái)經(jīng)政法大學(xué)微觀經(jīng)濟(jì)學(xué)精品課件第八章-wenkub

2023-02-01 09:48:06 本頁(yè)面
 

【正文】 ??二、重復(fù)剔除的占優(yōu)策略均衡 在絕大多數(shù)博弈中,并不存在占優(yōu)策略均衡。* ,),(),( iiiiiiiii sss ssussu ???? ???*39。同樣, “ 坦白 ” 也是 B的占優(yōu)策略。警察告訴每個(gè)人,他們的可選擇的策略與支付如下表: 一、占優(yōu)策略 均衡 ? 在該博弈中,每個(gè)囚徒有兩種可能選擇的策略:坦白和抵賴。但在一些特殊博弈中,一個(gè)參與人的最優(yōu)策略選擇可能并不依賴于其他參與人的策略選擇,即無(wú)論其他參與人選擇什么策略,他的最優(yōu)策略是唯一的,這種最優(yōu)策略被稱為 “ 占優(yōu)策略 ”( dominant strategy)。 第二節(jié) 完全信息靜態(tài)博弈 策略式表述給出: ).,2,1(),(:.3 1 nisssu nii ??? ?每個(gè)參與人的支付函數(shù).},。本節(jié)先討論納什均衡的特殊情況,然后討論納什均衡的一般概念。結(jié)論:甲選 1,乙以 3進(jìn)行回應(yīng)。 甲的策略 乙的策略 1 2 3 1 7 8 9 2 6 2 3 3 5 4 0 。乙在行動(dòng)時(shí)會(huì)估計(jì)到甲的行動(dòng),它估計(jì)三種選擇中的最高代價(jià)為策略 1(損失 900萬(wàn)),其次為策略 2(損失600萬(wàn)),最低為策略 3(損失為 500萬(wàn))。即局中人先從支付矩陣中找出其每一種策略下的最大損失,然后從這些最大損失策略中選擇損失最小的策略。,2,1,)(,)( ?? ???? ??1x2x?mx1y2y ny?1111 , gf 1212 , gfnn gf 11 ,2121 , gf11 , mm gf2222 , gf22 , mm gfnn gf 22 ,mnmn gf ,??? ? ? ?? 兩人博弈的支付矩陣 決策問(wèn)題: 假定支付為共同知識(shí),如果甲知道乙采用策略 yj,甲必然采取相應(yīng)策略使自己的收益最大,即: 在甲不知道乙會(huì)采取何種策略時(shí),如果甲是一個(gè)風(fēng)險(xiǎn)規(guī)避者,他將從收益矩陣中找出自己的每一種策略下所能獲得的最小支付,即先求解 , 然后再這些最小收益策略中選擇收益最大的策略。動(dòng)態(tài)博弈是指局中人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。另外,合作博弈強(qiáng)調(diào)的是團(tuán)體理性、效率、公正和公平。若有,就是合作博弈;否則就是非合作博弈。它們關(guān)系是:行動(dòng)是局中人的決策變量;信息是局中人在進(jìn)行博弈時(shí)有關(guān)其他局中人的特征和行動(dòng)的知識(shí);結(jié)果是博弈分析者感興趣的要素的集合;均衡是所有局中人的最優(yōu)策略或行動(dòng)的集合。 ③支付( Payoff)(支付函數(shù)與支付矩陣):博弈論中,可用數(shù)值表示各局中人從博弈中所獲得的收益或效用水平,該數(shù)值稱為支付。 ② 策略或策略空間( Strategy):策略是局中人選擇行動(dòng)的規(guī)則,它規(guī)定局中人如何對(duì)其他人的行動(dòng)作出反應(yīng),即在每種可能的情況下應(yīng)該如何行動(dòng)。博弈論就是描述在這種形勢(shì)下各方理性地選擇自己的行動(dòng)所實(shí)現(xiàn)的結(jié)果,分析各決策主體的行為發(fā)生相互作用時(shí)的決策以及這種決策的均衡問(wèn)題。 博弈論強(qiáng)調(diào)在既定約束條件下追求效用最大化(服從微觀經(jīng)濟(jì)學(xué)的一般分析方法)。 第八章 博弈論 第一節(jié) 博弈論概述 ? 博弈論 (the Game Theory)也就是運(yùn)籌學(xué)中的對(duì)策論 ,“ 是關(guān)于策略相互作用的理論 ” ,研究?jī)蓚€(gè)或兩個(gè)以上參加者在對(duì)抗性或競(jìng)爭(zhēng)性局勢(shì)下如何采取行動(dòng),如何作出有利于己方的決策及其均衡問(wèn)題。 ? 167。 ? 167。 ? 對(duì)策思想最早產(chǎn)生于我國(guó)古代。同時(shí),信息和時(shí)序問(wèn)題成為博弈論的兩個(gè)重要的分析工具。 博弈論的基本概念包括:局中人、策略、支付。它與行動(dòng)不同,行動(dòng)是局中人的決策變量。支付依賴于各個(gè)局中人所作出的策略,這種收益與策略的依賴關(guān)系構(gòu)成了支付函數(shù)。 ① 根據(jù)博弈者選擇的策略,博弈論可劃分為合作博弈與非合作博弈。例如,兩個(gè)寡頭企業(yè),如果他們之間達(dá)成一個(gè)協(xié)議,聯(lián)合最大化壟斷利潤(rùn),且各自按該協(xié)議生產(chǎn),即是合作博弈。非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是無(wú)效率的。 ③從局中人是否具有有關(guān)其他參與人(對(duì)手)的特征、策略空間及支付函數(shù)方面的知識(shí)的角度,可劃分為完全信息博弈 (game of plete information)和不完全信息博弈 (game of inplete information)。即 該方法的合理性是無(wú)論對(duì)方采取何種策略,甲至少可獲得這個(gè)最小值中的最大值, ——最小最大原理。 例: 兩寡頭企業(yè)甲和乙展開(kāi)競(jìng)爭(zhēng),兩者可采用三種經(jīng)營(yíng)策略( 1, 2, 3),且甲在競(jìng)爭(zhēng)中得到的收益恰好等于乙在競(jìng)爭(zhēng)中失去的收益。因此,乙必選代價(jià)最低的策略 3。若甲選 1,則乙選 3;甲選 2,則乙選 2;甲選 3,則乙選 3。甲得 500萬(wàn),乙損失500萬(wàn)。 在博弈論里,一個(gè)博弈可以有兩種表述方式:一種是策略式( strategic form representation)表述,另一種是擴(kuò)展式( extensive form representation )表述。,{ 11 代表策略式博弈可用 nn uussG ???。 例: “ 囚徒困境 ” 囚徒困境是博弈論中的經(jīng)典案例。顯然,無(wú)論同伙選擇什么策略,每個(gè)囚徒的最優(yōu)策略都是“ 坦白 ” 。 B A 坦白 抵賴 坦白 8, 8 0, 10 抵賴 10, 0 1, 1 一般地,稱 對(duì)應(yīng)地,所有的 被稱為 “ 劣策略 ” 。 ii ss ?1 1 1( , , , , , )i i i ns s s s s i? ? ?? 是 之 外 所 有 局 中 人 策 略 合 。但在有些博弈中,仍可應(yīng)用占優(yōu)的邏輯找出均衡。因此,不能用上述占優(yōu)策略找出均衡。 找出上述均衡的思路是:先找出某個(gè)參與人的劣策略(假定存在),把它剔除,重新構(gòu)造一個(gè)不包含已剔除策略的新博弈;然后再剔除新博弈中某個(gè)參與人的劣策略; …… 直至剩下一個(gè)唯一的策略組合。其核心思想是:博弈的理想結(jié)局是,每個(gè)局中人選擇的策略是對(duì)其他局中人所選策略的最佳反應(yīng),其中每一個(gè)局中人都不能因單方面改變自己的策略而獲益。 或表述為: 是下述最大化問(wèn)題的解: *is n isssssus niiiSsiiii,2,1),(m axar g ** 1* 1*1* ??? ?? ???當(dāng)參與人的策略空間很大時(shí),按上述方法檢查每一個(gè)策略組合是不是納什均衡很繁瑣。如在囚徒困境博弈里,(坦白,坦白)是一個(gè)占優(yōu)策略均衡、重復(fù)剔除的占優(yōu)均衡,也是一個(gè)納什均衡;豬智博弈中的(按,等待)是一個(gè)重復(fù)剔除的占優(yōu)均衡,也是一個(gè)納什均衡;但在表 Ⅰ 中的( D, R)是一個(gè)納什均衡,但不是一個(gè)重復(fù)剔除的占優(yōu)均衡(無(wú)法通過(guò)重復(fù)剔除劣策略的辦法找到均衡解)或占優(yōu)策略均衡。 上面將納什均衡定義為一組滿足所有參與人的效用最大化的策略組合。 四、混合策略納什均衡 例二:猜謎游戲(猜硬幣)(支付矩陣如下表)。 這兩個(gè)例子雖然不存在上面所定義的納什均衡,但具有混合策略納什均衡。 定義: ? ????????KikikikikikiKiiiKiinnKksisissSKiuuSSGn11111.1,10,1,)(.),(},{:,},。 ???????????????????????????????)15()1()14())1(0)(1()1)(1(3(),( v LGG015 ????? ??Gv* ?? 問(wèn)題是,解政府的最優(yōu)化問(wèn)題得到的卻是流浪漢的混合策略。 要找出政府的均衡混合策略,需求流浪漢的最優(yōu)化問(wèn)題。即在均衡時(shí),政府以 , ;流浪漢以 ,以 。類似地,假定政府認(rèn)為流浪漢找工作的概率嚴(yán)格大于 ,則政府的唯一最優(yōu)選擇是純策略救濟(jì);但若政府以 1的概率選救濟(jì),流浪漢的最優(yōu)選擇是游蕩。同一博弈里有時(shí)會(huì)出現(xiàn)多個(gè)納什均衡,即一般懷況下不能保證其唯一性 . ? ( 2)有些納什均衡并不合理。 二、將納什均衡應(yīng)用于擴(kuò)展式博弈。 通常用擴(kuò)展式表述分析動(dòng)態(tài)博弈。 ( 2)參與人的行動(dòng)順序:誰(shuí)在什么時(shí)候行動(dòng)。 ( 6)外生事件(即自然的選擇)的概率分布。其博弈樹(shù)如下表。 A ?( 4,4) ( 8,0) ( 3,3) ( 1,0) ( 0,8) ( 0,0) ( 0,1) ( 0,0) 開(kāi)發(fā) 不開(kāi)發(fā) 開(kāi)發(fā) 不開(kāi)發(fā) 開(kāi)發(fā) 不開(kāi)發(fā) 開(kāi)發(fā) 不開(kāi)發(fā) B B B B 大 大 小 小 開(kāi)發(fā) 不開(kāi)發(fā) N N ( 1/2) ( 1/2) ( 1/2) ( 1/2) ?? ? ?? ?圖 81 ( branches ):枝是從一個(gè)決策結(jié)到它的直接后續(xù)
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1