freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

中南財(cái)經(jīng)政法大學(xué)微觀經(jīng)濟(jì)學(xué)精品課件第八章(專業(yè)版)

2025-02-28 09:48上一頁面

下一頁面
  

【正文】 第二,博弈的行動(dòng)有先有后,后行動(dòng)者可觀察到先行動(dòng)者的行為。通常私人信息決定參與人的特征或類型。x( b)子博弈 Ⅰ ( c)子博弈 Ⅱ 以房地產(chǎn)開發(fā)為例說明子博弈精煉納什均衡概念。圖 89。 )(39。因而(不開發(fā), {開發(fā),開發(fā) })是不可置信的。注意:為什么第三列第二行不是納什均衡? 在擴(kuò)展式表述博弈中,所有 n個(gè)參與人的一個(gè)純策略組合 決定了博弈樹上的一個(gè)路徑。 ( 0,0) 不開發(fā) N ?( 4,4) ( 8,0) ( 3,3) ( 1,0) ( 0,8) ( 0,0) ( 0,1) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) B B B B 開發(fā) 開發(fā) 不開發(fā) 大 小 A A ( 1/2) ( 1/2) 不開發(fā) ?? ? ?? ?圖 84 情形 5: A既不知道 N的選擇也不知道 B的選擇,但 B知道 N的選擇(圖 85)。 博弈樹給出了有限博弈的幾乎所有信息,其基本構(gòu)建包括: ( nodes):包括決策結(jié)(上面三個(gè))和終點(diǎn)結(jié)( B的四個(gè)策結(jié))。 三、定義和討論完全信息動(dòng)態(tài)博弈的基本概率 ——子博弈精煉納什均衡及其求解方法。流浪漢的效用函數(shù)為: ?? ??)1,0( ?????????????????3)12()1(3)1())1(03)(1()1(12(),(??????????????? v LGL 最優(yōu)化一階條件為: 0)12( ?????? ??Lv 因此 , 該結(jié)論可解釋為:若 θ ,流浪漢的最優(yōu)選擇是找工作;若θ ,其最優(yōu)選擇是游蕩;只有當(dāng) θ =,他才選擇混合策略 或任何純策略。 兒童 B 正面 反面 兒童 A 正面 1, 1 1, 1 反面 1, 1 1, 1 該博弈是一個(gè)零和博弈,沒有納什均衡。 正式定義: iSs ssuss uissssssissssuuSSGniiiiiiiiniiiininn????????????,),(),(:,),(,),(},。 在一個(gè)博弈里,若所有參與人都有占優(yōu)策略存在,則占優(yōu)策略均衡是可以預(yù)測到的唯一均衡,因?yàn)闆]有一個(gè)理性的參與人會(huì)選擇劣策略。,2,1,:.2)。 ——最大最小原理。 ② 從局中人行動(dòng)的先后順序可劃分為靜態(tài)博弈( Static game)和動(dòng)態(tài)博弈( dynamic game)。如 “ 人不犯我,我不犯人;人若犯我,我必犯人 ” 是一種策略,而“ 犯 ” 與 “ 不犯 ” 是兩種不同的行動(dòng),策略規(guī)定了什么時(shí)候選擇 “ 犯 ” 什么時(shí)候選擇 “ 不犯 ” 。 ? 167。當(dāng)經(jīng)濟(jì)主體間的利益存在沖突時(shí),一方所獲得的利益不僅取決于自己所采取的行動(dòng),而且也取決于其他主體采取的行動(dòng)或?qū)ψ约盒袆?dòng)的反應(yīng)。 一、博弈論的基本概念 合作博弈和非合作博弈的區(qū)別在于人們的行動(dòng)為相互作用時(shí),當(dāng)事人能否達(dá)成一個(gè)具有約束力( binding agreement)的協(xié)議。 類似地,對乙也有: },{m ax 21 mjjjiij ffff ??},m i n { 21 inii fff ?ijnjmiijji ff ????? 11 m i nm a xm i nm a xijminjijij gf ????? 11 m i nm a xm i nm a x 用同樣的方法可導(dǎo)出最大最小原理。納什均衡是完全信息靜態(tài)博弈解的一般概念,也是所有其他類型博弈解的基本要求。即是說,“ 坦白 ” 是 A的占優(yōu)策略。假定大豬知道小豬是理性的,則會(huì)預(yù)測到小豬的選擇;此時(shí),大豬的最優(yōu)選擇只能是 “ 按 ” 。如(抵賴,抵賴)被剔除掉了,故它不是一個(gè)納什均衡,而(坦白,坦白)是一個(gè)納什均衡,故它沒有被剔除掉。 假定政府的混合策略為 σ G=(θ ,1θ )(即政府以 θ 的概率選救濟(jì), 1θ 的概率選不救濟(jì)),流浪漢的混合策略為σ L=(r,1r)(即流浪漢以 r的概率選找工作,以 1r的概率選游蕩)。容易驗(yàn)證 , θ θ 也都不構(gòu)成納什均衡。 ( 4)參與人的信息集:每次行動(dòng)時(shí),參與人知道些什么。 情形 1:圖 81 中,假定 B是在知道 A和自然的選擇后進(jìn)行決策,此時(shí),博弈樹的 7個(gè)決策結(jié)分割成 7個(gè)信息集(每個(gè)信息集只包含一個(gè)決策結(jié)),意味著所有參與人在決策時(shí)準(zhǔn)確地知道自己處于哪一個(gè)決策結(jié)。則博弈的擴(kuò)展式表述如下圖( 86)。它有三個(gè)納什均衡:(開發(fā), {不開發(fā),開發(fā) }),(開發(fā), {不開發(fā),不開發(fā) })和(不開發(fā), {開發(fā),開發(fā) })。因?yàn)闃?gòu)成該均衡的每個(gè)參與人的均衡策略都是合理的。如圖87,決策結(jié) x和它的后續(xù)結(jié)構(gòu)成一個(gè)子博弈,同樣 x’和它的后續(xù)結(jié)也構(gòu)成一個(gè)子博弈。 納什均衡只要求均衡策略在均衡路徑的決策結(jié)上是最優(yōu)的。 例:擴(kuò)展式博弈如下表,要求: ( 1)寫出該博弈的策略式表述; ( 2)找出該博弈的子博弈、納什均衡以及子博弈精煉納什均衡。但進(jìn)入者并不知道在位者是高成本還是低成本,故進(jìn)入者的最優(yōu)選擇依賴于他在多在程度上認(rèn)為在位者是高成本的或低成本的。第二,每個(gè)參與人關(guān)于其他參與人所屬類型的信念,是參與人利用貝葉斯法則從所觀察到其他參與人的行為中得到的。設(shè)在位者有兩種可能的成本函數(shù):高成本或低成本;對應(yīng)兩種成本狀況的不同策略組合及支付矩陣如下表 1: 在位者 高成本 低成本 默許 斗爭 默許 斗爭 進(jìn)入者 進(jìn)入 40, 50 10, 0 30, 80 10, 100 不進(jìn)入 0, 300 0, 300 0, 400 0, 400 進(jìn)入者有關(guān)在位者的成本信息是不完全的,但在位者知道進(jìn)入者的成本函數(shù)。 而納什均衡(開發(fā), {不開發(fā),開發(fā) })中 B的均衡策略 {不開發(fā),開發(fā) }無論是在子博弈( b)上還是在子博弈( c)上都構(gòu)成納什均衡(即若 A開發(fā), B不開發(fā);若 A不開發(fā), B開發(fā)),因此,(開發(fā), {不開發(fā),開發(fā) })是該博弈的唯一子博弈精煉納什均衡。 如何理解 “ 在每一個(gè)子博弈上給出納什均衡 ” ? 若一個(gè)博弈有幾個(gè)子博弈,一個(gè)特定的納什均衡決定了原博弈樹上唯一的一條路徑,即 “ 均衡路徑 ” ,博弈樹上的其他路徑稱為 “ 非均衡路徑 ” 。即只有當(dāng)決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí),該決策結(jié)才能作為一個(gè)子博弈的初始結(jié);若一個(gè)信息集包含兩個(gè)以上的決策結(jié),則無任何一個(gè)決策結(jié)可作為子博弈的初始結(jié)。 Ⅲ. 對于(開發(fā), {不開發(fā),開發(fā) })。復(fù)制圖 86。以房地產(chǎn)開發(fā)博弈為例。每個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集滿足下列條件: ( 1)每個(gè)決策結(jié)都是同一參與人的決策結(jié);( 2)該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)。 ( 2)參與人的行動(dòng)順序:誰在什么時(shí)候行動(dòng)。類似地,假定政府認(rèn)為流浪漢找工作的概率嚴(yán)格大于 ,則政府的唯一最優(yōu)選擇是純策略救濟(jì);但若政府以 1的概率選救濟(jì),流浪漢的最優(yōu)選擇是游蕩。 定義: ? ????????KikikikikikiKiiiKiinnKksisissSKiuuSSGn11111.1,10,1,)(.),(},{:,},。如在囚徒困境博弈里,(坦白,坦白)是一個(gè)占優(yōu)策略均衡、重復(fù)剔除的占優(yōu)均衡,也是一個(gè)納什均衡;豬智博弈中的(按,等待)是一個(gè)重復(fù)剔除的占優(yōu)均衡,也是一個(gè)納什均衡;但在表 Ⅰ 中的( D, R)是一個(gè)納什均衡,但不是一個(gè)重復(fù)剔除的占優(yōu)均衡(無法通過重復(fù)剔除劣策略的辦法找到均衡解)或占優(yōu)策略均衡。因此,不能用上述占優(yōu)策略找出均衡。顯然,無論同伙選擇什么策略,每個(gè)囚徒的最優(yōu)策略都是“ 坦白 ” 。甲得 500萬,乙損失500萬。即 該方法的合理性是無論對方采取何種策略,甲至少可獲得這個(gè)最小值中的最大值, ——最小最大原理。 ① 根據(jù)博弈者選擇的策略,博弈論可劃分為合作博弈與非合作博弈。同時(shí),信息和時(shí)序問題成為博弈論的兩個(gè)重要的分析工具。 第八章 博弈論 第一節(jié) 博弈論概述 ? 博弈論 (the Game Theory)也就是運(yùn)籌學(xué)中的對策論 ,“ 是關(guān)于策略相互作用的理論 ” ,研究兩個(gè)或兩個(gè)以上參加者在對抗性或競爭性局勢下如何采取行動(dòng),如何作出有利于己方的決策及其均衡問題。 ③支付( Payoff)(支付函數(shù)與支付矩陣):博弈論中,可用數(shù)值表示各局中人從博弈中所獲得的收益或效用水平,該數(shù)值稱為支付。動(dòng)態(tài)博弈是指局中人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。 甲的策略 乙的策略 1 2 3 1 7 8 9 2 6 2 3 3 5 4 0 。但在一些特殊博弈中,一個(gè)參與人的最優(yōu)策略選擇可能并不依賴于其他參與人的策略選擇,即無論其他參與人選擇什么策略,他的最優(yōu)策略是唯一的,這種最優(yōu)策略被
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1