freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

《完全信息動態(tài)博弈》ppt課件-文庫吧

2025-01-02 07:41 本頁面


【正文】 個納什均衡,但納什均衡不一定是精練納什均衡。 ? 承諾行動 當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動。 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) ? 澤爾騰引入子博弈精練納什均衡的概念的目的是 將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果 ,簡單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。 子博弈精練納什均衡 ? 澤爾騰引入子博弈精練納什均衡的概念的目的是 將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果 ? 子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) ? 子博弈: 是原博弈的一部分,它本身也可以作為一個獨(dú)立的博弈進(jìn)行分析: ? ( 1)子博弈必須從一個單結(jié)信息點(diǎn)開始:只有決策者在原博弈中確切地知道博弈進(jìn)入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的初始結(jié)。 如果信息集包含兩個以上的決策結(jié),則這兩個都不可以作為子博弈的初始結(jié)(見下頁)。 ? ( 2)子博弈的信息集和支付向量都直接繼承自原博弈,即當(dāng) x’和 x’’在原博弈中屬于同一信息集時,他們在子博弈中才屬于同一信息集。 ? 習(xí)慣上,任何博弈的本身稱為自身的一個子博弈。 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) ? 子博弈精練納什均衡: 擴(kuò)展式博弈的戰(zhàn)略組合是一個子博弈精練納什均衡,如果 : ? ( 1)它是原博弈的納什均衡; ? ( 2)它在每一個子博弈上給出納什均衡。 A 開發(fā) 不開發(fā) B B 開發(fā) 不開發(fā) 開發(fā) (1, 0) ( 0, 1) (0,0) (3,3) x x’ 房地產(chǎn)開發(fā)博弈 開發(fā) 不開發(fā) (1, 0) (3,3) x 開發(fā) ( 0, 1) (0,0) x’ 子博弈 I 子博弈 II (不開發(fā),(開發(fā),開發(fā))), (開發(fā),(不開發(fā),開發(fā)) ,(開發(fā),(不開發(fā),不開發(fā))) 在 c上構(gòu)成均衡,在 b上不構(gòu)成; 在 b和 c上都構(gòu)成 在 c上構(gòu)成均衡,在 b上不構(gòu)成 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) 不開發(fā) 判斷下列均衡結(jié)果哪個構(gòu)成子博弈精練納什均衡? 不開發(fā) b c 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) ? 如果一個博弈有幾個子博弈,一個特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為 “ 均衡路徑 ” ,博弈樹上的其他路徑稱為 “ 非均衡路徑 ” 。 ? 納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的 ; ? 而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實(shí)質(zhì)區(qū)別。 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) ? 戰(zhàn)略是參與人行動規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下(即每一個決策結(jié))上選擇什么行動,即使這種情況實(shí)際上沒有發(fā)生(甚至參與人并不預(yù)期它會發(fā)生)。 ? 因此,只有當(dāng)一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個合理的可置信的戰(zhàn)略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。 用逆向歸納法求 子博弈精練納什均衡 1 U D L ( 3, 1) (0,0) 2 2, 2 R 給定博弈達(dá)到最后一個決策結(jié),該決策結(jié)上行動的參與人有一個最優(yōu)選擇,這個最優(yōu)選擇即該決策結(jié)開始的子博弈的納什均衡 倒數(shù)第二個決策結(jié),找倒數(shù)第二個的最優(yōu)選擇,這個最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇構(gòu)成一個納什均衡。 用逆向歸納法求 子博弈精練納什均衡 1 U D L ( 3, 1) (0,0) 2 2, 2 R 如此重復(fù)直到初始結(jié)。每一步都得到對應(yīng)于子博弈的一個納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個過程的最后一步得到整個博弈的納什均衡 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) ? 用逆向歸納法求子博弈精練納什均衡 對于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個最簡便的方法。 A 開發(fā) 不開發(fā) B B 開發(fā) 不開發(fā) 開發(fā) (1, 0) ( 0, 1) (0,0) (3,3) x x’ 房地產(chǎn)開發(fā)博弈 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) 1 U D L ( 1, 1) 2 2, 0 R U’ ( 3, 0) (0,2) 2 D’ 子博弈精練納什均衡( ( U, U’), L) . U’和 L分別是參與人 1和參與人 2在非均衡路徑上的選擇。 逆向歸納法求解子博弈精練納什均衡的過程, 實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個決策結(jié)依次剔除每個子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精練納什均衡。 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) ? 用逆向歸納法求解的子博弈精練納什均衡也要求 “ 所有的參與人是理性的 ” 是共同知識。 ? 如果博弈由多個階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。 完全信息動態(tài)博弈 子博弈精練納什均衡 澤爾騰( 1965) 進(jìn)入者 進(jìn)入 不進(jìn)入( 0, 300) 在位者 市場進(jìn)入阻撓博弈樹 不可置信威脅 收益函數(shù) 行動 合作( 40, 50) 斗爭( 10, 0) 承諾行動與子博弈精練納什均衡 ? 承諾行動與子博弈精練納什均衡 ? 有些戰(zhàn)略之所以不是精練納什均衡 ,是因?yàn)樗瞬豢芍眯诺耐{戰(zhàn)略 ,如果參與人能在博弈之前采取某種行動改變自己的行動空間或支付函數(shù),原來不可置信威脅將變得可置信 ,博弈的精練納什均衡也會隨之改變 . 承諾行動與子博弈精練納什均衡 ? 這些改變博弈結(jié)果而采取的措施稱為承諾行動 . ? 完全承諾 :承諾可以使某項(xiàng)行動完全沒有可能(破釜沉舟 ). ? 不完全承諾 :承諾只是增加了某個行動的成本而不是使該活動完全沒有可能 . 承諾行動與子博弈精練納什均衡 A 開發(fā) 不開發(fā) B B 開發(fā) 不開發(fā) 開發(fā) (1, 0) ( 0, 1) (0,0) (3,3) x x’ 房地產(chǎn)開發(fā)博弈 如果在 A決策之前 ,B與某客戶簽定了一個合同 ,規(guī)定 B若不在特定時期內(nèi)開發(fā)若干面積的寫字樓 ,則將支付違約金 ,這個合同就是承諾行動 . (1,) 承諾行動與子博弈精練納什均衡 ? 經(jīng)常有這樣的情況,非理性 通常是自動的而不是策略性的 是一個優(yōu)勢。 ? 在電影 《 怪愛博士 》 中的末日機(jī)器就是一個例子。前蘇聯(lián)認(rèn)為不可能在一場理性的軍備競賽中超過更富有的美國,所以, 他制造了一顆炸彈,如果任何人引爆了這顆炸彈,它將自動炸毀整個世界。著部電影描述了這樣一個細(xì)節(jié),你必須告訴對方你有這么一個末日機(jī)器。 ? 據(jù)說前美國總統(tǒng)尼克松曾告訴他的副手哈德蔓,他對這個策略更復(fù)雜的看法:我稱為瘋子理論,我要讓北越相信我已經(jīng)到了無論付出多少都要結(jié)束戰(zhàn)爭的地步,我們只要他聽到這樣的傳聞: “ 看在上帝的份上,尼克松已經(jīng)被共產(chǎn)黨搞瘋了,當(dāng)他生氣的時候,我們沒法制止他,他的手已經(jīng)按在核按紐上了。 ” 胡志明兩天之后會到巴黎求和的。 重復(fù)博弈 其他參與人過去的歷史總是可以觀測到的 一個參與人可以使自己在某個階段博弈的選擇依賴于其他參與人過去的行動歷史 參與人在重復(fù)博弈中的戰(zhàn)略空間遠(yuǎn)遠(yuǎn)大于和復(fù)雜于每一階段的戰(zhàn)略空間 重復(fù)博弈可能帶來一些“額外”的均衡結(jié)果。 重復(fù)博弈 影響重復(fù)博弈均衡結(jié)果的主要因素是 博弈重復(fù)的次數(shù)和信息的完備性 。 博弈重復(fù)的次數(shù) 的重要性來源于參與人在短期利益和長遠(yuǎn)利益之間的權(quán)衡。 信息的完備性 :當(dāng)一個參與人的支付函數(shù)不為其他參與人知道時,該參與人可能有積極性建立一個“好”的聲譽(yù)以換取長遠(yuǎn)利益。 重復(fù)博弈和無名氏定理 ? 有限次重復(fù)博弈 — 連鎖店悖論 進(jìn)入者 進(jìn)入 不進(jìn)入 在位者 默許 斗爭 默許 (10, 0) ( 0, 300) (0,300) (40,50) x x’ 在位者 斗爭 假定同樣的市場上有 20個(可以理解為在位者有 20個連鎖店),進(jìn)入者每次進(jìn)入一個市場,博弈就編程了 20次重復(fù)博弈。 假定進(jìn)入者進(jìn)入第1個市場,在位者應(yīng)該如何反應(yīng)呢? 重復(fù)博弈和無名氏定理 ? 這個博弈的納什均衡是什么? ? 假定博弈共進(jìn)行 10次,結(jié)果會如何? ? 為什么會出現(xiàn)這個結(jié)果? ? 倒推論證法 假定現(xiàn)在是第十次,結(jié)果和一次博弈一樣。第九次,即倒數(shù)第二次,局中人已經(jīng)很清楚,最后一次博弈對方肯定要實(shí)行低價,因此,現(xiàn)在如何對他施行好心都不會在下一次得到好報(bào),所以,理性人的 “ 我 ” 沒有理由實(shí)施高價使對方獲益。依次類推。 3, 3 6, 1 1, 6 5, 5 高價 企業(yè)乙 企業(yè)甲 低價 高價 低價 價格大戰(zhàn)中的囚徒困境 重復(fù)博弈 ? 無限次重復(fù)博弈 ? 囚徒困境博弈重復(fù)無窮次,結(jié)果如何? ? 證明得出,如果參與人有足夠的耐心,(抵賴,抵賴) 是一個子博弈精練納
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1