freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈論與決策行為講義-資料下載頁

2025-02-09 17:16本頁面
  

【正文】 均衡”。這是對納什均衡概念的第一個最重要的改進,其目的是把動態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開,將那些包含不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給動態(tài)博弈結果一個合理預測。 ? 簡單地說,子博弈精煉納什均衡要求均衡戰(zhàn)略的行為規(guī)則在任何時點上都是最優(yōu)的。 2. 子博弈 ? 定義: 在動態(tài)博弈中,從每一個行動選擇(即一個決策結)開始至博弈結束,構成一個博弈,稱為“子博弈”。 ? 簡單地說,子博弈是原博弈的一部分,它本身可以作為一個獨立的博弈進行分析。 ? 在博弈論中,任何博弈本身為自身的 一個子博弈。 3. 子博弈精煉納什均衡 ? 定義: 如果一個 完全 信息動態(tài)博弈中,各博弈方的策略構成的一個策略組合,在整個動態(tài)博弈及它的所有子博弈中都構成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一個 “子博弈精煉 納什均衡 ”。 ? 子博弈 精煉 納什均衡能夠排除均衡策略中不可置 信的威脅和承諾,因此是真正穩(wěn)定的。 ? 逆推歸納法是求完美信息動態(tài)博弈子博弈 精煉納什均衡的基本方法。 —— 逆推歸納法 ? 逆推歸納 法:從博弈的最后一個階段開始分析 , 每一次確定出所分析階段博弈方的選擇和路徑 , 該階段參與人的最優(yōu)選擇 , 這個最優(yōu)選擇就是該階段的子博弈的納什均衡 。 ? 然后 , 倒回到第二個階段 , 找出倒數(shù)第二個決策者的最優(yōu)選擇 , 這個選擇與第一步的決策者的最優(yōu)選擇構成該階段的子博弈納什均衡 。 ? 如此不斷到初始結 , 每一步得到對應子博弈的一個納什均衡 , 并且根據(jù)定義 , 這個納什均衡一定是該子博弈的所有子博弈的納什均衡 。 在這個過程中的最后一步得到的整個博弈的納什均衡也就是這個博弈的子博弈精煉納什均衡 。 ? 用逆推歸納法求解子博弈精煉納什均衡的過程,實質(zhì)是重復剔除劣戰(zhàn)略過程在擴展式博弈上的擴展:從最后一個決策結開始依次剔除掉每一個子博弈的劣戰(zhàn)略,最后剩下來的戰(zhàn)略構成精煉納什均衡。 ? 由于逆推歸納法確定的各個博弈方在各階段的選擇,都是建立在后續(xù)階段各個博弈方理性選擇的基礎上,因此自然排除了包含有不可置信的威脅或承諾的可能性,因此其結論是比較可靠的,確定的各個博弈方的策略組合是有穩(wěn)定性的。 ? 應該強調(diào)的是,一個精煉均衡首先必須是一個納什均衡,但納什均衡不一定是精煉均衡。只有那些不包含不可置信威脅的納什均衡才是精煉納什均衡。 ? 所謂 “精煉納什均衡 ”就是將納什均衡中包含的不可置信的威脅戰(zhàn)略剔除出去 ? 要求參與人的決策在任何時點上都是最優(yōu)的 ? 由于剔除了不可置信的威脅戰(zhàn)略,在許多情況下,精煉納什均衡也縮小了納什均衡的個數(shù),這一點對預測是非常有意義的。 ? 不可置信威脅引出信息經(jīng)濟學中一個很重要的概念 “承諾行動 ”( mitment)。 ? 承諾行動是當事人使自己的威脅戰(zhàn)略變得可置信的行動。 ? 一種威脅在什么時候才是可置信的?只有當事人在不實施這種威脅時,就會遭受更大的損失時,威脅才是可置信的。 ? 所以,承諾行為就意味著當事人要為自己的諾言付出成本,盡管這種成本不一定真的發(fā)生。 ? 承諾行動會給當事人帶來很大的好處,因為它會改變均衡結果。 不完全信息靜態(tài)博弈:貝葉斯納什均衡 ? 完全信息博弈的基本假設是所有的參與人 對其他參與人的情況(特征、戰(zhàn)略空間、 支付函數(shù) )有完全的了解 。 滿足這個假設的博弈稱為完全信息博弈。 ? 完全信息博弈假設是存在的,但是現(xiàn)實中的許多博弈并不滿足完全信息的需求。 ? 也就是說 ,這個假設在許多情況下是不成立的。 ? 不滿足完全信息假設的博弈稱為不完全信息博弈。 1 海薩尼轉換 ? 在 1967年之前,博弈論專家認為不完全信息博弈是無法分析的。因為當一個參與人不知道他在與誰博弈時,無法選擇自己的戰(zhàn)略。 ? 海薩尼在 19671968年提出了一個處理不完全信息博弈的方法 —— ? 引入一個虛擬參與人“自然”,自然首先行動選擇參與人的類型, 參與人知道自己的 類型 ,其他人不知道。這樣,不完全信息博弈就轉換成完全但不完美信息 博弈 ??梢允褂脴藴实姆治黾夹g進行分析,這就是“海薩尼轉換。 ? 有了 海薩尼 轉換,不完全信息和不完美信息之間的區(qū)別就不重要了。 2 貝葉斯納什均衡 ? 海薩尼 ( Harsanyi)定義了“貝葉斯納什均衡”: ? 貝葉斯均衡是完全信息靜態(tài)博弈納什均衡概念在不完全信息博弈中的擴展: ? 在靜態(tài)不完全信息博弈中,參與人同時行動,沒有機會觀察到其他人的選擇; ? 每個參與人僅知道其他參與人類型的概率分布而不知道其真實類型; ? 他不可能準確地知道其他參與人實際上會選擇什么戰(zhàn)略,但是,他能正確地預測到其他參與人的選擇是如何依賴于其各自的類型的 ? 決策目標就是在給定自己的類型和別人的類型依從戰(zhàn)略的情況下,最大化自己的期望效用。 ? 貝葉斯納什均衡就是:給定自己的類型和別人類型的概率分布的情況下,每個參與人的期望效用達到了最大化。 ? 貝葉斯納什均衡 ,與完全信息靜態(tài)博弈中的納什均衡一樣:每一個參與人的戰(zhàn)略必須是其他參與人戰(zhàn)略的最優(yōu)反應。 不完全信息動態(tài)博弈: 精煉貝葉斯納什均衡 ? 1 不完全信息動態(tài)博弈 ? 在不完全信息動態(tài)博弈中, “ 自然 ” 首先選擇參與人的類型,參與人自己知道,其他參與人不知道。 ? 在自然選擇后,參與人開始行動。由于行動有先后次序,后行動者可以觀察到先行動者的行動。 ? 雖然參與人不能直接觀測其他參與人的類型,但因為參與人的行動是類型依存的,每個參與人的行動都傳遞著有關自己類型的某種信息,后行動者可以通過觀察先行動者所選擇的行動獲得有關后者偏好、戰(zhàn)略空間等方面的信息,修正自己對其所屬類型的先驗概率判斷,然后選擇自己的行動。 ? 先行動者可以理性的預期到自己的行動將被后行動者所利用,就會設法傳遞對自己最有利的信息,而避免傳遞對自己不利的信息。 ? 因此,博弈過程不僅是參與人選擇行動的過程,而且是參與人不斷修正信念的過程。 ? 精煉貝葉斯均衡的要點是:當事人要根據(jù)所觀察到的他人的行為來修正自己關于后者類型的 “信念 ”(主觀概率),并由此選擇自己的行動。這里,修正過程使用的是貝葉斯規(guī)則 。 2 精煉貝葉斯均衡 ? 精煉貝葉斯均衡,是對應于不完全信息動態(tài)博弈的均衡概念,是澤爾騰完全信息動態(tài)博弈子博弈精煉納什均衡和海薩尼不完全信息靜態(tài)博弈貝葉斯均衡的結合。 ? 精煉貝葉斯均衡是所有參與人戰(zhàn)略和信息的一種組合 。 它滿足如下條件: 給定每個人有關其他人類型的信念的情況下,他的戰(zhàn)略選擇是最優(yōu)的; 每個人有關他人類型的信念都是使用貝葉斯法則從所觀察到的行為中獲得的 。 ? 與其它均衡概念不同,精煉貝葉斯均衡不能僅定義在戰(zhàn)略組合上,它必須同時說明參與人的信念,因為最優(yōu)戰(zhàn)略是相對于信念而言的。 3 貝葉斯法則 ? 貝葉斯法則:就是人們根據(jù)觀察到的現(xiàn)象對有關概率分布的主觀判斷進行修正的一種標準方法。 ? 在日常生活中,當面臨不確定性時,我們對某種事件發(fā)生的可能性有一個判斷。然后,我們會根據(jù)新的信息來修正這個判斷。統(tǒng)計學上,修正之前的判斷稱為“先驗概率”,修正后的判斷稱為“后驗概率”。貝葉斯法則就是人們根據(jù)新的信息從先驗概率得到后驗概率的基本方法。 例子 ? “市場進入”博弈 ? 成語:黔驢技窮 ? 不完全信息動態(tài)博弈的精煉貝葉斯均衡:就是根據(jù)參與人行動傳遞的信息,判斷其是什么類型的人,同時修正以前的判斷,然后再采取行動。 ? 在不完全信息動態(tài)博弈中,參與人所采取的行動具有傳遞信息的作用。 ? 傳遞信息的行為是需要成本的 ? 傳遞信息支付的成本是信息的不完全性造成的。 ? 精煉貝葉斯均衡的一個重要的應用是:“信息傳遞模型”。 本章小結 ? 復習題 博弈論 納什均衡 海薩尼轉換 貝葉斯納什均衡 精煉貝葉斯納什均衡 貝葉斯法則 2. 博弈的分類及對應的均衡概念。 演講完畢,謝謝觀看!
點擊復制文檔內(nèi)容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1