freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

博弈論的幾個經(jīng)典模型(編輯修改稿)

2024-07-18 08:09 本頁面
 

【文章內容簡介】 任何沒有競爭下的壟斷利潤是很高的 , 假定 A此時每年的壟斷利潤是 10億元 。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 現(xiàn)在假定有另外一個企業(yè) B, 準備從事房地產(chǎn)開發(fā) 。 面對著 B要進入其壟斷的行業(yè) , A想:一旦 B進入 , A的利潤將受損很多 , B最好不要進入 。 所以 A向 B表示 , 你進入的話 , 我將阻撓你進入 。 假定當 B進入時 A阻撓的話 ,A的利潤降低到 2, B的利潤是 1。 而如果 A不阻撓的話 , A的利潤是 4, B的利潤也是 4。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 這樣一個博弈可用下圖表示: 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 B 進入 不進入 A A: 10; B: 0 阻撓 不阻撓 A: 2; B:- 1 A: 4; B: 4 博弈論的幾個經(jīng)典模型 上圖稱之為博弈樹 。 由上圖可見 , 這個博弈由兩階段構成 。 我們稱之為動態(tài)博弈 ,或者兩階段的動態(tài)博弈 。 博弈樹是表示動態(tài)博弈的一個好方法 。 現(xiàn)在讓我們回到房地產(chǎn)開發(fā)商之間的博弈問題 。 A的最好結局是 “ B不進入 ” , 而 B的最好結局是 “ 進入 ” 而 A“ 不阻撓 ” 。 這兩個最好的結局不能構成均衡 。 那么結果是什么呢 ? 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 A向 B發(fā)出威脅:如果你進入 , 我將阻撓 。 而對 B來說 , 如果進入 , A真的阻撓的話 , 它將受損失 1( 假定 1是它的機會成本 ) , 當然此時 A也有損失 。 對于 B來說 , 問題是: A的威脅可臵信嗎 ? B通過分析得出: A的威脅是不可臵信的 。 原因是:當 B進入的時候 , A阻撓的收益是 2, 而不阻撓的收益是 4。 42, 理性人是不會選擇做非理性的事情的 。 也就是說 , 一旦 B進入 , A的最好策略是合作 , 而不是阻撓 。 因此 , 通過分析 , B選擇了進入 , 而 A選擇了合作 。 雙方的收益各為 4。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 在這個博弈中 , B采用的方法為倒推法 , 或者說逆向歸納法 , 即:當參與者作出決策時 ,他要通過對最后階段的分析 , 準確預測對方的行為 , 從而確定自己的行為 。 在這里 , 雙方必須都是理性的 。 如果不滿足這個條件 , 就無法進行分析了 。 這個例子只是簡單的兩階段博弈 , 而三階段或更多階段的博弈 , 可用同樣方法加以分析 。 在動態(tài)博弈中 , 涉及 “ 威脅 ” 與 “ 承諾 ”是不是可信的問題 。 靜態(tài)地看 , 一博弈存在許多均衡 。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 上述 “ 進入 —— 阻撓 ” 問題的博弈樹可用支付矩陣表示: 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 B A 進入 阻撓 阻撓 (2, 1) (10, 0) 不阻撓 (4, 4) (10, 0) 在這個矩陣中 , 納什均衡點有兩個: (合作 , 進入 )和 (阻撓 , 不進入 )。 我們可以驗證 , 在這兩點上誰都不愿意改變策略 。 然而 (阻撓 , 不進入 )這個均衡是達不到的 。 因為這是動態(tài)博弈 , 在這個動態(tài)博弈中 , 存在著先后策略選擇順序 。 博弈論的幾個經(jīng)典模型 這里分析的是完全且完美信息下的動態(tài)博弈。所謂完全信息是指:博弈的支付函數(shù)是“公共知識”。本書中未涉及不完全信息的博弈問題,如囚徒困境這樣的靜態(tài)博弈也是完全信息博弈。完美信息是針對動態(tài)博弈而言的,指參與者知道博弈的所有歷史。 倒推法是動態(tài)博弈中有用的工具,它可以說是理性的人自然的推理方式。然而倒推法面臨著一個困難 ,這就是 蜈蚣博弈 的悖論。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 前面我們分析了 “ 威脅 ” 是否可信 , 我們也可用同樣的思路分析一個 “ 承諾 ” 是否可信 。 —— “ 不首先使用核武器 ” 的承諾可信嗎 ? *子博弈完美納什均衡 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 ? 光天化日之下的違法行為為什么總能成功 ? 人類有許多關于猴子的故事 , 比如朝三暮四 , 殺雞給猴看 。 其實猴子是沒有思維的 ,它們有一定的群體意識 , 但沒有社會意識 , 人們關于它們的故事其實是說人自己的 。 我們這里也講一個猴子的故事 …… 。 在現(xiàn)實社會中 , 竊賊在公共場所比如公共汽車上偷東西時 , 車上的乘客看到了 , 但不敢吭聲 。 沒有被偷的人想 , 反正被偷的待宰猴群的結局人不是我 , 我反抗了 , 我得不到任何好處 ,反而遭到傷害;而不反抗雖不得益 , 但也不受損 , 我何必要反抗呢 ? 這就是光天化日之下的偷竊行為為什么總能成功的原因 。 模型五、信號博弈 /不完全信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 竊賊在偷東西時發(fā)出這樣的信號:如果誰反抗 , 將毆打誰 。 乘客想 , 竊賊的威脅是可信的:因為如果個別乘客反抗 , 而竊賊不毆打該乘客的話 , 就會有更多的乘客抓竊賊 ,竊賊將有可能被抓 , 因此竊賊必然歐打反抗的乘客 。 乘客的策略及可能的支付為:反抗 ,有可能被毆打甚至受傷;不反抗 , 無所得也無所失 。 模型五、信號博弈 /不完全信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 乘客 反抗 不反抗 偷東西 竊賊 竊賊 毆打 不毆打 乘客:受傷 竊賊:可能被抓 , 可能逃脫 乘客:無所得 , 無所失 竊賊:被抓 竊賊 毆打 不毆打 乘客:受傷 竊賊:得到贓物 乘客:無所得 , 無所失 竊賊:得到贓物 博弈論的幾個經(jīng)典模型 對于乘客來說 , 竊賊的威脅是可信的 , 因而乘客的最優(yōu)策略是 “ 不反抗 ” ;而對于竊賊來說 , 乘客 “ 不反抗 ” 下的 “ 不毆打 ” 策略為最憂 。 這一博弈的結果是 , 竊賊偷東西時 “ 乘客不反抗 , 竊賊不敢打 ” , 這是一 “ 子精煉納什均衡 ” 。 這樣一種群體不反抗的結果將使社會風氣惡化 , 偷竊之風盛行 。 對個體來說 , 雖然這一次被偷的不是你 ,但下次你被偷的幾率增加了 。這使得我們都如同待宰的猴子 , 我們不知道什么時候輪到我們自己 。 這樣 , 我們每個人的處境比以前更差 。 模型五、信號博弈 /不完全信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 如何從這種困境中擺脫出來 ? 我們看到 , 使乘客采取 “ 反抗 ” 策略 , 而非“ 不反抗 ” 策略在于加大采取 “ 反抗 ” 策略的獲益 , 而減少不反抗的獲益 。 當 “ 反抗 ”策略下的獲益大于 “ 不反抗 ” 策略下的獲益時 , 乘客就會采取 “ 反抗 ” 的策略 。 加大道德宣傳 , 培養(yǎng)人的道德感可以解決這個囚徒困境 。 模型五、信號博弈 /不完全信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 乘客 反抗 不反抗 偷東西 竊賊 竊賊 毆打 不毆打 乘客:受傷 ,但沒有 道德滿足感 竊賊:可能被抓 , 可能逃脫 乘客:沒有受傷 并有道德 滿足感 竊賊:被抓 竊賊 毆打 不毆打 乘客:受傷 ,并有 道德恥辱感 竊賊:得到贓物 乘客:道德恥 辱感 竊賊:得到贓物 上述博弈過程為: 博弈論的幾個經(jīng)典模型 這樣 , 當小偷偷東西時 , 盡管乘客認為竊賊的威脅是可信的 , 但是如果乘客是道德感強的人 ,那么博弈結果是 “ 乘客反抗 , 小偷毆打 ” ,從而小偷有可能被抓住 , 這也是一 “ 子精煉納什均衡 ” 。 博弈論對不合作的博弈結果的預測是令人悲哀的 。 但是 , 從這個例子我們看到 , 道德就是由群體實施的對所謂 “ 非道德 ” 的行為進行非強制性的懲罰機制 , 而法律及實施法律的國家的形成與改進就是建立一個對所謂 “ 違法行為 ” 實施的中心懲罰機制 。 *精煉貝葉斯納什均衡;混同均衡;分離均衡 模型五、信號博弈 /不完全信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 ? 哪種策略更能贏 ? 假定我們的社會已經(jīng)形成約束行動者的道德規(guī)范 。 如果對不道德的行為不能產(chǎn)生即時的懲罰 , 不道德的行為在社會
點擊復制文檔內容
教學教案相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1