freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

博弈論的幾個經(jīng)典模型-文庫吧資料

2025-06-27 08:09本頁面
  

【正文】 毆打 不毆打 乘客:受傷 ,并有 道德恥辱感 竊賊:得到贓物 乘客:道德恥 辱感 竊賊:得到贓物 上述博弈過程為: 博弈論的幾個經(jīng)典模型 這樣 , 當小偷偷東西時 , 盡管乘客認為竊賊的威脅是可信的 , 但是如果乘客是道德感強的人 ,那么博弈結果是 “ 乘客反抗 , 小偷毆打 ” ,從而小偷有可能被抓住 , 這也是一 “ 子精煉納什均衡 ” 。 當 “ 反抗 ”策略下的獲益大于 “ 不反抗 ” 策略下的獲益時 , 乘客就會采取 “ 反抗 ” 的策略 。 這樣 , 我們每個人的處境比以前更差 。 對個體來說 , 雖然這一次被偷的不是你 ,但下次你被偷的幾率增加了 。 這一博弈的結果是 , 竊賊偷東西時 “ 乘客不反抗 , 竊賊不敢打 ” , 這是一 “ 子精煉納什均衡 ” 。 乘客的策略及可能的支付為:反抗 ,有可能被毆打甚至受傷;不反抗 , 無所得也無所失 。 模型五、信號博弈 /不完全信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 竊賊在偷東西時發(fā)出這樣的信號:如果誰反抗 , 將毆打誰 。 在現(xiàn)實社會中 , 竊賊在公共場所比如公共汽車上偷東西時 , 車上的乘客看到了 , 但不敢吭聲 。 其實猴子是沒有思維的 ,它們有一定的群體意識 , 但沒有社會意識 , 人們關于它們的故事其實是說人自己的 。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 前面我們分析了 “ 威脅 ” 是否可信 , 我們也可用同樣的思路分析一個 “ 承諾 ” 是否可信 。 倒推法是動態(tài)博弈中有用的工具,它可以說是理性的人自然的推理方式。本書中未涉及不完全信息的博弈問題,如囚徒困境這樣的靜態(tài)博弈也是完全信息博弈。 博弈論的幾個經(jīng)典模型 這里分析的是完全且完美信息下的動態(tài)博弈。 然而 (阻撓 , 不進入 )這個均衡是達不到的 。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 上述 “ 進入 —— 阻撓 ” 問題的博弈樹可用支付矩陣表示: 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 B A 進入 阻撓 阻撓 (2, 1) (10, 0) 不阻撓 (4, 4) (10, 0) 在這個矩陣中 , 納什均衡點有兩個: (合作 , 進入 )和 (阻撓 , 不進入 )。 在動態(tài)博弈中 , 涉及 “ 威脅 ” 與 “ 承諾 ”是不是可信的問題 。 如果不滿足這個條件 , 就無法進行分析了 。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 在這個博弈中 , B采用的方法為倒推法 , 或者說逆向歸納法 , 即:當參與者作出決策時 ,他要通過對最后階段的分析 , 準確預測對方的行為 , 從而確定自己的行為 。 因此 , 通過分析 , B選擇了進入 , 而 A選擇了合作 。 42, 理性人是不會選擇做非理性的事情的 。 對于 B來說 , 問題是: A的威脅可臵信嗎 ? B通過分析得出: A的威脅是不可臵信的 。 那么結果是什么呢 ? 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 A向 B發(fā)出威脅:如果你進入 , 我將阻撓 。 A的最好結局是 “ B不進入 ” , 而 B的最好結局是 “ 進入 ” 而 A“ 不阻撓 ” 。 博弈樹是表示動態(tài)博弈的一個好方法 。 由上圖可見 , 這個博弈由兩階段構成 。 而如果 A不阻撓的話 , A的利潤是 4, B的利潤也是 4。 所以 A向 B表示 , 你進入的話 , 我將阻撓你進入 。 模型四、 Stackelberg雙寡頭競爭模型 /完全且完美信息動態(tài)博弈 博弈論的幾個經(jīng)典模型 現(xiàn)在假定有另外一個企業(yè) B, 準備從事房地產開發(fā) 。 那么什么是倒推法 ? 要理解什么是倒推法 , 先來看一下商界里經(jīng)常見到的博弈 。 而分析 “ 威脅 ” 或 “ 承諾 ” 是可臵信的還是不可臵信的方法是倒推法 。 在國際核武器問題上 ,我國及其他一些國家承諾 “ 不首先使用核武器 ” 就是一種言語承諾 。 用本例來說 , 公共知識不僅意味著 B企業(yè)知道 A企業(yè)高阻撓成本與低阻撓成本的分布概率 , 而且意味著 A也清楚 B知道這一概率 。 博弈論的幾個經(jīng)典模型 按照海薩尼的方法 , 所有參與人的真實類型都是給定的 。 模型三、獨立私人價值下的一級密封拍賣 /不完全信息靜態(tài)博弈 博弈論的幾個經(jīng)典模型 海薩尼轉換后的市場進入博弈: 模型三、獨立私人價值下的一級密封拍賣 /不完全信息靜態(tài)博弈 A B 高成本 低成本 默許 阻撓 默許 阻撓 進入 (40,50) (10,0) (30,100) (10,140) 不進入 (0,300) (0,300) (0,400) (0,400) 顯然 , 在這里 , B所遇到的 , 是不確定性條件下的選擇問題 。 在本例中 , 阻撓成本就是 A的私人信息 。 這里 , 某一參與人本人知道 、 其他參與人則不知道的信息稱為私人信息 。 如果阻撓的成本高 , 那么 , 正如下表前兩列所表示的 , A企業(yè)的占優(yōu)戰(zhàn)略是默許 B進入 , 博弈有重復剔除的占優(yōu)戰(zhàn)略均衡 —— A默許 ,B進入 。 B企業(yè)知道 , A企業(yè)是否允許它進入 , 取決于 A企業(yè)阻撓 B企業(yè)進入所花費的成本 。 模型三、獨立私人價值下的一級密封拍賣 /不完全信息靜態(tài)博弈 博弈論的幾個經(jīng)典模型 ? 經(jīng)典案例解析 例:某一市場原來被 A企業(yè)所壟斷 。 不完全信息意味著博弈各方中至少有一個參與人有多個類型 。 模型三、獨立私人價值下的一級密封拍賣 /不完全信息靜態(tài)博弈 t12( , , , )nt t t t?12( , , , , )i i iA a a a ti iA博弈論的幾個經(jīng)典模型 ? 海薩尼轉換分析 海薩尼轉換是處理不完全信息博弈的標準方法 。 模型三、獨立私人價值下的一級密封拍賣 /不完全信息靜態(tài)博弈 博弈論的幾個經(jīng)典模型 ? 海薩尼轉換的具體方法 ?一個虛擬的參與人 “ 自然 ” ,自然首先決定參與人的類型 , 賦予各參與人的類型向量 , 其中 ; ?自然告知參與者自己的類型 , 卻不告訴其他參與者的類型; ?參與者同時選擇行動 ,每一參與者 從可行集 中選擇行動方案 ; ?各方得到收益 。 這種方法將不完全信息靜態(tài)博弈變成一個兩階段動態(tài)博弈 , 第一個階段是自然 N的行動選擇 , 第二階段是除 N外的局中人的靜態(tài)博弈 。自然首先行動 , 它決定每個局中人的特征 。不過,如果最后信封內的錢不足250元,就統(tǒng)統(tǒng)沒收,大家拿不到半毛錢。 他們將一個大信封拿出來,請在場的43位專家拿出金錢裝到這個信封里。 ? 某年在荷蘭召開了一次“合作及社會兩難困境研討會”,與會者都是博弈論的專家。 模型二、囚徒困境 /非合作博弈 博弈論的幾個經(jīng)典模型 囚徒困境可以用來說明許多現(xiàn)象 。 ? 此博弈只進行一次還是重復進行 ? 如果博弈只進行一次 , 參與人似乎只有坦白才是最好的策略 , 因為沒有理由相信對手會對你有信心 , 他總認為你自己會坦白;因此 , 雙方都采取坦白策略 。 模型二、囚徒困境 /非合作博弈 博弈論的幾個經(jīng)典模型 該博弈刻劃了兩大難題: ? 沖突情形下 , 參與人的目標是什么 ? 是采用 (作為個人 )他自己的最好策略 , 還是采用 (作為集體的一員 )他們共同的最好策略 ? 前者導致均衡策略 (坦白 , 坦白 ), 支付為 (8, 8);后者的最好策略是 (抵賴 , 抵賴 ), 支付為 (1, 1)。對于 B而言也是如此。但任何一個犯罪嫌疑人在選擇不交代的策略時,都要冒很大的風險,一旦自己不交代而另一犯罪嫌疑人交代了,自己就將可能處于非常不利的境地。 模型二、囚徒困境 /非合作博弈 博弈論的幾個經(jīng)典模型 不難看出 , “ 坦白 ” 是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略 , 而 ( 坦白 , 坦白 ) 是一個占優(yōu)戰(zhàn)略均衡 。 如果另一個犯罪嫌疑人也作了坦白 , 則兩人各被判刑 8年;如果另一個犯罪嫌人沒有坦白而是抵賴 ,則以妨礙公務罪 ( 因已有證據(jù)表明其有罪 ) 再加刑 2年 , 而坦白者有功被減刑 8年 , 立即釋放 。 模型二、囚徒困境 /非合作博弈 博弈論的幾個經(jīng)典模型 假設:有兩個小偷 A和 B聯(lián)合犯事 、 私入民宅被警察抓住 。 模型一、智豬博弈 /完全信息靜態(tài)博弈 博弈論的幾個經(jīng)典模型 在博弈論中 , 含有占優(yōu)戰(zhàn)略均衡的一個著名例子是由塔克給出的 “ 囚徒困境 ” ( prisoners’dilemma ) 博弈模型 。 對于游戲設計者 , 這是一個最好的方案 。 等待者不得食 ,而多勞者多得 。
點擊復制文檔內容
教學教案相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1