freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

數(shù)據模型與決策--博弈論(參考版)

2025-03-11 11:37本頁面
  

【正文】 若 A獨辦,可獲收益 a(=100萬元 );若 A與 B合辦,可共獲收益 b(=250萬元 );若 A與 C合辦,或 A與 B、 C一起合辦,可共獲收益 c(=400萬元 )。 兩參與人博弈支付矩陣表 。分析該問題的納什均衡。政府可選擇救濟或不救濟,無業(yè)人員可選擇尋找工作或繼續(xù)閑蕩。當你發(fā)起攻擊的時候,你的兵力超過敵人,你就獲勝;你的兵力比敵人的守備兵力少或者相等,你就失敗。 案例分析 博弈的分類 ,由你來當“司令”,任務是攻克“敵人”占據的一座城市,而敵軍的守備力量是三個師,規(guī)定雙方的兵力只能整師調動。 由此我們看到,麥當勞總部與加盟者之間構成一個合作性的聯(lián)盟:希望加盟者加入到麥當勞的行列中來能夠獲得確定的利益,而麥當勞總部獲得加盟費以及分得一定的經營利潤。特許經營人可以自己招聘員工,控制經營費用,并利用麥當勞完備的供應商系統(tǒng)和分發(fā)中心進行運作。 克羅克買下了麥當勞公司的所有權,并且大刀闊斧地改進了特許加盟和連鎖經營制度,使麥當勞得到迅速發(fā)展。此時,麥當勞公司成立了。 50年代,雷 為了使生意做得更大,麥當勞兄弟產生了以特許加盟的方式經營連鎖店的想法,并做出了嘗試。如何突破經營能力的局限呢?下面我們看看麥當勞是如何成功的。它的成功因素是多方面的,然而其中一個重要因素便是“構建聯(lián)盟”。 夏普利值 排列 ABC ACB BAC BCA CAB CBA A 0 0 200 150 150 150 B 200 100 0 0 100 100 C 50 150 50 100 0 0 企業(yè)家的創(chuàng)造性也體現(xiàn)在他們能夠在他人看不到的地方建立聯(lián)盟。成員的夏普利值反映了該成員對聯(lián)盟的期望貢獻,分配應當?shù)扔谄谕暙I。 這樣, A、 B、 C的夏普利值分別為 Φ (A)=650/6, Φ (B)=500/6,Φ (C)=350/6。 夏普利值 三個參與人 A、 B、 C,各個聯(lián)盟的特征值為 V(A)=V(B)=V(C)=0, V(A,B)=200, V(A,C)=150, V(B,C)=100, V(A,B,C)=250 聯(lián)盟 ABC可能的排列與邊際貢獻計算如下表所示。若按照這樣的方案分配,它是可理解的,兩人的期望貢獻均為 c/2,分配也應該一樣,為 c/2。在 AB順序下, A的邊際貢獻為 0, B的邊際貢獻為 c;在 BA順序下, B的邊際貢獻為 0, A的邊際貢獻為 c。它是指在一個聯(lián)盟博弈中,某個參與人在各種可能的參與人組成的排列中與前面的參與人構成的聯(lián)盟的期望貢獻的平均值。因此,參與人從聯(lián)盟中獲得利益的多少,取決于或正比于他對聯(lián)盟的貢獻或可能貢獻 (期望貢獻 )。夏普利值是合作博弈 (聯(lián)盟博弈)中的最重要的概念。 不同類型的企業(yè)相互合作往往更能成功,因為同類型的企業(yè)沖突度往往大,不同類型的企業(yè)之間往往沒有沖突。這樣,或者大家的成本降低,或者市場擴大了。 提供同種產品的企業(yè)相互合作的形式能夠有多種。如某個市場上兩家企業(yè) A、 B共同開發(fā)市場比單個企業(yè)開發(fā)市場有利,其條件是: V(A,B)≥V(A)+V(B) 。在聯(lián)盟博弈中,合作通過特征函數(shù)值的分配來表述。合作博弈將后三個要素抽象為一個部分,這樣合作博弈就由兩部分構成:一是所有參與人的集合,二是將不同參與人的組合對應其可得集體效用的函數(shù)。 在很多情況下,將一個復雜的現(xiàn)實場景轉化成一個嚴格的非合作博弈模型可能比較困難,而轉化為合作博弈框架則可簡化對場景細節(jié)的描述,突出結果的形成。在不同的博弈結構下,有不同類型的合作,因而“共贏”有不同的含義。但是,由于參與博弈的各方利益間存在著沖突,搭便車的問題可能導致合作受到破壞。 混合策略 Nash均衡解的求解方法 在實際的博弈問題中,如果參與人能夠進行協(xié)商、談判,聯(lián)合選擇行動,共同分享利益,這就是合作博弈問題。 y y 1 1 2/5 x x 0 1/2 1 0 1/2 1 混合策略 Nash均衡解的求解方法 由圖可知,得到雙方反應函數(shù)的三個交點: (1) x=0, y=0,即甲、乙選擇策略對 (Ⅰ 2, Ⅱ 2),收益值為 (4,4); (2) x=1, y=1,即甲、乙選擇策略對 (Ⅰ 1, Ⅱ 1),收益值為 (3,2); (3) x=1/2, y=2/5,對應的混合策略對為 ((1/2,1/2),(2/5,3/5)),收益值為 (,)。 y 1 2/5 0 x 1 混合策略 Nash均衡解的求解方法 同理乙的期望收益應為 e2(x,y)=2xy+x(1y)+3(1x)y+4(1x)(1y) =y(2x1)+43x 乙的反應函數(shù),即 x值固定的情況下,使得 e2最大的 y的取值: 若 x1/2時,則當 y=0時, e2達到最大,且 e2=43x; 若 x=1/2時,對任意 0≤y≤1 , e2都達到最大,且 e2=5/2; 若 x1/2時,當 y=1時, e2達到最大,且 e2=3x。 甲的期望收益應為 e1(x,y)=3xy+2x(1y)+0(1x)y+4(1x)(1y) =x(5y2)+44y 現(xiàn)在求甲的反應函數(shù),即 y值固定的情況下,使得 e1最大的 x的取值: 若 y2/5,則當 x=0時, e1達到最大,且 e1=44y; 若 y=2/5,則對任意 0≤x≤1 , e1都達到最大,且 e1=12/5; 若 y2/5,則當 x=1時, e1達到最大,且 e1=y+2。 假定 x*, y*分別為甲、乙的 Nash均衡策略, e1(x,y)、 e2(x,y)分別代表甲、乙在采取策略對 (x,y)時各自收益的期望值,那么,根據 Nash均衡解的定義,對于甲而言,有 e1(x*,y*)≥ e1(x,y*) 混合策略 Nash均衡解的求解方法 3, 2 2, 1 0, 3 4, 4 即,當固定乙的策略為 y*時,甲不愿意單方面離開 x*這個策略。 [例 ] 有博弈問題如下,求其 Nash均衡解 。 混合策略 Nash均衡解 求 Nash均衡解的反應函數(shù)法可以應用于求混合策略 Nash均衡解。 但是常常有多個 Nash均衡存在,這也為博弈分析帶來困難。u1,?,u n}中,如果 n是有限的,且對每個 i, Si是有限的,則博弈至少存在一個 Nash均衡解,但可能包括混合策略解。 Nash在 1950年提出了討論 Nash均衡解存在性的定理,后被稱為 Nash定理。u1,?,u n},假設博弈方 i的策略集合為 Si={si1,?,s ik}, pik表示博弈方 i選擇純策略 k的概率,則概率分布 Pi=(pi1,?,p ik)稱為博弈方 i的一個混合策略,其中, 0≤ pik≤ 1對所有 k( k=1,?,K ) 都成立,且 pi1+? +pik=1。 反應函數(shù)法 在沒有純策略 Nash均衡解時,可以尋找混合策略 Nash均衡解。 反應函數(shù)法 q2 (0,6) R1(q2) (0,3) (2,2) 2 R2(q1) 0 2 (6,0) 如圖可得這兩條反應函數(shù)直線的交點為 (2, 2), (2, 2)即為 Nash均衡解,因為這是博弈雙方共同的最佳反應點,因而誰也不愿意單方面離開這一點。
點擊復制文檔內容
教學課件相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1