freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)模型與決策--博弈論(完整版)

2025-04-02 11:37上一頁面

下一頁面
  

【正文】 - D P - D’ P’ ( a) ( b) 圖 小偷與守衛(wèi)的混合策略 ② 代數(shù)方法 求解 設(shè)小偷選擇偷的概率為 pt,則選擇不偷的概率為 1Pt,那么守衛(wèi)選擇睡覺的期望支付為 E睡 =(D) Pt﹢ S (1Pt)=S(D+S) Pt 守衛(wèi)選擇不睡覺的期望支付為 E不睡 =0 Pt﹢ 0 (1Pt)=0 要達(dá)到一種均衡狀態(tài),小偷選擇偷與不偷不能讓守衛(wèi)在選擇睡覺與不睡覺之間有明顯的傾向性。 下面用一個(gè)例子說明重復(fù)剔除嚴(yán)格劣勢策略的求解方法。由此可見,在求 Nash均衡解前,先用重復(fù)剔除嚴(yán)格劣勢策略法,即使常常不能求出 Nash均衡解,也可能簡化博弈問題。 反應(yīng)函數(shù)即一博弈方對另一博弈方每一可能策略的最佳反應(yīng)策略所構(gòu)成的函數(shù)。u1,?,u n},假設(shè)博弈方 i的策略集合為 Si={si1,?,s ik}, pik表示博弈方 i選擇純策略 k的概率,則概率分布 Pi=(pi1,?,p ik)稱為博弈方 i的一個(gè)混合策略,其中, 0≤ pik≤ 1對所有 k( k=1,?,K ) 都成立,且 pi1+? +pik=1。 混合策略 Nash均衡解 求 Nash均衡解的反應(yīng)函數(shù)法可以應(yīng)用于求混合策略 Nash均衡解。 y 1 2/5 0 x 1 混合策略 Nash均衡解的求解方法 同理乙的期望收益應(yīng)為 e2(x,y)=2xy+x(1y)+3(1x)y+4(1x)(1y) =y(2x1)+43x 乙的反應(yīng)函數(shù),即 x值固定的情況下,使得 e2最大的 y的取值: 若 x1/2時(shí),則當(dāng) y=0時(shí), e2達(dá)到最大,且 e2=43x; 若 x=1/2時(shí),對任意 0≤y≤1 , e2都達(dá)到最大,且 e2=5/2; 若 x1/2時(shí),當(dāng) y=1時(shí), e2達(dá)到最大,且 e2=3x。在不同的博弈結(jié)構(gòu)下,有不同類型的合作,因而“共贏”有不同的含義。如某個(gè)市場上兩家企業(yè) A、 B共同開發(fā)市場比單個(gè)企業(yè)開發(fā)市場有利,其條件是: V(A,B)≥V(A)+V(B) 。夏普利值是合作博弈 (聯(lián)盟博弈)中的最重要的概念。若按照這樣的方案分配,它是可理解的,兩人的期望貢獻(xiàn)均為 c/2,分配也應(yīng)該一樣,為 c/2。 夏普利值 排列 ABC ACB BAC BCA CAB CBA A 0 0 200 150 150 150 B 200 100 0 0 100 100 C 50 150 50 100 0 0 企業(yè)家的創(chuàng)造性也體現(xiàn)在他們能夠在他人看不到的地方建立聯(lián)盟。 50年代,雷 由此我們看到,麥當(dāng)勞總部與加盟者之間構(gòu)成一個(gè)合作性的聯(lián)盟:希望加盟者加入到麥當(dāng)勞的行列中來能夠獲得確定的利益,而麥當(dāng)勞總部獲得加盟費(fèi)以及分得一定的經(jīng)營利潤。分析該問題的納什均衡。 兩參與人博弈支付矩陣表 。 案例分析 博弈的分類 ,由你來當(dāng)“司令”,任務(wù)是攻克“敵人”占據(jù)的一座城市,而敵軍的守備力量是三個(gè)師,規(guī)定雙方的兵力只能整師調(diào)動。此時(shí),麥當(dāng)勞公司成立了。它的成功因素是多方面的,然而其中一個(gè)重要因素便是“構(gòu)建聯(lián)盟”。 夏普利值 三個(gè)參與人 A、 B、 C,各個(gè)聯(lián)盟的特征值為 V(A)=V(B)=V(C)=0, V(A,B)=200, V(A,C)=150, V(B,C)=100, V(A,B,C)=250 聯(lián)盟 ABC可能的排列與邊際貢獻(xiàn)計(jì)算如下表所示。因此,參與人從聯(lián)盟中獲得利益的多少,取決于或正比于他對聯(lián)盟的貢獻(xiàn)或可能貢獻(xiàn) (期望貢獻(xiàn) )。 提供同種產(chǎn)品的企業(yè)相互合作的形式能夠有多種。 在很多情況下,將一個(gè)復(fù)雜的現(xiàn)實(shí)場景轉(zhuǎn)化成一個(gè)嚴(yán)格的非合作博弈模型可能比較困難,而轉(zhuǎn)化為合作博弈框架則可簡化對場景細(xì)節(jié)的描述,突出結(jié)果的形成。 y y 1 1 2/5 x x 0 1/2 1 0 1/2 1 混合策略 Nash均衡解的求解方法 由圖可知,得到雙方反應(yīng)函數(shù)的三個(gè)交點(diǎn): (1) x=0, y=0,即甲、乙選擇策略對 (Ⅰ 2, Ⅱ 2),收益值為 (4,4); (2) x=1, y=1,即甲、乙選擇策略對 (Ⅰ 1, Ⅱ 1),收益值為 (3,2); (3) x=1/2, y=2/5,對應(yīng)的混合策略對為 ((1/2,1/2),(2/5,3/5)),收益值為 (,)。 [例 ] 有博弈問題如下,求其 Nash均衡解 。 Nash在 1950年提出了討論 Nash均衡解存在性的定理,后被稱為 Nash定理。 博弈方 1與 2的收益函數(shù)分別為 u1, u2且 u1=6q1q1q2q12 u2=6q2q1q2q22 博弈方 1針對博弈方 2的任一策略 q2的策略選擇是求最大化問題 Max u1=max(6q1q1q2q12) q1 令 u1對 q1的導(dǎo)數(shù)等于零,可得 q1=R1(q2)=1/2(6q2) 這就是博弈方 1對博弈方 2任一策略 q2的最佳反應(yīng),即是其反應(yīng)函數(shù)。 博弈方 Ⅱ 左 中 右 上 博弈方 Ⅰ 下 博弈方 Ⅰ 考慮,若 Ⅱ 方取左策略,自己的最大收益為 1,故在 1下面劃一條短線;若 Ⅱ 方取中策略,自己的最大收益也為 1,故在第二列數(shù)字 1下面劃一條短線;若 Ⅱ 方取右策略,自己的最大收益為 2,故在 2下面劃一條短線。從博弈方 Ⅰ 來看,其上下策略中沒有哪一個(gè)是嚴(yán)格劣勢策略,但從博弈方 Ⅱ 來看,右策略嚴(yán)格劣于中策略,故可將右策略剔除。由此可見,加重對失職守衛(wèi)的懲罰,在長期中會起到抑制盜竊的作用;當(dāng)對守衛(wèi)實(shí)施的懲罰不變,而提高其待遇,意味著 S的增加,反而會使盜竊現(xiàn)象更為嚴(yán)重( Pt增加)。 3, 3 2, 0 0, 2 0, 0 博弈的分類 小豬 按 等 按 大豬 等 豬圈里有一大一小兩頭豬,豬圈的一端有一個(gè)豬食槽,另一端安裝了一個(gè)控制豬食供應(yīng)的按鈕。但是在選定合作方案的時(shí)候,由于各種因素,在攜手合作的大前提下,還是可能有小算盤的考慮。人們對電視節(jié)目的喜愛存在著一定的檔次差異,因此電視臺對節(jié)目的編排將直接影響到收視率。太陽的照射使人們需要補(bǔ)充水分。那么,兩家雜貨店開在什么地方好呢? 商品一樣,價(jià)格也一樣,居民到哪個(gè)雜貨鋪買東西,就
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1