freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博奕論和對(duì)策行為ppt52-經(jīng)營管理-資料下載頁

2025-08-06 13:57本頁面

【導(dǎo)讀】對(duì)策思想最早產(chǎn)生于我國古代??痰膶?duì)策論思想。孫武的后代孫臏,為田忌謀劃,頭競(jìng)爭、產(chǎn)量與價(jià)格壟斷、產(chǎn)品交易行為的研究。的理論與方法論基礎(chǔ)。濟(jì)學(xué),政治學(xué)、軍事、外交、國際關(guān)系、公共選擇,還有犯罪學(xué)等,都涉及到博奕論。實(shí)際上,很多人把博奕論看成數(shù)學(xué)的一個(gè)分支,是發(fā)表在數(shù)學(xué)雜志上,而非在經(jīng)濟(jì)學(xué)雜志上。表述,它主要用于表現(xiàn)靜態(tài)對(duì)策。述中的基本概念,明確有關(guān)術(shù)語的準(zhǔn)確含義。即博奕的參與者,他們是博奕的決策主體行為。略組合中獲得的效用,它是策略組合的函數(shù)。局中人得失的總和為零,則稱這種對(duì)策為零和對(duì)策;否則,稱為非零和博奕。它講的是兩個(gè)嫌疑犯被隔離審訊。坦白的判刑10年,。表中每一格的一對(duì)數(shù)字分別表示局中人不同策略。是納什均衡,一種是優(yōu)超解。策略得到的收益是-8,采取“抵賴”策略得到的收益是-10,囚徒B的最優(yōu)反應(yīng)是“坦白”。納什均衡只說明博奕的穩(wěn)定性結(jié)局。如果兩人都抵賴,各判刑1年,顯然比坦白各判刑8年好。

  

【正文】 略和重復(fù)性博弈 假設(shè) A采取混合策略 , 即以概率 x隨機(jī)的使用純策略 a1, 以概率 (1x)使用純策略 a2, 去對(duì)付 B使用純策略 b1, A的收益便是 x的函數(shù) : Uα=x+3(1x)=32x 若 A使用上述混合策略去對(duì)付 B使用純策略 b時(shí) , A的收益便是 Uα’=4x+2(1x)=2+2x 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 用圖表示時(shí) , Uα和 Uα’的表達(dá)式是兩條直線 , x的取值范圍為 [0, 1], 見下圖: U 5 4 3 2 1 0 1 1 2 3 4 5 m xm p q p q 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 Uα的值隨著 x值的增長而減少 , Uα’的值隨著 x值的增大而增大 。 兩條直線的交點(diǎn) m對(duì)應(yīng)著 xm。 局中人 A按最大最小原則選擇他的策略 , 即他的選擇按 Max[min(32x,2+2x)] 來進(jìn)行的 。 min(32x,2+2x) 即折線 pmq, m點(diǎn)是折線pmq的最高點(diǎn) , 所以 m點(diǎn)是混合策略意義下的最大最小值 。 當(dāng) Uα=Uα’時(shí) , 可解得 xm=1/4, Uα=Uα’ =5/2。 所以 , 局中人 A的最優(yōu)混合策略為 : a1, a2 (1/4, 3/4) Uα=Uα’ =5/2 A: 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 可以用同樣的方法分析局中人 B的最優(yōu)混合策略 。若 B以概率 y隨機(jī)的使用純策略 b1, 以概率 (1y)使用純策略 b2, 去對(duì)付 A使用純策略 a1, B的損失值為 : Ub=y+4(1y)=43y 若 B使用上述混合策略去對(duì)付 A使用純策略 a時(shí) , B的損失值便是: Ub’=3y+2(1y)=2+y 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 用圖表示時(shí) , Ub和 Ub’的表達(dá)式是兩條直線 , y的取值范圍為 [0, 1], 見下圖: U 5 4 3 2 1 0 1 1 2 3 4 5 n yn e f 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 注意 , 此時(shí) B按最大最小原則選擇自己的最優(yōu)策略, 即 min[max(43y,2+y)] 折線 enf 表示 max(43y,2+y), n點(diǎn)是折線 enf的最低點(diǎn) , 也即最小最大值。 N點(diǎn)對(duì)應(yīng)的 yn=1/2,以此概率構(gòu)成的 B的混合策略是 B的最優(yōu)混合策略。 b1, b2 (1/2, 1/2) Ub=Ub’=5/2 B: 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 本例中 Uα=Ub=5/2,這樣 , A的混合策略 (1/4,3/4)與B的混合策略 (1/2, 1/2)便構(gòu)成一個(gè) “ 最大最小策略均衡 ” 。 一般記作: max min E(X,Y)=min max E(X,Y) 式中 X=(x1,x2,… ,xn), Y=(y1,y2,… ,yn)為局中人 A和 B使用各自策略的概率 , ? ?? ???nj jni iyx1111 , 期望值 E(X,Y)= ? ?? ?ninj jiijyxa1 1博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 下面再對(duì)這個(gè)例子作進(jìn)一步分析 。 設(shè)局中人 A使用混合策略 x, 局中人 B使用最優(yōu)混合策略 y*, 這時(shí)局中人 B的期望支付 252x)(2212x)(3212x)y * ) ( 2 (12x)(3*y Ub ??????? 25=y)+(243 +3y)(4 41=y)+x * ) ( 2 (1+3y)(4 *x=U ?若局中人 B使用某種混合策略 , 而局中人 A使用最優(yōu)混合策略 , 這時(shí)局中人 A的收益的期望值為 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 這說明當(dāng)局中人 A使用最優(yōu)策略時(shí) , 不管局中人 B使用何種策略 , 他的收入的期望值不變 , 從而保持有利的競(jìng)爭地位;當(dāng)局中人 B使用最優(yōu)策略時(shí) , 不管局中人 A使用何種策略 , 他的支付的期望值不變 , 這就是 B的最好應(yīng)對(duì)方式 。 反之 , 如果 A不使用最優(yōu)策略, 他的期望收入必定小于 Uα;如果 B不使用最優(yōu)策略, 他的期望損失值就要大于 Ub。 從而 , 局中人 A和 B的最優(yōu)混合策略構(gòu)成了一個(gè)混合策略納什均衡 。 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 任何一個(gè)博奕 , 也許不存在純策略納什均衡 , 但一定存在混合策略納什均衡 。 對(duì)于零和博奕 , 若存在 “ 最大最小策略均衡 ” , 則該均衡必定是納什均衡 。 如上例所示 。 混合策略中一定能找到納什均衡這一性質(zhì),使得混合策略更有實(shí)用性。同時(shí),混合策略也許更符合客觀實(shí)際,一則因?yàn)椴┺鹊木种腥诉x擇策略時(shí)本來就不是確定無疑的,而是具有一定的隨機(jī)性;并且,每個(gè)局中人對(duì)于對(duì)手的策略選擇的猜測(cè)也不是十分可靠的,這種猜測(cè)的命中率也是隨機(jī)的。 二則因?yàn)榛旌喜呗詫?duì)付反復(fù)進(jìn)行多次的博奕為純策略更很有效,而這種重復(fù)性博奕在現(xiàn)實(shí)中更為普遍。
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1