freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈論和對(duì)策行為ppt課件-資料下載頁(yè)

2025-05-06 13:29本頁(yè)面
  

【正文】 產(chǎn)品的決策中找出最小收益 3,再?gòu)挠行庐a(chǎn)品的決策中找出最小收益 2,然后從兩個(gè)最小收益中找最大收益為 3,相應(yīng)的策略為無新產(chǎn)品。如果兩家寡頭企業(yè)的決策者都是這種風(fēng)險(xiǎn)厭惡型的,市場(chǎng)就沒有新產(chǎn)品推出了。但是, (無新產(chǎn)品,無新產(chǎn)品 )不是納什均衡,所以,這種對(duì)策結(jié)構(gòu)是不穩(wěn)定的。 博弈論和對(duì)策行為 ?最大最小策略 (Maxmin strategy) 按最大最小原則選擇的策略是一種求穩(wěn)型策略 ,它不保證利潤(rùn)最大化 , 卻能保證風(fēng)險(xiǎn)最小化 。 在表 112表示的企業(yè)價(jià)格博奕中,假如企業(yè) 1按最大最小原則選擇策略,它的最大最小策略是 “價(jià)格不變”,企業(yè) 2的最大最小策略也是“價(jià)格不變”。 (價(jià)格不變,價(jià)格不變 )正是納什均衡。 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 策略有兩種概念 , 前面我們所說的策略 , 都是純策略 , 另一種策略概念為在純策略基礎(chǔ)上形成的混合策略 (mixed strategy)。 局中人 I的混合策略 αi是他的純策略空間 Si上的一種概率分布 , 表示局中人實(shí)際對(duì)策時(shí)根據(jù)這種概率分布在純策略中隨機(jī)選擇加以實(shí)施 。 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 為了敘述問題方便 , 下面我們主要討論二人零和博奕 。 零和對(duì)策是策略型對(duì)策的最基本模式 , 其中局中人得失的總和為零 (或?yàn)橐怀?shù) )。 二人零和博奕是指零和博奕中有且只有兩個(gè)局中人 , 一人的所得正是另一人的所失 。 二人零和對(duì)策在博奕論的早期發(fā)展中曾占有過重要地位 。 二人零和博奕的支付矩陣可以記為: 局中人 B b1 b2 a1 α11 α12 a2 α21 α22 如果支付矩陣的數(shù)值 αij為正時(shí) , 表示局中 A的贏得值 , 若支付矩陣的數(shù)值 αij為負(fù)時(shí) , 表示局中 A的損失或輸?shù)舻闹?。 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 例:二人零和博奕的收益矩陣如下表 , 局中人 A的收益值均為正 , 而局中人 B的收益值均為負(fù) , 即表示局中人 B的損失值 。 局中人 B b1 b2 局中人 A a1 1, 1 4, 4 a2 3, 3 2, 2 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 如果每個(gè)局中人完全清楚地知道對(duì)手將會(huì)采取什么樣的策略 , 會(huì)是什么情況呢 ? A如果知道 B會(huì)選擇b1, 則會(huì)選擇 a2;當(dāng) A連續(xù)使用策略 a2時(shí) , B必定會(huì)察覺 , 便會(huì)選擇 b2;當(dāng) B連續(xù)使用 b2時(shí) , A也會(huì)察覺 ,從而改為選擇 a1; B如果知道 A選擇了 a1, 則又會(huì)選擇b1;如此反復(fù) , 以至無窮 , 所以 , 雙方如果使用純策略進(jìn)行博奕時(shí) , 就會(huì)出現(xiàn)不穩(wěn)定狀態(tài) , 不會(huì)有最終的均衡結(jié)果 。 這說明雙方都不能連續(xù)不變地使用某種純策略 , 都必須考慮如何隨機(jī)地使用自己的策略 , 使對(duì)方捉摸不到自己使用何種策略 。 這就需要混合策略的對(duì)策 。 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 定義 4:局中人的一個(gè)混合策略是一個(gè)概率密度函數(shù) σi: Si R,使得 iiiiii Ssss ????? 10 )(,)( ?? 且 對(duì)局中人 i來說,所有的 σi的集合記為 ωi={σi}。 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 假設(shè) A采取混合策略 , 即以概率 x隨機(jī)的使用純策略 a1, 以概率 (1x)使用純策略 a2, 去對(duì)付 B使用純策略 b1, A的收益便是 x的函數(shù) : Uα=x+3(1x)=32x 若 A使用上述混合策略去對(duì)付 B使用純策略 b時(shí) , A的收益便是 Uα’=4x+2(1x)=2+2x 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 用圖表示時(shí) , Uα和 Uα’的表達(dá)式是兩條直線 , x的取值范圍為 [0, 1], 見下圖: U 5 4 3 2 1 0 1 1 2 3 4 5 m xm p q p q 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 Uα的值隨著 x值的增長(zhǎng)而減少 , Uα’的值隨著 x值的增大而增大 。 兩條直線的交點(diǎn) m對(duì)應(yīng)著 xm。 局中人 A按最大最小原則選擇他的策略 , 即他的選擇按 Max[min(32x,2+2x)] 來進(jìn)行的 。 min(32x,2+2x) 即折線 pmq, m點(diǎn)是折線pmq的最高點(diǎn) , 所以 m點(diǎn)是混合策略意義下的最大最小值 。 當(dāng) Uα=Uα’時(shí) , 可解得 xm=1/4, Uα=Uα’ =5/2。 所以 , 局中人 A的最優(yōu)混合策略為 : a1, a2 (1/4, 3/4) Uα=Uα’ =5/2 A: 博弈論和對(duì)策行為 ?混合策略和重復(fù)性博弈 注意 , 此時(shí) B按最大最小原則選擇自己的最優(yōu)策略, 即 min[max(43y,2+y)] 折線 enf 表示 max(43y,2+y), n點(diǎn)是折線 enf的最低點(diǎn) , 也即最小最大值。 N點(diǎn)對(duì)應(yīng)的 yn=1/2,以此概率構(gòu)成的 B的混合策略是 B的最優(yōu)混合策略。 b1, b2 (1/2, 1/2) Ub=Ub’=5/2 B:
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1