freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈論最全完整ppt-講解(編輯修改稿)

2025-09-11 21:17 本頁面
 

【文章內(nèi)容簡介】 用隨機性; ?兩博弈方選擇每種策略的概率一定要恰好使對方無機可乘,即讓對方無法通過針對性地傾向某一策略而在博弈中占上風(fēng)。 ?例:在擲硬幣的博弈中,參與人 1選正面、反面的概率 q,1q, 一定要使參與人 2選正面的和反面的期望得益相等。 單純戰(zhàn)略與混合戰(zhàn)略的定義 ?G={N,S,U}是一個戰(zhàn)略式有限博弈,參與人 i的戰(zhàn)略空間 S中的任一元素 si稱為 i的一個單純戰(zhàn)略( pure strategy); 定義在 Si上的一個概率分布函數(shù) pi(si)代表了一個混合戰(zhàn)略( mixed strategy) ——這個戰(zhàn)略的內(nèi)容是:參與人 i以概率 pi(sij)選擇單純戰(zhàn)略 sij, 而?pi(sij)=1。 ?單純戰(zhàn)略是混合戰(zhàn)略的特例,因為任一單純戰(zhàn)略 si都可以理解為 i以概率 1選擇 si, 以 0概率選取其他所有單純戰(zhàn)略。 ?引入混合戰(zhàn)略,參與人的目標(biāo)需要修改為“ 最大化自己的期望支付 ” Selton: 小偷和守衛(wèi)的博弈 一小偷欲偷竊有一守衛(wèi)看守的倉庫,如果小偷偷竊時守衛(wèi)在睡覺,則小偷就能得手,偷得價值為 V的贓物;如果小偷偷竊時守衛(wèi)沒有睡覺,則小偷就會被抓住。設(shè)小偷被抓后要坐牢,負(fù)效用為 P, 守衛(wèi)睡覺而未遭偷竊有 S的正效用,因睡覺被竊要被解雇,其負(fù)效用為 D。 而如果小偷不偷,則他既無得也無失,守衛(wèi)不睡意味著出一份力掙一分錢,他也沒有得失。 睡 不睡 偷 V, D P, 0 不偷 0, S 0, 0 小偷 守衛(wèi) 支付 小偷與守衛(wèi)的博弈 守衛(wèi)得益(睡) S 0 1 pt( 小偷偷的概率) pt* pt*/ D D/ 小偷的混合策略 S到 D連線的縱坐標(biāo)是在橫坐標(biāo)對應(yīng)的小偷“偷”竊概率下的守衛(wèi)選擇“睡 ”的期望得益,即 S(1pt)+(D)pt 加重對守衛(wèi)的處罰在短期中的效果是使守衛(wèi)真正盡職,但在長期中恰恰是會降低盜竊發(fā)生的概率(激勵的悖論) 小偷得益(偷) V 0 1 Pg( 守衛(wèi)睡的概率) Pg* Pg*/ P P/ 守衛(wèi)的混合策略 小偷的混合策略分布不受 P的影響,因此政府加重對小偷的懲罰在長期中并不能抑制盜竊,最多只能抑制短期的盜竊發(fā)生率,它的作用主要是使守衛(wèi)可以更多地偷懶 齊威王田忌賽馬 ?古代齊威王與大將田忌賽馬,田忌的謀士孫臏運用計謀幫助田忌以弱勝強。 ?比賽規(guī)則:田忌與齊威王各出三匹馬,一對一比賽三場,每一場的輸方要賠 1000斤銅給贏方。雙方的馬按實力都可以分為上、中、下,但齊威王的上、中、下均優(yōu)于田忌的上、中、下。實際上,田忌的上馬、中馬要優(yōu)于齊威王的中馬、下馬。 ?比賽結(jié)果:田忌連輸三場;后孫臏建議,以上對中、以中對下、以下對上,結(jié)果以 2: 1贏得比賽。 ?前述為單方面運用策略的故事,如果齊威王預(yù)料到田忌的做法,必然會改變各匹馬出場的次序。 ?本博弈中博弈雙方的利益是完全對立的,是嚴(yán)格競爭的零和博弈,不會有純策略納什均衡,必然是一個混合策略均衡。 ?假設(shè)齊威王采取六種戰(zhàn)略的概率分別為pa,pb,pc,pd,pe,pf( 加總為 1) ,則田忌采取六種戰(zhàn)略的期望得益相等,則得出齊威王與田忌均以 1/6的相同概率隨機選擇各自的六個純策略,構(gòu)成本博弈唯一的混合策略納什均衡。 齊威王田忌賽馬 上中下 上下中 中上下 中下上 下上中 下中上 上中下 3, 3 1, 1 1, 1 1, 1 1, 1 1, 1 上下中 1, 1 3, 3 1, 1 1, 1 1, 1 1, 1 中上下 1, 1 1, 1 3, 3 1, 1 1, 1 1, 1 中下上 1, 1 1, 1 1, 1 3, 3 1, 1 1, 1 下上中 1, 1 1, 1 1, 1 1, 1 3, 3 1, 1 下中上 1, 1 1, 1 1, 1 1, 1 1, 1 3, 3 齊威王 田忌 齊威王田忌賽馬 齊威王田忌賽馬 在上述混合策略下,齊威王的期望得益為 1/6( 3+1+1+1+11) =1;田忌的期望得益為 1/6( 131111) =1,即多次進(jìn)行這樣的賽馬,齊威王平均每次能贏田忌 1000斤銅,這是因為齊威王三匹馬的總體實力略勝田忌三匹馬總體實力的緣故 混合策略反應(yīng)函數(shù) ?將博弈方的策略空間擴展到包括混合策略,將納什均衡擴展到包括混合策略納什均衡以后,求納什均衡反應(yīng)函數(shù)的分析方法也可以擴展到求混合策略納什均衡。 ?反應(yīng)函數(shù)即一博弈方對另一博弈方每種可能的決策內(nèi)容的最佳反映決策構(gòu)成的函數(shù)。在純策略的范疇內(nèi),反應(yīng)函數(shù)是各博弈方選擇的純策略對其他博弈方純策略的反應(yīng)。在混合策略的范疇內(nèi),博弈方的決策內(nèi)容為選擇概率分布,反應(yīng)函數(shù)就是一方對另一方的概率分布的反應(yīng)。 擲硬幣 1, 1 1, 1 反面 1, 1 1, 1 正面 反面 正面 1 2 支付 q 1q 1p p p q 0 1/2 1 1 1/2 p1=f(q) q2=f(p) 當(dāng) 2出正面的概率 q?1/2, 1出正面的概率為 1,因為他出正面得到的預(yù)期收益大于他出反面;當(dāng) 2出正面的概率 q?1/2, 1出正面的概率為 0,因為他出反面的期望收益大于他出正面。 第五節(jié) 納什均衡的存在性與多重性 混合戰(zhàn)略納什均衡 純戰(zhàn)略納什均衡 重復(fù)剔除占優(yōu)均衡 占優(yōu)均衡 不同均衡概念之間的關(guān)系 ?納什均衡的存在性 每個有限戰(zhàn)略式博弈(參與人與戰(zhàn)略數(shù)目均為有限)都有納什均衡存在,這均衡有可能是混合戰(zhàn)略均衡 ?納什均衡的多重性 納什均衡不唯一,如性別戰(zhàn) 案例 性別戰(zhàn) 1, 3 0, 0 足球 0, 0 2, 1 時裝 足球 時裝 妻子 支付 p 1p q 1q 丈夫 性別戰(zhàn):混合策略均衡 ?給定妻子分別以 q,1q的概率選擇時裝、足球,則丈夫選擇時裝、足球的期望收益相等,即+0.(1q)=+3.(1q), 解得妻子選擇時裝、足球的概率分別為( 3/4, 1/4) ?給定丈夫分別以 p,1p的概率選擇時裝、足球,則妻子選擇時裝、足球的期望收益相等,即+0.(1p)=+1.(1p), 解得妻子選擇時裝、足球的概率分別為( 1/3, 2/3) ?當(dāng)妻子以( 3/4, 1/4)的概率分布隨機選擇時裝表演和足球,丈夫以( 1/3, 2/3)的概率隨機選擇時裝表演和足球時,雙方都無法通過單獨改變策略,即單獨改變隨機選擇純策略的概率分布而提高利益,因此雙方的上述概率分布的組合構(gòu)成一個混合策略納什均衡。 ?該混合策略納什均衡給妻子和丈夫各自帶來的期望收益分別為: +q.(1p).0+(1q).+(1q).(1p).1=2/3。 +q.(1p).0+(1q).+(1q).(1p).3=3/4 ?雙方的期望收益均小于純策略時的期望收益。 性別戰(zhàn):混合策略均衡 q p 0 1/3 1 1 3/4 q1=f(p) p2=f(q) 夫妻之爭兩博弈方的反應(yīng)函數(shù) 如果 p?1/3, 則妻子選擇時裝的期望得益小于選擇足球 , 因此妻子應(yīng)選擇足球,即 q=0; 如果 p?1/3, 則妻子選擇時裝的期望得益為大于選擇足球的得益,因此選時裝,即 p=1 焦點均衡 ( focal point) ?當(dāng)一個博弈有多個納什均衡時,博弈論并沒有一個一般的理論來證明納什均衡結(jié)果一定會出現(xiàn)。 ?在現(xiàn)實生活中,參與人可能使用某些被博弈模型抽象掉的信息來達(dá)到一個 “ 焦點 ” 均衡。這些信息可能與社會文化習(xí)慣、參與人過去博弈的歷史有關(guān)。 ?例,在性別戰(zhàn)中,如果今天是丈夫的生日,(足球、足球)可能是一個焦點均衡;而如果是妻子的生日,(時裝、時裝)可能是一個焦點均衡。 ?還有分蛋糕等。 課堂練習(xí):求納什均衡 2, 4 0, 0 音樂會 1, 1 4, 2 足球 音樂會 足球 男方 女方 支付 p 1p q 1q 市場進(jìn)入阻撓 0, 300 0, 300 不進(jìn)入 10, 0 40, 50 進(jìn)入 斗爭 默許 進(jìn)入者 在位者 支付 威脅是可置信的嗎? 作業(yè) 1 春節(jié)前夕,某小鎮(zhèn)上兩個商鋪主甲和乙同時看到一個賺錢機會:去城里販一批鞭炮回來零售,購貨款加上運輸費用共 5000元,如果沒有競爭對手,這批貨在小鎮(zhèn)上能賣 6000元;但如果另一家商鋪同時在小鎮(zhèn)上賣鞭炮,價格下跌使得這批鞭炮只能賣 4000元。請用戰(zhàn)略式表示支付矩陣;請找出納什均衡。 作業(yè)二 2, 0 1, 1 4, 2 3, 4 1, 2 2, 3 1, 3 0, 2 3, 0 乙 左 中 右 上 中 下 甲 一個兩人同時博弈的支付競爭如下所示,試求納什均衡。是否存在重復(fù)剔除占優(yōu)戰(zhàn)略均衡? 第二章 完全信息動態(tài)博弈 博弈的擴展式表述 子博弈精煉納什均衡 子博弈精煉納什均衡舉例 重復(fù)博弈和無名氏定理 第一節(jié) 博弈的擴展式表述 完全信息動態(tài)博弈 一般以擴展型式來表示: G=(N,H,P,I,U), 包括 5要素: ( 1)局中人 N; ( 2)歷史 H:博弈樹是一個多環(huán)節(jié)與枝干的集合,從單一的起始環(huán)節(jié),直到終結(jié)環(huán)節(jié),代表博弈歷史; ( 3)對每個環(huán)節(jié)的分配法則 P:將每個環(huán)節(jié)(除終結(jié)環(huán)節(jié)外)分配給不同的局中人,并賦予行動時可選的策略; ( 4)局中人行動時的信息集合 I; ( 5) 對應(yīng)局中人可能選擇策略,各局中人在終結(jié)環(huán)節(jié)所得到的報酬 U。 1 2 2 L L S S L S ( 2, 2) ( 1, 1) ( 1, 1) ( 1, 1) 戰(zhàn)略式表述(strategic form representation)多用矩陣 2,2 1,1 1,1 1,1 2 L S L S 1 擴展式表述(extensive form representation)多用博弈樹 戰(zhàn)略式與擴展式 3 , 3 3 , 3 1 , 0 1 , 0 0 , 1 0 , 0 0 , 1 0 , 0 A B (進(jìn)入,進(jìn)入) 進(jìn)入 不進(jìn)入 (進(jìn)入,不進(jìn)入) (不進(jìn)入,進(jìn)入) (不進(jìn)入,不進(jìn)入) 市場進(jìn)入博弈的標(biāo)準(zhǔn)式 進(jìn)入 不進(jìn)入 A B B 進(jìn)入 不進(jìn)入 不進(jìn)入 進(jìn)入 收益: A B 3 , 3 1 , 0 0 , 1 0 , 0 市場進(jìn)入的擴展式 在市場進(jìn)入博弈中: A有兩個行動:“進(jìn)入”、“不進(jìn)入”。 由于是先行動者,只有兩個戰(zhàn)略:選擇“進(jìn)入”或“不進(jìn)入”。 B有兩個行動:“進(jìn)入”、“不進(jìn)入”。 但是,有 4個戰(zhàn)略: (1)若 A選擇“進(jìn)入”, B選擇“進(jìn)入”,若 A選擇“不進(jìn)入”, B選擇“進(jìn)入”,即 (進(jìn)入,進(jìn)入) (2)若 A選擇“進(jìn)入”, B選擇“進(jìn)入”,若 A選擇“不進(jìn)入”, B選擇“不進(jìn)入”,即 (進(jìn)入,不進(jìn)入) (3)若 A選擇“進(jìn)入”, B選擇“不進(jìn)入”,若 A選擇“不進(jìn)入”, B選擇“不進(jìn)入”,即 (不進(jìn)入,進(jìn)入) (4)若 A選擇“進(jìn)入”, B選擇“不進(jìn)入”,若 A選擇“不進(jìn)入”, B選擇“不進(jìn)入”,即 (不進(jìn)入,不進(jìn)入) 博弈樹的構(gòu)成 1.結(jié) (nodes): 結(jié)包括決策結(jié) (decition nodes)和終點結(jié) (terminal nodes)兩類。決策結(jié)是參與人采取行動的時點,終點結(jié)是博弈行動路徑的終點。 在博弈樹中,“誰在什么時候行動”用在決策結(jié)旁邊標(biāo)注參與人的辦法來表示。參與人的支付標(biāo)注在博弈樹終點結(jié)處。 2.枝 (branches): 在博弈樹上,枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個枝代表參與人的一個行動選擇。 3.信息集 (information sets): 博弈樹上的所有決策結(jié)分割成不同的信息集。每一個信息集是決策結(jié)集合的一個子集。該子集包括所有滿足下
點擊復(fù)制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1