freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博奕論講稿(上海財(cái)大施錫詮)-閱讀頁(yè)

2025-06-01 13:12本頁(yè)面
  

【正文】 a)混合策略( p1, p2, …, pM)是關(guān)于 si的最優(yōu)反應(yīng),當(dāng)且僅當(dāng)它的支撐中的每一個(gè)純策略本身是關(guān)于 si的最優(yōu)反應(yīng) ( b)在那種情況,在這個(gè)支撐上的任何混合策略都是最優(yōu)反應(yīng)。 第 8章 零和博弈 :最大最小 :最小最大 :既穩(wěn)妥又充分地參與 1. 零和博弈 零和博弈是這樣的一個(gè)博弈 , 不管兩個(gè)局中人采取的是什麼樣的策略向量 ,他們的盈利總是相加為零;就是說(shuō) ,對(duì)所有的策略 s1和 s2, 成立 ?1(s1, s2) + ?2(s1, s2) = 0 在(兩人) 零和博弈 中,局中人 2的盈利 正好是局中人 1的盈利的負(fù)值。例 2是從任何角度都很象零和博弈的一類博弈中的一個(gè)例子。在這類博弈中,兩個(gè)盈利合計(jì)總是等于常數(shù)。對(duì)于任意策略 s1,存在局中人 2可以選擇的策略 b(s1) ,使得他的盈利可能最高而同時(shí)使得局中人 1的盈利最低。因此,為了有把握(或穩(wěn)妥)地參與,局中人 1應(yīng)該取策略 s1,它使局中人 1最差情況下的盈利比起她采取其它任何一個(gè)策略的最差情況盈利要好一些。 畢竟 , 回想起當(dāng)我們研究壁球游戲時(shí) , 我們發(fā)現(xiàn)稍許有點(diǎn)虛張聲勢(shì)會(huì)使局中人得處境好一些;如果她擊球落點(diǎn)是在球場(chǎng)前面和后面之間的混合 , 她贏的百分比就會(huì)高一些 。這個(gè)盈利稱為 最大最小 盈利并記為 m1: ),(m i nmax 211spmsp??如果策略 p* 滿足 ? [ p*, b(p*)] = m1,則稱p*為局中人 1的穩(wěn)妥策略。所以,穩(wěn)妥的方法是,局中人預(yù)期她的對(duì)手采取最優(yōu)反應(yīng)并且防范任何隨之發(fā)生的不利結(jié)局。她知道,如果采取一個(gè)穩(wěn)妥策略 p*,她不可能比 m1更差。這不像最優(yōu)反應(yīng)行為,該行為要求局中人 1徹底地全面考慮問(wèn)題:我在對(duì)什么作出最優(yōu)反應(yīng)?當(dāng)然,這樣的單方面策略的實(shí)施可能產(chǎn)生很高的代價(jià);穩(wěn)妥地參與可能不像采用最優(yōu)反應(yīng)那樣有利。 3. 充分地參與:最小最大 代替采用防止最差情況結(jié)局,局中人 1可以通過(guò)采用最優(yōu)反應(yīng)從而 “ 更加積極地 ” 對(duì)付局中人2的策略。與之相聯(lián)的概念稱作最小最大盈利;它是局中人 1的最優(yōu)(反應(yīng))盈利中最差的一個(gè)(將它記為 M1): ),(m a xm i n 111qsMsq??這里, ? (s1, q)是當(dāng)局中人 1采取純策略 s1和她的對(duì)手采用混合策略 q時(shí)她的期望盈利。局中人1的最小最大盈利至少和她的最大最小盈利一樣高,即 M1 ? m1。 ? 命題 2( 一個(gè)局中人的最小最大是另一個(gè)局中人的最大最小 ) 。 ) 4. 實(shí)施納什均衡策略:既穩(wěn)妥又充分地參與 定義 : 一對(duì)混合策略 , 如果對(duì)所有純策略 s1和 s2, 有 )~,()~,~(),~( 12 qsqpsp ??? ??則 構(gòu)成零和博弈的納什均衡。 令 構(gòu)成零和博弈的納什均衡。反之,假使最小最大和最大最小盈利相等。 )~,~( qp)~,~( qp?p~ q~第 9章 展開(kāi)型博弈和后推歸納 ,混合策略,和事件結(jié) IEDS的聯(lián)系 : “ 毒藥 ” 和其他收購(gòu)?fù)? 劇院博弈 1. 展開(kāi)型 為了讓 “ 樹(shù) ” 描繪博弈,其結(jié)點(diǎn)和枝需要滿足三條性質(zhì): ? 1. 單一的出發(fā)點(diǎn) 。 因而 , 如圖 。 重要的是在博弈運(yùn)行中 , 我們不要陷入僵局;樹(shù)枝循原路折回并造成一個(gè) 循環(huán) 一定是不可接受的 。 重要的是 , 對(duì)于博弈如何進(jìn)行下去不能模棱兩可 , 因此 , 必定不存在二個(gè)或多個(gè)枝導(dǎo)向同一個(gè)結(jié) 。 2. 前結(jié)點(diǎn)的前結(jié)點(diǎn)也是前結(jié)點(diǎn): 如果結(jié)點(diǎn) ?是 ?的前結(jié)點(diǎn) , 依次結(jié)點(diǎn) ?是 ?的前結(jié)點(diǎn) , 那么 ?也是?的前結(jié)點(diǎn) 。 4. 必定存在一個(gè)共同的前結(jié)點(diǎn): 考慮任意兩個(gè)結(jié) , ?和 ?, 它們之間沒(méi)有一個(gè)是另一個(gè)的前結(jié)點(diǎn) 。 策略,混合策略,和事件結(jié) 策略 局中人的策略是行動(dòng)的一個(gè) 完全的,有條件 的計(jì)劃。說(shuō)它是 完全的 ,因?yàn)樗嬖V局中人在每一個(gè)有關(guān)的決策結(jié)上選擇什么策略。因此在序貫的劇院博弈中,局中人 1的混合策略有兩個(gè)數(shù) p和 q給定,他們分別是選擇 b 和選擇 c的概率(而1 – p – q 是選擇 s的概率)。 事件結(jié) 我們也可以在展開(kāi)型內(nèi)建立不確定性,這種不確定性是博弈本身所具有的(與之對(duì)立的是局中人通過(guò)混合策略引進(jìn)的不確定性)。對(duì)這種可能性建模的一個(gè)方法是允許第三類型的結(jié)點(diǎn),稱之為 事件結(jié); 這是一個(gè)其枝表示若干隨機(jī)可能性的結(jié)點(diǎn)。 一個(gè) 完美信息的博弈 是不存在(具有多個(gè)結(jié)的)信息集的展開(kāi)型博弈。一家公司 ——譬如, “ 可口可樂(lè) ” ——正在盤算是否進(jìn)入一個(gè)新市場(chǎng) ——比方說(shuō)是前蘇聯(lián) (FSU)——在那里,市場(chǎng)由它的競(jìng)爭(zhēng)對(duì)手 “ 百事 ” 所獨(dú)占。如果 “ 百事 ” 發(fā)動(dòng)一場(chǎng)廣告大戰(zhàn),花費(fèi)大量金錢用于改善設(shè)施,以排他性協(xié)議捆住零售商 ——換句話說(shuō),反應(yīng) “ 強(qiáng)硬 ” ——那么“ 可口可樂(lè) ” 將會(huì)遭受損失。在圖 , E(進(jìn)入 )和 O(呆在外面 )表示 “ 可口可樂(lè) ” 的抉擇,而 T(強(qiáng)硬)和 A(寬容)指 “ 百事 ” 在如何制止 “ 可口可樂(lè) ” 的進(jìn)入方面的兩個(gè)選擇。 例 2:進(jìn)入 Ⅱ ? 對(duì)于(稍微)復(fù)雜一些的模型,我們考慮如下變體。換句話說(shuō),假使在看到了“ 百事 ” 的反應(yīng)之后, “ 可口可樂(lè) ”本身將不得不行為 “ 強(qiáng)硬 ” 或 “ 寬容 ” 例 3:(不完美信息)進(jìn)入 Ⅲ ?假設(shè),萬(wàn)一 “ 可口可樂(lè) ” 進(jìn)入 FSU市場(chǎng), “ 可口可樂(lè) ” 和 “ 百事 ” 兩家將對(duì)在這個(gè)市場(chǎng)上投資多少作出決策。但是,例 2不同,假定這些決策是同時(shí)策劃的(這個(gè)事實(shí)使得這種情況不是完美信息的博弈) 3. 后推歸納 我們感興趣的問(wèn)題是,例 1和例 2中行為的合理預(yù)測(cè)是什么?這實(shí)際上是關(guān)于 序貫理性的問(wèn)題。它包含了序貫性,因?yàn)榫种腥藢⑼茢辔磥?lái)將會(huì)怎樣,并且知道在未來(lái),局中人將以同樣的方式推理。 注意到 “ 可口可樂(lè) ” 的每一個(gè)策略必定有三個(gè)分量 。 例如EAT表示 ( 1) 進(jìn)入 , ( 2) 以寬容對(duì)付強(qiáng)硬的 “ 百事 ” , ( 3) 采取強(qiáng)硬策略對(duì)付寬容的 “ 百事 ” 。 百事 T A 可口可樂(lè) ETT 2, 1 0, 3 ETA 2, 1 1, 2 EAT 3, 1 0, 3 EAA 3, 1 1, 2 OTT 0, 5 0, 5 OTA 0, 5 0, 5 OAT 0, 5 0, 5 OAA 0, 5 0, 5 該策略型基本上有三個(gè)純策略納什均衡: 1. 其 “ 百事 ” 取 T, 而 “ 可口可樂(lè) ”取它呆在外面的 ( 四個(gè) ) 策略中的任何一個(gè)的納什均衡 , ——OTT, OTA, OAT, 和 OAA。 3. (EAA, A)——跟第二個(gè)均衡有相同的結(jié)局 。你也許認(rèn)為這對(duì)博弈也應(yīng)該是對(duì)的。這種陳述最初聽(tīng)起來(lái)似乎自相矛盾,但是直覺(jué)上的確很易明白。反過(guò)來(lái),這種行為將影響她同時(shí)也影響其他局中人的當(dāng)前措施。 只強(qiáng)硬的 “ 百事 ” 假如我們以下述方式簡(jiǎn)化這個(gè)(已經(jīng)簡(jiǎn)單的!)例子:在 “ 可口可樂(lè) ” 進(jìn)入 FSU 市場(chǎng)之后, “ 百事 ”除了采取 “ 強(qiáng)硬 ” 之外別無(wú)其他選擇。 只強(qiáng)硬的 “ 可口可樂(lè) ” 假如我們以下述方式修改例子:在 “ 可口可樂(lè) ” 進(jìn)入 FSU市場(chǎng)之后,除了強(qiáng)硬之外, “ 可口可樂(lè) ”沒(méi)有其他的選擇(即,假定 “ 可口可樂(lè) ” 少了一個(gè)選擇:它不能寬容)。 每一個(gè)具有有限個(gè)結(jié)的完美信息博弈有后退歸納解。 5. 與策略型中 IEDS的聯(lián)系 博弈展開(kāi)型中的后退歸納解與在策略型中用累次剔除劣策略( IEDS)求解博弈得到完全相同的結(jié)果。一方面,如果他們決定反對(duì)(并提出一個(gè)股份報(bào)價(jià)), CSX聯(lián)合鐵路公司要么可以通過(guò)拒絕談判,或抬高自己的條款,等等采取強(qiáng)硬策略,要么他們可能寬容并達(dá)成某種三邊協(xié)議。 此外,現(xiàn)在假設(shè) CSX聯(lián)合鐵路公司必須作一最初選擇,決定是否用 “ 毒藥 ” 來(lái)武裝自 己。 沒(méi)有 “ 毒藥 ” , CSX聯(lián)合鐵路公司將會(huì)寬容,從而南諾??诉M(jìn)入,于是前者的利潤(rùn)為 2。顯然, CSX聯(lián)合鐵路公司樂(lè)意采取“ 毒藥 ” ,這一承諾使他們獲得額外的 1千萬(wàn)美元利潤(rùn)。考慮下圖?,F(xiàn)在,雖然,盡管有 “ 毒藥 ” ,南諾??税l(fā)現(xiàn)進(jìn)入仍是有利可圖的(因?yàn)樗玫搅死麧?rùn) )。 因此后退歸納結(jié)局是 CSX聯(lián)合鐵路公司寧愿采用“ 毒藥 ” 條文,南諾??嗽敢馓岢鲆粋€(gè)股份報(bào)價(jià)(發(fā)動(dòng)對(duì)聯(lián)合鐵路公司的收購(gòu)), CSX聯(lián)合鐵路公司采取強(qiáng)硬措施。 第 10章 應(yīng)用:研究和發(fā)展 Ramp。D模型 假如在一個(gè)行業(yè)有兩家公司 , RCA與索尼 (Sony)——此后稱為公司 R和公司 S——每一家都在為生產(chǎn) HDTV而進(jìn)行 Ramp。 在 HDTV可以進(jìn)入市場(chǎng)之前有若干必須成功地完成的階段 。 2. 兩家公司在任何一個(gè)周期都可以前進(jìn) 1步 , 2步 或 3步后完成項(xiàng)目 。 4. 無(wú)論哪家公司最先完成所有步驟的則獲得專利;專利值 20( 百萬(wàn) ) 美元 。D。D,它將花費(fèi)最少可能的資金,并且一次向前進(jìn)展一步。 后退歸納:模型分析 5. 兩家公司輪流決定在 Ramp。D決策,直到它知道索尼接下去的 Ramp。而且,索尼在 RCA宣告之后的周期里作出它的通告。首先 RCA有 Ramp。 更清晰的描述可用位置空間 圖給出 第 1步 假如博弈處在 ( 1, s) , 并且輪到公司R行動(dòng) 。 這將產(chǎn)生價(jià)值 20( 百萬(wàn) ) 美元的專利和花費(fèi) 2( 百萬(wàn) ) 美元成本 。 第 2步 現(xiàn)在假設(shè)兩家公司或者在( 2, 1),或者在( 3, 1),并且輪到公司 R行動(dòng)。事實(shí)上,如果 R不是一次完成博弈,它知道 S就在下一個(gè)機(jī)會(huì)中完成項(xiàng)目(為什么?),于是 R要么從那一刻起什么也得不到,要么蒙受損失。如果它做不完全的進(jìn)展 ——從( 2, 1)出發(fā)走 1步或從( 3, 1)出發(fā)走 2步或不到 2步 ——他將招致成本損失卻不會(huì)贏得專利。( b)然后,如果博弈處于( 3, 2)并輪到公司 R行動(dòng),你能證明它應(yīng)該一次完成項(xiàng)目嗎?如果博弈處在( 2, 3)并且輪到 S首先行動(dòng),情況會(huì)怎樣? 經(jīng)由第 1步到第 3步,我們已經(jīng)證明了下述: 命題( 1) 如果博弈處在任何位置( r, s), r ? 3和 s ? 3,無(wú)論哪一家公司在那時(shí)首先行動(dòng)都將觸發(fā)完工,即,將一次結(jié)束項(xiàng)目。它最多可以做的是將項(xiàng)目朝前推進(jìn) 3步到( 1, 3)。或者它可以通過(guò)停止 Ramp。在這些情況中的頭 3個(gè), R知道 S將在下一步完成博弈(為什么?)。這等價(jià)于退出競(jìng)爭(zhēng)。由于迅速的 Ramp。D更昂貴, S的最好辦法是以花費(fèi)最少的方式行動(dòng),一次一步,逼近專利。位置( 5, 3),( 5, 2),和( 5, 1)的情況怎么樣? 命題 2 對(duì)于所有的位置( r, s),只要 r 3 和 s ? 3,公司 R作為最先行動(dòng)者,可以做得最好的事情是退出(競(jìng)爭(zhēng))。 所有位置 (r, s),只要 r ? 3和 s 3,是公司 R的安全區(qū)域 I。 稱作 S的 安全區(qū)域 I 第 6步 考慮如 ( 4, 4) 那樣的位置 。 事實(shí)上 , 公司 R可以一步使博弈進(jìn)入它的安全區(qū)域 I——以代價(jià) 2。 更一般地,只要 R有辦法進(jìn)入它的安全區(qū)域 ——此后一次一步行動(dòng) ——而消耗少于專利的價(jià)值 $20的代價(jià),那么這值得 R這樣去做。 第 7步 從位置 ( r, s) 證明 , 如果 r, s = 4, 5,首先行動(dòng)者將發(fā)現(xiàn)讓博弈導(dǎo)入自己的安全區(qū)域 I是有利可圖的 。 但是,如果處于( 6, 5),就不值得公司 R轉(zhuǎn)入它的安全區(qū)域。 命題 3 在( 3, 3)與( 5, 5)之間存在第二個(gè)觸發(fā)區(qū)域;在這個(gè)區(qū)域的最先行動(dòng)者應(yīng)該使博弈移入它自己的安全區(qū)域 I。 R的安全區(qū)域 Ⅱ 為 3 ? r? 5 和 s 5 (對(duì)稱地, S的安全區(qū)域 II 為 3 ? s? 5和 r 5)。 以這種方式繼續(xù)下去 第 11章 子博弈完美均衡 ?例題 ?子博弈和子博弈內(nèi)的策略 ?子博弈完美均衡 ?若干注記 ?案例分析:第一次世界大戰(zhàn)戰(zhàn)壕中的和平 ?總結(jié) 例 1:進(jìn)入 Ⅲ 回憶可口可樂(lè)公司正在爭(zhēng)論是否進(jìn)入先前尚未占領(lǐng)的東歐市場(chǎng),這一次是在特蘭西瓦尼亞( Transylvania ? 羅馬尼亞中部地區(qū))??煽诳蓸?lè)公司可以作出一組同樣的選擇 ——T或者 A。)進(jìn)入后的競(jìng)爭(zhēng)階段其盈利如下: 可口可樂(lè)\百事 T A T 2, 1 0, 3 A 3, 1 1, 2 可口可樂(lè)\百事 T A ET 2, 1 0,
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1