freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博奕論講稿(上海財(cái)大施錫詮)(文件)

 

【正文】 認(rèn)定,不管她采取何種策略,局中人 2將正確地預(yù)測(cè)并且采取一個(gè)(使局中人 1)最差或贏利最小化的策略 b(s1)。 現(xiàn)在我們來(lái)給出保證盈利(或者最差情況下的最高盈利)的正式定義。 ? 注 2: 穩(wěn)妥方法給予局中人 1一個(gè)單方面手段去參與博弈。那種可能性將是 下面小 節(jié)的主題。 ? 命題 1 (最小最大優(yōu)于最大最?。?。 局中人 1的最小最大盈利正好是局中人 2的最大最小盈利 ( 的負(fù)值 ) , 即 M1 = m2 = ? [b (q*),q* ] (反過(guò)來(lái),局中人 2的最小最大盈利是局中人 1的最大最小盈利的負(fù)值。那么 和 是穩(wěn)妥策略,并且最大最?。ê妥钚∽畲螅┯ハ嘞嗟惹业扔? 。 重要的是知道博弈從何處開(kāi)始 , 所以必須有一個(gè) , 也只能有一個(gè)出發(fā)點(diǎn) 。 ? 3. 單方向前進(jìn) 。 3. 前結(jié)點(diǎn)可以排序: 如果 ?和 ?都是 ?的前結(jié)點(diǎn) ,必定是或者 ?是 ?的前結(jié)點(diǎn) , 或者反過(guò)來(lái) 。說(shuō)它是 有條件的 ,因?yàn)槿绻┺牡竭_(dá)某個(gè)決策結(jié)后,它告訴局中人從這個(gè)結(jié)點(diǎn)出發(fā)后順沿哪條枝。局中人 2的混合策略由 33 1 個(gè)數(shù)給定,每個(gè)數(shù)對(duì)應(yīng)于指派給每個(gè)純策略的概率。 完美信息的博弈 具有如下性質(zhì)的展開(kāi)型博弈:在每一個(gè)信息集中正好有一個(gè)結(jié) 。新市場(chǎng)的潛在贏利影響 “ 可口可樂(lè) ” 的決策,而這主要依賴于 “ 百事 ” 對(duì) “ 可口可樂(lè) ” 進(jìn)入它的市場(chǎng)將做出怎樣的反應(yīng)。注意,在每一對(duì)盈利中的第一項(xiàng)是“ 可口可樂(lè) ” 的盈利。即,行為或者 “ 強(qiáng)硬 ” 或者“ 寬容 ” 。尤其,在隨后結(jié)點(diǎn)上的決策者,考慮到他對(duì)博弈今后未來(lái)的猜想,反過(guò)來(lái)選擇可采用的最優(yōu)行動(dòng)。 但是 , “ 百事 ” 正好有二個(gè)策略 ——要么反應(yīng)強(qiáng)硬 , 要么寬容 “ 可口可樂(lè) ” 。 承諾的力量 在生活中,通常,只有少量的選擇總比有較多的選擇要差一些。如果局中人在后面有許多選擇,比起如果她有少數(shù)幾個(gè)選擇來(lái),在未來(lái)的行為可以相當(dāng)?shù)夭煌?。(即,我們通過(guò)剔除 “ 寬容 ” 而縮減了 “ 百事 ” 的選擇可能)。事實(shí)上,如果對(duì)每一個(gè)局中人,不存在相同的兩個(gè)盈利,那么存在唯一的后退歸納解。另一方面,假使有 “ 毒藥 ” 條文,博弈就如例 1’那樣: CSX聯(lián)合鐵路公司達(dá)成協(xié)議采取強(qiáng)硬措施。設(shè)立 “ 毒藥 ” ,南諾福克將選擇不收購(gòu),因而 CSX聯(lián)合鐵路公司將得到利潤(rùn) 3。如前一樣,不設(shè)立 “ 毒藥 ” , CSX聯(lián)合鐵路公司的盈利是 2。這個(gè)例子反映了在鐵路貨運(yùn)危機(jī)中實(shí)際發(fā)生的事情。D。 3. 向前移動(dòng)一步花費(fèi) 2( 百萬(wàn) ) 美元 , 向前移動(dòng)二步花費(fèi) 7( 百萬(wàn) ) 美元 , 和向前移動(dòng)三步花費(fèi) 15( 百萬(wàn) ) 美元 。 卡特爾 , 第 2步 證實(shí)下面的陳述:無(wú)論哪一家公司做Ramp。D花費(fèi)的資金;如果 RCA在這個(gè)周期作出 Ramp。 假設(shè) 5把專利競(jìng)爭(zhēng)轉(zhuǎn)入完美信息博弈;我們來(lái)看它的展開(kāi)型。 它的最優(yōu)決策顯然是在一次行動(dòng)中完成博弈 。它可以一次完成,如果 R這樣做,它在兩個(gè)位置都得到正利潤(rùn):在第一種情況為 $20 – $7 ,而如果它離完成尚有 3步的話,利潤(rùn)則為 $20 – $15。 第 3步 ( a)使用前面的分析去證明,如果博弈處于( 2, 2),無(wú)論哪家公司首先行動(dòng)都應(yīng)該對(duì)兩步投資并完成博弈?;蛘咚梢砸苿?dòng) 2步到( 2, 3)或者 1步到( 3, 3)。因此 R的最佳反應(yīng)是挑選第 4種選擇,不進(jìn)展。D比緩慢的 Ramp。此后,公司 S可以一次向前一步。 假設(shè)輪到公司 R行動(dòng) 。當(dāng)然該論證可對(duì)稱地應(yīng)用于公司 S。那樣總花費(fèi)為 $21(為什么?),超過(guò)了專利的價(jià)值。在公司 R的安全區(qū)域 Ⅱ , S應(yīng)該立即退出。最后,假設(shè)由可口可樂(lè)公司和百事公司所作的那些進(jìn)入市場(chǎng)后的選擇是同時(shí)決定的(從而,這是一個(gè)不完美信息博弈。百事公司是那個(gè)市場(chǎng)的目前供貨者,并且肯定會(huì)以強(qiáng)硬( T)或者用寬容( A)對(duì)付可口可樂(lè)公司的進(jìn)入。也存在著第二個(gè)安全區(qū)域集合。 證明如果 R必須在 ( 5, 4) 行動(dòng) , 它的最終純利潤(rùn)是 $7。 此后它知道 S將退出 , 從而它可以一次一步地走向最終的圓滿完成;那三步將再花費(fèi) $6, 于是總代價(jià)為 $8,它少于專利的價(jià)值 。 在觸發(fā)區(qū)域 I中將有一場(chǎng)搶先行動(dòng),而在安全區(qū)域 I中 “ 戰(zhàn)爭(zhēng) ”煙消云散。 第 5步 證明相同的結(jié)論,對(duì)于位置( 4, 2)和( 4, 1)同樣會(huì)發(fā)生 R退出競(jìng)爭(zhēng),然后S慢慢地推進(jìn)。 作為唯一的幸存者,公司 S將最終獲得專利。D而留在原處。 稱這樣的位置集為“ 觸發(fā)區(qū)域 I‖. 第 4步 例如,關(guān)于像( 4, 3)這樣的位置,當(dāng)輪到公司 R行動(dòng)的時(shí)候我們可以得到什么結(jié)論?注意, R不能一次完成博弈。例如,如果 R選擇不作進(jìn)展,這使它無(wú)需成本,但是它將發(fā)現(xiàn) S在下一周期會(huì)贏得專利。 類似地 , 如果位置是 ( r, 1) 并且輪到 S行動(dòng) , S將一次完成項(xiàng)目 。D決策,RCA和索尼離完成項(xiàng)目分別有 3步和 4步。D資助后它才作進(jìn)一步的決策。而且,被選中的公司將是比較接近于完成的那一家。 卡特爾 , 第 1步 證實(shí)下面的陳述:因?yàn)閮杉夜局兄挥幸患覍@得專利 , 它只支付其中的一家去做 Ramp。 為了使分析容易處理 , 我們做一些簡(jiǎn)化假設(shè): 1. 可以度量離最終目的的距離 , 例如 , 我們可以說(shuō) ,公司 S處于離項(xiàng)目完成還有 n步 。D模型 后退歸納:模型分析 Ramp。 CSX聯(lián)合鐵路公司獲得利潤(rùn) ,這仍然比他們不采用 “ 毒藥 ” 而得到的 2好一些。 法律 “ 毒藥 ” 2 ? 你認(rèn)為如此過(guò)分的事情很好,但是在實(shí)際中難道南諾??瞬粫?huì)提出收購(gòu)計(jì)劃嗎?好吧,那樣的話也許展開(kāi)型中的盈利稍有不同。于是展開(kāi)型就如圖所見(jiàn)到的那樣(注意,在盈利向量中的第一項(xiàng)是第一個(gè)行動(dòng)者的盈利,即, CSX聯(lián)合鐵路公司的盈利)。 : “ 毒藥 ” 和其他收購(gòu)?fù)? ? 法律 “ 毒藥 ” 1 假設(shè)沒(méi)有 “ 毒藥 ” 條文,那個(gè)博弈就如例 1那樣 ——南諾??耍?Norfolk Southern)必須決定是否反對(duì) CSX聯(lián)合鐵路公司的聯(lián)盟。 后推歸納法 科恩(和策墨羅)定理。這種變化基本上對(duì)于具有增加了的選擇的局中人可能是有利的或者有害的。但是,展開(kāi)型博弈,尤其是完美信息博弈,提供了少量(選擇)可以蘊(yùn)含更多(均衡盈利)的例子。 2. (ETA, A)——其結(jié)局為 , “ 可口可樂(lè) ” 進(jìn)入而兩家公司都寬容 。 第一個(gè)分量告訴我們“ 可口可樂(lè) ” 是否進(jìn)入市場(chǎng) , 第二個(gè)分量告訴 , 如果 “ 百事 ” 反應(yīng) “ 強(qiáng)硬 ” , 它是否會(huì)行為 “ 強(qiáng)硬 ” , 而第三個(gè)說(shuō)明了如果 “ 百事 ” 寬容的話 ,“ 可口可樂(lè) ” 將采取的行動(dòng) 。它包含了理性,因?yàn)樵诳紤]到局中人所想的將會(huì)是博弈的未來(lái)行為,因此,他將在決策結(jié)上選擇他可使用的最優(yōu)行動(dòng)。假設(shè)在 “ 百事 ”的決策之后, “ 可口可樂(lè) ” 有進(jìn)一步的決策可做;它必須決定自己是否發(fā)動(dòng)一場(chǎng)積極的廣告戰(zhàn)并花費(fèi)大量資金于設(shè)備方面,采取諸如此類的行動(dòng)。另一方面,如果 “ 百事 ”不發(fā)動(dòng)這樣強(qiáng)硬的反擊 ——畢竟這樣做代價(jià)昂貴 ——―可口可樂(lè) ” 將賺到錢。 例 1:進(jìn)入 Ⅰ 考慮下述經(jīng)濟(jì)模型。例如,乘地鐵需要的時(shí)間可能依賴于在地鐵系統(tǒng)中是否存在一個(gè)高峰時(shí)間的延遲。 混合策略 混合策略定義的方式以與策略型完全相同;它就是在純策略上的一個(gè)概率分布。 那么 , 必定存在一個(gè)結(jié)點(diǎn) ?, 它是 ?和 ?雙方的前結(jié)點(diǎn) 。 為保證這三條性質(zhì),在前結(jié)點(diǎn)上強(qiáng)加下述限制: 1. 結(jié)點(diǎn)不能是自身的前結(jié)點(diǎn) 。 ? 2. 無(wú)循環(huán) 。那么穩(wěn)妥策略構(gòu)成了博弈的納什均衡。 )~,~( qp命題 3(穩(wěn)妥和充分地參與) 。不管我們考慮的是純策略或者是混合策略,該陳述都是正確的。人們可以認(rèn)為這是更樂(lè)觀的辦法;試圖預(yù)測(cè)對(duì)手的行動(dòng)并且對(duì)此作出最優(yōu)的反應(yīng)。如果事實(shí)上她的對(duì)手沒(méi)有采用最優(yōu)反應(yīng),那么她的盈利只能更高一些。 ? 注 1: 由于策略 b(p)使得局中人 1的盈利最小化,因此,它是局中人 2對(duì)付 p的最優(yōu)反應(yīng)(因此使用這個(gè)記號(hào))。 在選擇自己最好的 “ 最差盈利 ” 時(shí) , 重要的是局中人 1完全有理由同時(shí)考慮混合策略 。 2. 穩(wěn)妥 地參與:最大最小 在零和博弈中,當(dāng)且僅當(dāng)局中人 1干得差時(shí),局中人 2干得好。 例 1: 扔硬幣打賭 1 \ 2 L C R U 5, 5 8, 8 4, 4 M 7, 7 9, 9 0, 0 D 9. 9 1, 1 2, 2 例 2: 壁球 1 \ 2 向前 ( F) 后退 ( B) 前面 ( f) 20, 80 70, 30 后面 ( b) 90, 10 30, 70 在每一格中,分別為局中人 1和局中人 2贏的百分比。 含義。這個(gè)混合策略的支撐由所有那些(在這個(gè)戰(zhàn)略行動(dòng)中)具有正概率的純策略構(gòu)成。 第二步,把加權(quán)了的盈利合計(jì)在一起。在人口眾多的情況下加劇了公共問(wèn)題的悲劇。在該意義下,在納什均衡中我們對(duì)資源存在過(guò)分地榨??;即,我們經(jīng)受了公共問(wèn)題的悲劇。如通常情況,局中人 1對(duì)局中人 2的消費(fèi)有個(gè)猜測(cè),并且在該基礎(chǔ)上決定他自己的消費(fèi)水平。因?yàn)樵僖矝](méi)有下面的周期了,因此沒(méi)有理由對(duì)在第 2周期可用的量節(jié)省任何部分。 在他們?cè)噲D過(guò)度消費(fèi)的事件中 , 假定總量簡(jiǎn)單地由他們平分;即 , 每個(gè)人最終消費(fèi) y/2 。 ? 資源枯竭 。預(yù)先指定生產(chǎn) “ 配額 ” 為 Q1與 Q2;它們的選擇是使得總利潤(rùn)最大化: ]][)([ 2121, 21 cbaM a x ????每家公司的 價(jià)格 每家公司的 生產(chǎn)數(shù)量 利潤(rùn) 注意到如果公司如卡特爾那樣經(jīng)營(yíng) , 它們比起在納什均衡里的產(chǎn)量生產(chǎn)得少一些;卡特爾的產(chǎn)量是古諾特 納什均衡產(chǎn)量水平的 75%。 。 需求曲線的另一種理解方式是 , 如果 Q=Q1+Q2是雙寡頭自身之間生產(chǎn)的量 , 由此產(chǎn)生的價(jià)格是 我們通過(guò)記 和 來(lái)簡(jiǎn)化這個(gè) ( 逆 ) 需求曲線的表達(dá)式;即 , 從這個(gè)觀點(diǎn)出發(fā)我們將使用的逆需求函數(shù)為 P = a – b Q ??? QP ?????a?1?b假設(shè)每家公司的成本函數(shù)相同 , 并且每單元成本不隨生產(chǎn)的單元數(shù)變化 。 ;它一定是納什均衡 , 但相反的含義未必成立 。 , 納什均衡是最普遍的求解方法 。 總 結(jié) , 局中人 i的一個(gè)策略選擇為他產(chǎn)生了最高可能的盈利 。 2. 當(dāng)獎(jiǎng)勵(lì)較高時(shí) , 戰(zhàn)斗的可能性更大 。 ),(),( *** iiiiii ssss ?? ? ??),(),( *** iiiiii ssss ?? ? ??定義: 性別爭(zhēng)端 丈夫\妻子 足球( F) 歌?。?O) 足球( F) 3, 1 0, 0 歌?。?O) 0, 0 1, 3 伯川德定價(jià) 公司 1\公司 2 高( H) 中( M) 低( L) 高( H) 6, 6 0, 10 0, 8 中( M) 10, 0 5, 5 0, 8 低( L) 8, 0 8, 0 4, 4 案例研究:動(dòng)物王國(guó)中的納什均衡 荒漠蜘蛛的故事 , 雌蜘蛛在網(wǎng)里產(chǎn)卵 , 由于這樣的網(wǎng)很難搭建 , 因此 , 網(wǎng)是稀少的 。 如果存在一個(gè)最終唯一預(yù)測(cè) , 則稱它為 IEDS解 。 在以下博弈中 ,每一個(gè)局中人都有一個(gè)劣策略 ——―差 ” ——可是在剔除那個(gè)策略后留下來(lái)的是一個(gè)只有非劣策略的 2 2博弈 。 考慮下面的博弈 。 沒(méi)有一個(gè)局中人會(huì)采用只是在 15輪剔除劣策略之后才轉(zhuǎn)變成的劣策略 , 這件事似乎就不太合理 。 在那種情況 , 這些每個(gè)人剩下的單一策略構(gòu)成的向量稱為 累次剔除劣策略 ( IEDS) 的結(jié)局 , 該博弈則稱為 占優(yōu)可解的 。通過(guò)這種做法,又建立了一個(gè)在前三輪中為劣策略的集合;稱這個(gè)集合為 Di (Ⅲ )。 一個(gè)策略 si 現(xiàn)在成為劣的 , 是指:假定每一個(gè)其他局中人也都在第 Ⅰ 輪中剔除了劣策略之后 , 在 Si ? Di(I)中存在另外一個(gè) , 它始終至少與 si一樣地好 , 而在某些時(shí)候嚴(yán)格地好于 si。 假如美國(guó)和非洲關(guān)于三個(gè)候選人的中意順序如下: 美國(guó): 非洲: BAH ??HAB ??非洲 HAA HHA HAB HHB BAA BHA BAB BHB 美國(guó) A 1, 1 1, 1 1, 1 1, 1 1, 1 1, 1 1, 1 1, 1 B 1, 1 0, 0 1, 1 0, 0 1, 1 0, 0 1, 1 0, 0 H 1, 1 1, 1 0, 0 0, 0 1, 1 1, 1 0, 0 0, 0 在一輪剔除之后 , 實(shí)際上的博弈成為: 美國(guó)\非洲 HHA A 1, 1 B 0, 0 H 1, 1 占
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1