freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博奕論講稿(上海財(cái)大施錫詮)-wenkub

2023-05-23 13:12:00 本頁(yè)面
 

【正文】 個(gè)展開型博弈可以寫成策略型且反之亦然。 BNN。 ANN。特別地,每個(gè)投票人有下述 8個(gè)策略可供選擇 *。 π i 將表示 局中人 i的盈利 (或馮 ?諾依曼 摩根斯坦效用 )函數(shù)。 策略型 : 局中人 2 北 南 局中人 1 高 π1 , π2 π1 , π2 (高 ,北 ), (高 ,北 ) (高 ,南 ),(高 ,南 ) 低 π1 , π2 π1 , π2 (高 ,北 ), (高 ,北 ) (高 ,南 ), (高 ,南 ) 當(dāng)局中人多于兩個(gè),以及每個(gè)局中人有兩個(gè)以上的策略時(shí),對(duì)策略型的三個(gè)分量使用下述符號(hào): 局中人 將標(biāo)記為 1, 2, … , N。 5. 博弈中的盈利應(yīng)當(dāng)被視為馮 ?諾伊曼 摩根斯坦效用 。 2. 博弈規(guī)則有兩種主要的表示式 , 展開型和策略型 。與贏相聯(lián)的盈利數(shù)必定高于對(duì)應(yīng)于輸?shù)挠麛?shù);假設(shè)這些數(shù)分別為 1與 1。由于局中人在任何一個(gè)信息集里不能區(qū)分決策結(jié),策略詳細(xì)說(shuō)明了在每一個(gè)結(jié)所做的行動(dòng) 。 ―誰(shuí) ” , “ 什么 ” ,和 “ 何時(shí) ” :展開型 展開型 規(guī)則的一種圖形表示式。 對(duì)于整個(gè)局中人群體來(lái)說(shuō) , 這些結(jié)局并不總是稱心的 。 , 選取聯(lián)合國(guó)秘書長(zhǎng) , 動(dòng)物習(xí)性 , 和 OPEC的生產(chǎn)策略等廣泛不同的問(wèn)題 。 投票過(guò)程如下:首先 , 讓議案 A與議案 B互相競(jìng)爭(zhēng);然后 , 競(jìng)爭(zhēng)的獲勝方與原來(lái)法律互相競(jìng)爭(zhēng) , 為簡(jiǎn)便起見(jiàn) , 我們將原法律稱為 “ 都不贊成 ”( 或者 N) 。 在 “ 拿子游戲 ” Nim中,無(wú)論那個(gè)局中人,取走最後火柴者算贏。 有兩堆火柴 , 和兩個(gè)局中人 。但是,債權(quán)人可以在破產(chǎn)宣告之前促使法庭去收帳 (雖然通過(guò)這種做法債權(quán)人可能逼迫公司陷入破產(chǎn) )。這里, “ 局中人群體 ” 是眼睛盯著同一獵物的所有動(dòng)物。另外,他們也可能承諾在證券有效期內(nèi)定期地支付固定額的錢款。)他們 “ 互相作用和影響 ” 著,因?yàn)槠渌说臉?biāo)價(jià)決定了一個(gè)投標(biāo)人是否分配到任何債券,也可能決定了投標(biāo)人支付的價(jià)錢。 ? 債券拍賣:正常情況下,美國(guó)財(cái)政部通過(guò)拍賣形式處理政府證券 *。 “ 相互作用 ” 起因于藥的最先開發(fā)者將獲得最大的收益(由于專利權(quán)的緣故)。D)經(jīng)費(fèi)支出占美國(guó)制藥公司年銷售額的 20%之多。 “ 理性策略 ” 的應(yīng)用需要運(yùn)動(dòng)員根據(jù)獲勝的機(jī)會(huì)以及如果服用了興奮劑之后被逮到的機(jī)會(huì)之間進(jìn)行比較而作出決策。他們之間的 “ 相互作用 ” 來(lái)自于這樣的事實(shí):為了寫一篇論文,需要付出一定的工作量;因此,如果一個(gè)學(xué)生偷懶,另外的某個(gè)人在論文到期前的夜晚不得不投入額外的幾個(gè)小時(shí)。 博弈論 是考慮以下每一項(xiàng)條款的正規(guī)方法: 群體 ——在任何博弈中有不止一個(gè)決策者;每一個(gè)決策者稱為局中人 相互作用 ——任何單個(gè)局中人的行為直接影響到群體內(nèi)至少一個(gè)其他的局中人 。 ? 運(yùn)動(dòng)會(huì)和工作場(chǎng)所的隨機(jī)藥物檢測(cè)(選取少量運(yùn)動(dòng)員和工作人員進(jìn)行核實(shí)使用違禁藥物的測(cè)試) 。 ) ? 這些行動(dòng)產(chǎn)生什么樣的結(jié)局 ? 對(duì)于整個(gè)群體 , 這個(gè)結(jié)局好嗎 ? ? 如果群體不止一次地互相作用 , 會(huì)有任何差異嗎 ? ? 如果每一個(gè)體對(duì)群體內(nèi)其他個(gè)體的特性沒(méi)有把握 ,答案將發(fā)生怎樣的變化 ? 取自經(jīng)濟(jì)學(xué),政治學(xué),財(cái)政金融,法律,甚至日常生活中的若干相互依存性事例 ? 藝術(shù)品拍賣 (諸如在克里斯蒂( Christie)或索士比( Sotheby)拍賣行,那里待售出自布拉克( Braque)直至維羅內(nèi)塞( Veronese)的藝術(shù)品 )和債券拍賣(美國(guó)財(cái)政部為籌措聯(lián)邦預(yù)算支出,以這種方式出售政府公債) 。 ? 聯(lián)合國(guó)的選舉( 例如,選舉新的聯(lián)合國(guó)秘書長(zhǎng)) 。 ? 破產(chǎn)法(詳細(xì)說(shuō)明在什么時(shí)候和有多少債權(quán)人可以從已破產(chǎn)的公司那兒收賬) 。 策略 ——單個(gè)局中人在決定自己所取的行動(dòng)時(shí) , 會(huì)考慮到相互依存性 。 “ 策略 ” 運(yùn)用包含了估計(jì)群體內(nèi)總想占別人便宜者的可能性,“ 理性 ” 參與需要對(duì)較好分?jǐn)?shù)的好處與額外工作的成本仔細(xì)地進(jìn)行比較。類似地,它要求 IOC根據(jù)檢測(cè)成本和清白聲譽(yù)的價(jià)值而制定藥物檢測(cè)的程序和相應(yīng)的懲罰措施。以及平均來(lái)說(shuō),一種新藥的開發(fā)成本大約為 3億 5千萬(wàn)美元。如果 Ramp。主要的投標(biāo)人是投資銀行,如萊曼兄弟( Lehman Brothers) 或摩里爾 ?林奇( Merrill Lynch)等(他們轉(zhuǎn)而將證券出售給他們的客戶)。如果投標(biāo)基于可能的競(jìng)爭(zhēng)上和在支付太多與得不到任何債券的風(fēng)險(xiǎn)之間達(dá)到適當(dāng)?shù)钠胶?,那么?“ 出價(jià) ” 是 “ 理性的 ” 和 “ 策略的 ” 。 來(lái)自生物學(xué)與法律方面的例子 ? 動(dòng)物習(xí)性:剛過(guò)去的 25年里,博弈論更吸引人的應(yīng)用之一已經(jīng)深入生物學(xué)領(lǐng)域,特別是關(guān)于動(dòng)物之間爭(zhēng)斗和競(jìng)爭(zhēng)的分析。由于資源的有限性,它們互相影響著。這里,債權(quán)人 “ 群體 ” 內(nèi)的 “ 相互作用 ” 來(lái)自于這樣的事實(shí):個(gè)別債權(quán)人能夠成功地依法占有的錢就不再可能屬于其他任何一個(gè)人。 游戲從局中人 1開始 , 此后局中人輪流行動(dòng) 。而在 Marienbad,誰(shuí)拿走最后的火柴,那么這個(gè)局中人就算輸。 在兩輪投票中的每一輪 , 獲多數(shù)票的法案算勝出 。 150年前 。 博弈的規(guī)則: 每個(gè)博弈通過(guò)一組規(guī)則進(jìn)行,規(guī)則必須說(shuō)明四件事: ? “ 誰(shuí) ” ( Who) 在參與 ——策略地互相作用的局中人群體 。主要的畫圖形式稱為博弈樹,是由一個(gè)根和若干枝依次排列組成。 正則(或策略)型 博弈規(guī)則中另一種表示方式稱為 正則型 或 策略型 策略型 有關(guān) “ 局中人,他們每一個(gè)人可使用的策略,和每人的得益 ” 的完整的一覽表。 局中人 1 局中人 1 1, 1 1, 1 1, 1 局中人 2 (0, 0) 1, 1 1, 1 (2, 1) (0, 1) l 局中人 2 (1, 0) (0, 1) (1, 1) (1, 0) (2, 0) r L u R d m 策略型表示式如下: 1 / 2 lL lR rL rR u 1, 1 1, 1 1,1 1, 1 m 1, 1 1, 1 1, 1 1, 1 d 1, 1 1, 1 1, 1 1, 1 投票博弈 假如一個(gè)投票人所贊成的議案通過(guò),她得到的盈利為 1。 3. 展開型是博弈的圖形表示 , 它明確地說(shuō)明了局中人選擇的順序 , 每個(gè)局中人有多少次選擇 ( 以及每次她可適用的選擇 ) , 和對(duì)于任何選擇序列每個(gè)局中人最終的盈利 。 對(duì)于不確定情況 , 盈利應(yīng)當(dāng)在不確定性的所有可能解上取期望值而計(jì)算得到 。一個(gè)局中人代表將表示為第 i個(gè)局中人。對(duì)于策略組合, s1*, s2*, … , sN*,其中每一個(gè)局中人相應(yīng)于一個(gè)策略,局中人 i的盈利將表示為 π i (s1*, s2*, … , sN*)。 AAN。 BAN。 *當(dāng)然,投票人知道她在第一輪中自己是怎樣投票的。 案例:藝術(shù)品拍賣的策略型 ? 藝術(shù)品拍賣:描述 假如我們被帶入位于紐約洛克菲勒中心的索士比 ?派克伯尼特的大型拍賣場(chǎng)之一 。 你必須開始做如下的事 。 ) 出價(jià)程序: 一旦輪到標(biāo)號(hào) 264, “ 你出價(jià)所必須做的就是舉起你的拍賣牌并等待拍賣商理會(huì)你 , 你不必叫出你出價(jià)的數(shù) ——通常由拍賣商以 10%的增量自動(dòng)確定高一些的出價(jià) 。 ? 結(jié)局:最后一個(gè)舉牌的拍賣者贏得雷諾依作品(抓耳撓腮者不能得到)。 在這種情況,我們稱 si為劣策略。于是策略 si稱作強(qiáng)劣的。 一個(gè)策略的組合 , 如果每一個(gè)局中人的策略都是占優(yōu)策略 , 那稱這個(gè)策略的組合為占優(yōu)策略解 。從不同的方式講,如果你認(rèn)為畫值 3000美元,你最好的辦法是閉上你的眼睛,舉著你的拍賣牌直到聽(tīng)到拍賣商宣布的叫價(jià)高于 3000美元為止 為什么它是個(gè)占優(yōu)策略,與其他幾個(gè)策略作比較?,F(xiàn)在,你感覺(jué)自己象個(gè)傻瓜!你失去了一幅估價(jià)為 3000美元的畫,而你用(稍高于2700美元)就可以擁有它。 對(duì)于更多的局中人情況 , 符號(hào)表示式更方便一些 。 , 博弈存在占優(yōu)策略解 。將劣策略認(rèn)為 “ 壞 ” 策略,而將非劣策略認(rèn)為 “ 好 ” 策略 iiiiiiiiiiiiiissssssssss???????????),?,()?,(),(),(對(duì)所有對(duì)所有????2. 累次剔除劣策略 局中人 1 局中人 2 左 (L) 右 (R) 上 (U) 1, 1 0, 1 中 (M) 0, 2 1, 0 下 (D) 0, 1 0, 0 3 .更多例題 例 1: 伯川德(價(jià)格)競(jìng)爭(zhēng) 假設(shè)雙寡壟斷市場(chǎng)中的兩個(gè)公司都可以開出三個(gè)價(jià)格中的任一個(gè) ——高,中或低。 例如,對(duì)于公司 1,只有當(dāng)它的價(jià)格不高于公司2的價(jià)格,才能有所收益。 ” 至于盈利 , 讓我們使用約定 , 如果他最愿意的方案通過(guò) , 則獲盈利 1, 第二喜歡的通過(guò) , 盈利為 0, 如果第三喜歡 ( 即 , 最不喜歡 )方案通過(guò) , 則他的盈利為 1。 可以看到如果投票人在第 Ⅱ 輪中真實(shí)地投票 , 那么在那個(gè)階段 , A擊敗 N, 而 B輸給 N。投票人 1——美國(guó) ——首先投票并著手否決三個(gè)候選人 A( 安南 ) , B( 加利 ) , 和 H( 布魯特萊特 ) 中的一個(gè) 。 就是說(shuō) , 不啟用 Di(I)中的策略 , 這對(duì) i = 1, 2, … , N均成立 。記局中人 i在第 Ⅰ 輪中或者在第 Ⅱ 輪中為劣的所有策略的全體為 Di (Ⅱ )。 [1] 尤其 Si – Di(I)包含了策略向量( s1, …, si – 1, si + 1, …, sN),其中每一個(gè)策略 sj都是非劣的。 沒(méi)有人會(huì)采用劣策略是合理的假設(shè) 。 如果其他局中人某一次理性的 “ 失誤 ” 可能代價(jià)昂貴的話 , 這尤其成問(wèn)題 。 不是所有的博弈都是占優(yōu)可解的 。 而且一個(gè)理性的局中人不認(rèn)為他的對(duì)手會(huì)采用劣策略 。 第 4章 納什均衡 定義 例題 案例研究 IEDS和納什均衡之間的一般關(guān)系 局中人 i的策略與其他局中人的策略向量 ,如果它們滿足 對(duì)所有 si, 則稱是關(guān)于的 最優(yōu)反應(yīng) 。 生物學(xué)家試圖解釋有關(guān)動(dòng)物爭(zhēng)斗的兩個(gè)特定程式的事實(shí): 1. 多數(shù)沖突無(wú)需戰(zhàn)斗而得到解決 。必定是這樣的情況: IEDS結(jié)局是納什均衡。 , 每一個(gè)局中人的策略選擇是關(guān)于他對(duì)手選擇的最優(yōu)反應(yīng) 。 察到的習(xí)性形式 。 兩家公司在市場(chǎng)上面臨單純的需求曲線 , 假設(shè)需求曲線為 Q = ? – ?P 其中 ? 0, ? 0。 每家公司將生產(chǎn)多少 ? 為做出該決策 , 每家公司必須采取兩步: 1. 對(duì)另一家公司的生產(chǎn)量進(jìn)行預(yù)測(cè) 。 當(dāng)兩家公司滿意地解決了這兩件事時(shí) , 將得到工業(yè)范圍的 ——或納什 ——均衡 。 bca4?2ca ?bca8)( 2?第 6章 應(yīng)用:公共問(wèn)題 ?公共問(wèn)題 ?簡(jiǎn)單的模型 ?社會(huì)最優(yōu)性 ?在人口眾多時(shí)問(wèn)題更糟 公共問(wèn)題存在著兩個(gè)關(guān)鍵性的特征: ? (幾乎 ) 每個(gè)人的享用 。 簡(jiǎn)單的模型 假如我們有大小為 y 0的公共財(cái)產(chǎn)資源 。 為使事情簡(jiǎn)便 , 將未來(lái)緊縮成恰好還有一個(gè)周期的消費(fèi);即 , 在這個(gè)模型中有兩個(gè)時(shí)間周期 。 2)( 21 ccy ??我們回到第 1周期,如果局中人 1消費(fèi) c1,他這樣做的效用將取為 log c1, 局中人 1必須確定他從資源的可利用儲(chǔ)備中可以消費(fèi)多少。 這種方法可求得社會(huì)最優(yōu)解為 。結(jié)果,在第 1周期后留下的量是 y/(n+1)。這個(gè)局中人的一個(gè)混合策略是分布在他的純策略上的概率分布;即,它是一個(gè)概率向量 (p1, p2, … , pM),其中 pk ? 0, k = 1, 2, … , M,且 特別簡(jiǎn)單的混合策略是每一個(gè)純策略為等可能的,即 。 那么局中人 i的期望盈利等于 )],()1(),()1([)],(),([**1111iMiMiiiMiMiissqpssqpssqpssqp?????????????????????討論使用混合策略而不使用純策略的含義 定義 。如果這個(gè)支撐中每一個(gè)純策略的盈利不相同,那么剔除具有最高盈利的純策略之外的所有其他純策略必定可以提高平均數(shù),即,必定增加期望盈利。 混合策略可以優(yōu)于某些純策略 混合策略能虛張聲勢(shì) 混合策略和納什均衡 沒(méi)有混合策略,納什均衡未必一定存在。這類博弈稱為 常數(shù)和博弈 。策略 b(s1) 形式上定義為 ),(m in)](,[ 21112sssbss?? ?在 傳統(tǒng)方法 中,局中人 1
點(diǎn)擊復(fù)制文檔內(nèi)容
范文總結(jié)相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1