freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈理論知識講義(編輯修改稿)

2025-07-19 12:22 本頁面
 

【文章內(nèi)容簡介】 重復(fù)雙頭壟斷,如果兩個廠商都執(zhí)行古諾博弈均衡策略,則得到利潤;如果以共同利潤最大化決定產(chǎn)量水平,即執(zhí)行卡特爾行動,則得到利潤。我們知道,一次性博弈中共同利潤最大化的產(chǎn)量不是博弈均衡,每個廠商都有激勵去傾銷額外數(shù)量的產(chǎn)品,如果他認(rèn)為其他廠商將保持產(chǎn)量不變的話。但是在重復(fù)博弈中,只要貼現(xiàn)率不太高,合作起來以使共同利潤最大化之策略,將是重復(fù)博弈的最優(yōu)解??梢宰C明,如果這種簡單的雙頭壟斷博弈是一次性的,那么每個廠商以古諾產(chǎn)量生產(chǎn)將是博弈的最優(yōu)解。但是,如果這個博弈是不斷重復(fù)的,那么每個廠商都采取按照卡特爾產(chǎn)量生產(chǎn)的策略,即都選擇合作,將是雙頭壟斷重復(fù)博弈的最優(yōu)解。對不合作的適當(dāng)懲罰,是采取生產(chǎn)古諾產(chǎn)量水平這一策略。可見,在不斷重復(fù)的雙頭壟斷博弈中,由于一次性博弈均衡這種懲罰策略的存在,局中人都將以長遠(yuǎn)利益為重,來維持卡特爾。第四節(jié) 混合策略并非所有博弈都有嚴(yán)格確定的結(jié)局。進(jìn)一步,實際中博弈局中人常常希望自己的行動隱秘不被暴露,不被對手覺察。對于這兩個問題,目前意義上的策略博弈是解決不了的。在博弈非嚴(yán)格確定或者局中人希望保守秘密的情況下,局中人的最好做法是采取混合策略,即以一定的概率采取某種策略。這樣做,甚至連局中人自己也不知道每一次行動中究竟采取什么策略,競爭對手就更不得而知了。而且對于非嚴(yán)格確定的博弈來說,采用混合策略就可求得最優(yōu)解。當(dāng)一種混合策略以概率1選擇某種策略時,這種策略就是前三節(jié)所談?wù)摰摹凹儭辈呗裕梢娀旌喜呗詳U(kuò)展了策略概念。一.混合策略的概念我們以兩人博弈為例,來對混合策略的概念以及采取混合策略時局中人的行動目標(biāo)進(jìn)行解釋。至于更一般的多人博弈,將在下一節(jié)中討論。設(shè)為有限二人策略博弈,其中為局中人甲的策略集合,為乙的策略集合,和分別為甲和乙的收益函數(shù)。局中人為了保持自己決策的秘密性,不再象以前那樣選擇純策略,而決定采用隨機(jī)辦法來選擇策略。也就是說,局中人對純策略的選擇由某種隨機(jī)裝置來決定,對每個純策略來說,采用它只有可能性的大小,也就是用多大的概率來選擇各個純策略。這樣,對方就不可能事先知道究竟選擇哪個純策略,甚至連局中人自己也不可能事先知道,而純策略是在最后時刻借助隨機(jī)裝置選擇出來的。通過借助隨機(jī)裝置,局中人原來對純策略的選擇變成為現(xiàn)在對各個純策略的概率大小的選擇。如果還嫌借助隨機(jī)裝置給出的選擇各個純策略的概率大小具有一定的客觀性,怕被對方估計出來,局中人還可進(jìn)一步采取主觀概率分布,以使對純策略的選擇帶有真正的不確定性(參見第六章關(guān)于主觀概率的介紹)。這種以某種概率選擇的策略就是混合策略,更準(zhǔn)確地說,選擇混合策略就是選擇一個概率分布,然后按照這個分布給出的概率來選擇各個純策略。假如甲選擇策略的概率為 ,則向量代表著甲選擇各種純策略的概率分布,實際上就表示了甲的一種混合策略。這就是說,混合策略是用概率分布來表示的,混合策略的變化完全反映為概率分布的變化。今后,我們把概率分布就稱為局中人甲的混合策略。原來的純策略可看成是這樣的一種混合策略:以概率1選擇策略,以概率0選擇其他策略。如此一來,甲的策略集合由原來的純策略集合擴(kuò)張成為混合策略集合。同樣,局中人乙的選擇集合也由原來的純策略集合擴(kuò)張成為混合策略集合。當(dāng)甲采取混合策略,乙采取混合策略時,就稱為博弈的混合局勢。在采取混合策略的情況下,局中人的目標(biāo)是要使預(yù)期收益最大化。當(dāng)甲采取混合策略,乙采取混合策略時,甲和乙的預(yù)期收益分別為和:這里,和都寫成行向量形式,“”為轉(zhuǎn)置運算。甲的收益函數(shù)由原來的擴(kuò)充成為,乙的收益函數(shù)由原來的擴(kuò)充成為。在策略集合和收益函數(shù)都得到擴(kuò)充以后,原來的純策略博弈就擴(kuò)充成為混合策略博弈,而且可看成是一般的二人博弈,不過這個博弈的收益函數(shù)具有雙線性性,即對于任何,及任何實數(shù),都成立:的混合局勢就是的局勢。博弈叫做純策略博弈的混合擴(kuò)充。關(guān)于混合擴(kuò)充,下述兩個事實是明顯的:(1) 博弈是常和博弈當(dāng)且僅當(dāng)混合擴(kuò)充是常和博弈。(2) 如果是常和博弈,則混合擴(kuò)充保持了原來博弈的收益和?;旌蠑U(kuò)充的最優(yōu)解(均衡),叫做原博弈的最優(yōu)混合解(混合均衡)。也即是的最優(yōu)混合解,是指且。當(dāng)是的最優(yōu)混合解時,和分別叫做甲和乙的最優(yōu)混合策略??梢宰C明:(3) 純策略博弈的最優(yōu)解必然是混合擴(kuò)充的最優(yōu)解。(4) 當(dāng)是常和博弈時,是的最優(yōu)混合解當(dāng)且僅當(dāng)。從(4)可知,是常和博弈的最優(yōu)混合解當(dāng)切僅當(dāng)是預(yù)期收益函數(shù)的鞍點。應(yīng)用第二節(jié)的鞍點定理,我們得到常和博弈的最優(yōu)混合解的又一判別條件:(5) 設(shè)是二人常和博弈,則是的最優(yōu)混合解的充分必要條件是 。二.混合策略的意義有時,給予混合策略一個有意義的解釋是困難的。第一節(jié)例1所述的便士匹配博弈,由于收益矩陣沒有鞍點,因而沒有純策略意義下的最優(yōu)解。但由于硬幣出現(xiàn)正面或反面,總有一個概率分布情況,因此采取混合策略來把便士匹配博弈加以擴(kuò)充,然后尋找混合策略意義下的最優(yōu)解,這顯然是我們大家都能夠感覺得到的應(yīng)該采取的做法。然而對于象雙頭壟斷這樣的一些其他經(jīng)濟(jì)利益博弈來說,采取混合策略似乎是不現(xiàn)實的。除了混合策略在一定范圍內(nèi)缺乏現(xiàn)實意義外,還有一些邏輯上的原因?qū)е聦旌喜呗噪y以解釋。我們用一個例子來說明這一點。例1.性別博弈(Battle of the Sexes)性別博弈收益表卡夫茹達(dá)話劇足球話劇2,10,0足球0,01,2這里介紹的博弈背后隱藏的故事是一場“性別之戰(zhàn)”。茹達(dá)(Rhonda,女)和卡夫(Calvin,男)本周末一起歡度良宵,但他們二人的娛樂愛好不同。茹達(dá)喜歡看話劇,而卡夫喜歡看足球比賽。如果他們同時選擇看話劇,則茹達(dá)可得2個單位的效用,卡夫可得1個單位的效用;如果同時選擇看足球比賽,則他們得到的效用正好與此相反;如果他們選擇不同的娛樂,則得不到任何效用。右表給出了茹達(dá)和卡夫的收益情況。我們來看一看茹達(dá)和卡夫之間這場“性別之戰(zhàn)”博弈的結(jié)局究竟如何。首先,讓我們尋找該博弈的所有純策略意義下的最優(yōu)解。通過對各種策略進(jìn)行逐一相互比較,不難看出“(話劇,話劇)”和“(足球,足球)”都是純策略最優(yōu)解,即茹達(dá)和卡夫選擇相同的娛樂,才是最好的做法。然后,我們來尋找混合策略意義下的最優(yōu)解。茹達(dá)的收益矩陣和卡夫的收益矩陣為:,茹達(dá)的預(yù)期收益為,卡夫的預(yù)期收益為。因此,最優(yōu)混合策略問題可歸結(jié)為如下的約束極值問題:應(yīng)用KuhnTucker條件(參見第七章第八節(jié)),上述極值問題的解為,,,。這就是說,茹達(dá)以概率選擇看話劇,以概率選擇看足球比賽;卡夫以概率選擇看話劇、以概率選擇看足球比賽,是性別博弈的最優(yōu)混合局勢。這個最優(yōu)解有這樣幾個特點:第一,茹達(dá)和卡夫采取最優(yōu)混合策略的預(yù)期收益都等于2/3;第二,如果茹達(dá)采取最優(yōu)混合策略,那么不論卡夫采取什么純策略,卡夫的預(yù)期收益也都是2/3;第三,如果卡夫采取最優(yōu)混合策略,那么不論茹達(dá)采取什么純策略,她的預(yù)期收益也都是2/3。這樣一來,還有什么理由要求茹達(dá)和卡夫雙方都采取最優(yōu)混合策略呢?看來,要想人們采取混合策略,必須有一些更加令人興奮的理由。本例說明,從邏輯上講,采用混合策略沒有多少道理。盡管如此,在某些情況下這種邏輯上的毛病不會帶來嚴(yán)重問題。例如,假定有一大群人在隨機(jī)碰面并玩便士匹配游戲,甲是其中一員。設(shè)最初每個人都按概率分布(1/2,1/2)執(zhí)行唯一的最優(yōu)混合策略,到最后有些人便厭倦于執(zhí)行此混合策略,而決定總是玩正面游戲或總是玩反面游戲。如果決定總出正面的人數(shù)等于決定總出反面的人數(shù),那么各個局中人的選擇問題不會有明顯變化:每個人仍然理性地以為他的對手以50%的可能性出正面或反面。也就是說,雖然每個人都決定采取純策略而總是出正面或反面,但當(dāng)甲隨機(jī)碰到一個局中人時,該人是出正面還是反面,甲不得而知,只能作出這樣的判斷:該人出正面的可能性為50%。這等同于該人采取混合策略。對混合策略的另一種解釋是:考慮某人在一次性博弈中出正面還是反面的選擇,這個選擇被看作是依賴于一些為對手所不能確定的特殊因素。比如,該人心想“正面”時就出正面,心想“反面”時就出反面。這種“心想”因素是很難為對手所把握的,一個人可以自我覺察到自己的心情,但其他人(對手) 卻難以覺察這個人的心情。因此,每個局中人都會認(rèn)為其他人對策略的選擇是隨機(jī)的。這樣,采取混合策略就是一件有意義的事情。第五節(jié) 矩陣博弈的古諾均衡前面介紹的博弈最優(yōu)解(均衡)概念,假定了局中人各自獨立行動,沒有合作。這種非合作二人博弈均衡概念,最早是由古諾提出來的,稱為古諾均衡。無合作意味著局中人之間存在著利害沖突,互相對抗,互為對手。矩陣博弈(即二人零和博弈)是對這種或?qū)範(fàn)顟B(tài)的簡明刻畫,本節(jié)就下面就矩陣博弈均衡的存在性與算法問題及其均衡的性質(zhì)進(jìn)行討論。一.均衡的存在性收益矩陣的鞍點未必存在,這使得矩陣博弈的均衡未必存在。但當(dāng)采用混合策略時,情況就不同了:矩陣博弈的最優(yōu)混合解總是存在的。下面用von Neumann(1937)的構(gòu)造性方法來證明這一事實,構(gòu)造性方法本身蘊含著古諾均衡的一種計算方法。矩陣博弈均衡的存在性.任何矩陣博弈都有混合均衡。具體來說,設(shè) 為矩陣博弈,,為的混合擴(kuò)充,則必存在滿足。本定理的證明較長,會令讀者感到枯燥。但證明過程給出了古諾均衡的計算方法,學(xué)習(xí)掌握這一計算方法是重要的,讀者有必要靜下心來琢磨一下。首先注意,令,則是的均衡當(dāng)且僅當(dāng)。本定理的證明將基于這一事實。另外,可以看出和具有下面三條性質(zhì):(1) 對任何,都有;(2) 對任何,都有;(3) 對任何,都有。進(jìn)一步,假定收益矩陣的各行已經(jīng)過調(diào)整,使得。這個假定并不是說增加了額外的條件,而是說在安排策略集中諸策略的編號時,可以讓編號滿足這個要求。以下的證明分三步走。第一步:定義基和最優(yōu)基;第二步:構(gòu)造最優(yōu)基;第三步:從最優(yōu)基得出混合擴(kuò)充的均衡。第一步:定義基和最優(yōu)基首先定義收益矩陣的增廣矩陣如下:的首行、首列叫做第0行、第0列,即首行行標(biāo)為0,首列列標(biāo)為0。用表示的第列,并令。從增廣矩陣的列中選出列,構(gòu)成一個階方陣:。如果滿足下面三個條件:(b1) 是的首列,即;(b2) 是非奇異的矩陣,即行列式;(b3) 的逆矩陣中除首行外,其余各行的第一個非零元素皆為正數(shù)。則稱是一個基(base)。如此定義的基必然存在。例如,矩陣就是一個基。事實上,符合條件(b1)和(b2)是明顯的。對于條件(b3),注意的逆矩陣如下:而,故符合條件(b3)。這就證明了是基?,F(xiàn)在對于任何一個基來說,用表示的第行。則從(其中為階單位陣)知,這里當(dāng)時,而當(dāng)時。這說明,可見在個內(nèi)積 中,至少有個為零。如果其余個內(nèi)積均非正,那么就稱是一個最優(yōu)基(optimal base)。換句話說,基是最優(yōu)基,是指,即的首行向量與的后個列向量的內(nèi)積全非正。第二步:用迭代法構(gòu)造最優(yōu)基任意指定一個基(比如上面的基),從出發(fā)來構(gòu)造最優(yōu)基。用表示的第行,表示的第列,并檢查是否為最優(yōu)基,即檢查不等式是否對一切都成立。如果是最優(yōu)基,則目的已達(dá)到。如果不是最優(yōu)基,則,此時需做下面的工作:(1) 找出一個使。若的諸列中符合這個條件的列不止一個,那么就取列標(biāo)最小者。(2) 從方程解出列向量。這樣得到的列向量必然滿足且中必有正數(shù)。事實上。假如中沒有正數(shù),那么給出,從而增廣矩陣的首列是的個列的正線性組合;然而根據(jù)的定義,不能表示成的個列的正線性組合,出現(xiàn)矛盾。矛盾的結(jié)論說明中必有正數(shù)。(3) 找出符合條件的列,這里的是指在向量之間的字典序下求最小元,字典序是從向量的第一個分量開始比較的。如此找到的列必然是唯一的,即滿足該條件的是唯一的。的唯一性保證了只要且,那么的第一個非零分量必為正數(shù)。事實上,假如符合條件的不唯一,比如說和都滿足該條件且,那么根據(jù)字典序的定義可知必有,從而的行向量組線性相關(guān),這是不可能的。(4) 用替換的第列,并保持的其他列不變,得到一個階方陣。這個矩陣必然也是基。我們來證明是基,即證明滿足基的三個條件(b1)、(b2)和(b3)。首先,根據(jù)的定義。這說明的首列未被替換,即和具有相同的首列。所以,滿足條件(b1)。其次,既然且,從行列式的性質(zhì)便可知。所以,也滿足條件(b2),即是可逆矩陣。最后檢查條件(b3),即檢查的逆矩陣各行(首行除外)的第一個非零元素是否為正數(shù)。為此,令,其中 。首先來驗證,這里為階單位矩陣。注意,告訴我們,對一切成立。下面的驗證過程中,這一事實將被多次應(yīng)用。再注意,和僅僅在第列上有區(qū)別:;而當(dāng)時??疾斓牡谛小⒌诹械脑兀寒?dāng)時,;當(dāng)時,;當(dāng)時,;當(dāng)時,;當(dāng)時, 。總之,當(dāng)時,;當(dāng)時。這就證明了,即是的逆矩陣:。現(xiàn)在來從的第1行到第行,考察各行第一個非零元素是否為正數(shù)。首先看的第行:由于,且的第一個非零元素為正數(shù),因此的第一個非零元素也為正數(shù)。再看第行:。當(dāng)時,的第一個非零元素確實為正數(shù);當(dāng)時,(3)已經(jīng)說明了的第一個非零元素為正數(shù)。總之,除了的首行外,其余各行的第一個非零元素都為正數(shù)。到此,條件(b3)得到驗證。(5) 如果不是最優(yōu)基,那么對進(jìn)行類似的修正,即對重復(fù)以上步驟(1)至(4),得到一個基;如果還不是最優(yōu)基,就對重復(fù)以上步驟,得到又一個基;這樣不斷做下去,必然到某一步,比如第步時,得到的基就是最優(yōu)基。為什么不斷重復(fù)修正下去就能得到最優(yōu)基呢?為了說明這個問題,我們來看一下從基到基有什么改進(jìn)。注意,被吸收進(jìn)來的列滿足條件:且。被排除出去的列滿足條件:且。是因為是矩陣的第0行、第列的元素;是因為 。如果不是最優(yōu)基,那么對進(jìn)行類似于那樣的修正,得到另一個基。被排除出去,就不會把它重新吸收進(jìn)來,因為被新吸收進(jìn)來的列滿足,而不滿足這個條件,事實上。如果還不是最優(yōu)基,那么再次重復(fù)以上過程,得到又一個基??梢宰C明,不會把以前從基中排除出去的列重新吸收進(jìn)來。這樣不斷進(jìn)行下去,各次得到的基是互不相同的,而且每次更換基中的某列時,都不會把以前各次中被排除出基的列重新吸收進(jìn)來,可見迭代至多進(jìn)行次。最后一次構(gòu)造出來的基必然是最優(yōu)基。第三步:從最優(yōu)基得出混合擴(kuò)充的均衡。設(shè)為一最優(yōu)基,不妨假定。用表示的首行,表示的首列。令 ,并定義如下:對任何,當(dāng)時,;而當(dāng)時,
點擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1