freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈理論知識(shí)講義-全文預(yù)覽

  

【正文】 不會(huì)全為零。可見(jiàn),我們只需證明事實(shí)(I)和事實(shí)(II)。我們斷定:是混合擴(kuò)充的均衡。第三步:從最優(yōu)基得出混合擴(kuò)充的均衡。如果還不是最優(yōu)基,那么再次重復(fù)以上過(guò)程,得到又一個(gè)基。被排除出去的列滿足條件:且。到此,條件(b3)得到驗(yàn)證。首先看的第行:由于,且的第一個(gè)非零元素為正數(shù),因此的第一個(gè)非零元素也為正數(shù)??疾斓牡谛小⒌诹械脑兀寒?dāng)時(shí),;當(dāng)時(shí),;當(dāng)時(shí),;當(dāng)時(shí),;當(dāng)時(shí), 。首先來(lái)驗(yàn)證,這里為階單位矩陣。其次,既然且,從行列式的性質(zhì)便可知。我們來(lái)證明是基,即證明滿足基的三個(gè)條件(b1)、(b2)和(b3)。的唯一性保證了只要且,那么的第一個(gè)非零分量必為正數(shù)。假如中沒(méi)有正數(shù),那么給出,從而增廣矩陣的首列是的個(gè)列的正線性組合;然而根據(jù)的定義,不能表示成的個(gè)列的正線性組合,出現(xiàn)矛盾。若的諸列中符合這個(gè)條件的列不止一個(gè),那么就取列標(biāo)最小者。第二步:用迭代法構(gòu)造最優(yōu)基任意指定一個(gè)基(比如上面的基),從出發(fā)來(lái)構(gòu)造最優(yōu)基。則從(其中為階單位陣)知,這里當(dāng)時(shí),而當(dāng)時(shí)。事實(shí)上,符合條件(b1)和(b2)是明顯的。如果滿足下面三個(gè)條件:(b1) 是的首列,即;(b2) 是非奇異的矩陣,即行列式;(b3) 的逆矩陣中除首行外,其余各行的第一個(gè)非零元素皆為正數(shù)。第一步:定義基和最優(yōu)基;第二步:構(gòu)造最優(yōu)基;第三步:從最優(yōu)基得出混合擴(kuò)充的均衡。另外,可以看出和具有下面三條性質(zhì):(1) 對(duì)任何,都有;(2) 對(duì)任何,都有;(3) 對(duì)任何,都有。本定理的證明較長(zhǎng),會(huì)令讀者感到枯燥。但當(dāng)采用混合策略時(shí),情況就不同了:矩陣博弈的最優(yōu)混合解總是存在的。這種非合作二人博弈均衡概念,最早是由古諾提出來(lái)的,稱(chēng)為古諾均衡。這種“心想”因素是很難為對(duì)手所把握的,一個(gè)人可以自我覺(jué)察到自己的心情,但其他人(對(duì)手) 卻難以覺(jué)察這個(gè)人的心情。也就是說(shuō),雖然每個(gè)人都決定采取純策略而總是出正面或反面,但當(dāng)甲隨機(jī)碰到一個(gè)局中人時(shí),該人是出正面還是反面,甲不得而知,只能作出這樣的判斷:該人出正面的可能性為50%。盡管如此,在某些情況下這種邏輯上的毛病不會(huì)帶來(lái)嚴(yán)重問(wèn)題。這就是說(shuō),茹達(dá)以概率選擇看話劇,以概率選擇看足球比賽;卡夫以概率選擇看話劇、以概率選擇看足球比賽,是性別博弈的最優(yōu)混合局勢(shì)。通過(guò)對(duì)各種策略進(jìn)行逐一相互比較,不難看出“(話劇,話劇)”和“(足球,足球)”都是純策略最優(yōu)解,即茹達(dá)和卡夫選擇相同的娛樂(lè),才是最好的做法。如果他們同時(shí)選擇看話劇,則茹達(dá)可得2個(gè)單位的效用,卡夫可得1個(gè)單位的效用;如果同時(shí)選擇看足球比賽,則他們得到的效用正好與此相反;如果他們選擇不同的娛樂(lè),則得不到任何效用。我們用一個(gè)例子來(lái)說(shuō)明這一點(diǎn)。第一節(jié)例1所述的便士匹配博弈,由于收益矩陣沒(méi)有鞍點(diǎn),因而沒(méi)有純策略意義下的最優(yōu)解。(4) 當(dāng)是常和博弈時(shí),是的最優(yōu)混合解當(dāng)且僅當(dāng)?;旌蠑U(kuò)充的最優(yōu)解(均衡),叫做原博弈的最優(yōu)混合解(混合均衡)。在策略集合和收益函數(shù)都得到擴(kuò)充以后,原來(lái)的純策略博弈就擴(kuò)充成為混合策略博弈,而且可看成是一般的二人博弈,不過(guò)這個(gè)博弈的收益函數(shù)具有雙線性性,即對(duì)于任何,及任何實(shí)數(shù),都成立:的混合局勢(shì)就是的局勢(shì)。當(dāng)甲采取混合策略,乙采取混合策略時(shí),就稱(chēng)為博弈的混合局勢(shì)。今后,我們把概率分布就稱(chēng)為局中人甲的混合策略。如果還嫌借助隨機(jī)裝置給出的選擇各個(gè)純策略的概率大小具有一定的客觀性,怕被對(duì)方估計(jì)出來(lái),局中人還可進(jìn)一步采取主觀概率分布,以使對(duì)純策略的選擇帶有真正的不確定性(參見(jiàn)第六章關(guān)于主觀概率的介紹)。局中人為了保持自己決策的秘密性,不再象以前那樣選擇純策略,而決定采用隨機(jī)辦法來(lái)選擇策略。當(dāng)一種混合策略以概率1選擇某種策略時(shí),這種策略就是前三節(jié)所談?wù)摰摹凹儭辈呗?,可?jiàn)混合策略擴(kuò)展了策略概念。對(duì)于這兩個(gè)問(wèn)題,目前意義上的策略博弈是解決不了的。對(duì)不合作的適當(dāng)懲罰,是采取生產(chǎn)古諾產(chǎn)量水平這一策略。我們知道,一次性博弈中共同利潤(rùn)最大化的產(chǎn)量不是博弈均衡,每個(gè)廠商都有激勵(lì)去傾銷(xiāo)額外數(shù)量的產(chǎn)品,如果他認(rèn)為其他廠商將保持產(chǎn)量不變的話。另外,上面論述中還涉及到了貼現(xiàn)率,并要求貼現(xiàn)率不很高。以上論述實(shí)際上是很有力的,有一個(gè)稱(chēng)為弗爾克(Folk)的著名定理支持了這一論述。這就說(shuō)明,只要貼現(xiàn)率不很高,當(dāng)一方背叛時(shí),另一方也采取背叛給其以懲罰,就能使背叛者償其苦果。如果本次移動(dòng)中一個(gè)人決定背叛,那么另一個(gè)人會(huì)因本次移動(dòng)中采取合作而未得收益,從而從下次以后永遠(yuǎn)采取背叛策略,給對(duì)方以懲罰。具體地說(shuō),設(shè)局中人在時(shí)刻的收益(即第局重復(fù)中的收益)為,他在重復(fù)博弈中的收益就是貼現(xiàn)和,其中為貼現(xiàn)率。當(dāng)博弈的重復(fù)次數(shù)為無(wú)限時(shí),情況就大不相同了。然而,將來(lái)最后一次移動(dòng)中并不能得到合作,雙方都背叛了,結(jié)果倒數(shù)第二次移動(dòng)中雙方也只有采取背叛。由于這是最后一次移動(dòng),將來(lái)不會(huì)再有,因此均衡的標(biāo)準(zhǔn)邏輯推理便得以應(yīng)用,其結(jié)果是局中人雙方都選擇“背叛”策略?,F(xiàn)在來(lái)分析一下“(合作,合作)”局勢(shì)能否成為重復(fù)囚徒博弈的一個(gè)均衡。當(dāng)然,背叛是另一個(gè)局中人的短期利益所在。由于“我的對(duì)手會(huì)基于我的選擇歷史而修正他的行為,我必須在做出自己的選擇時(shí)考慮到這種影響”,所以,重復(fù)博弈的結(jié)果不絕不是一次性博弈的簡(jiǎn)單重復(fù)。反反復(fù)復(fù)地開(kāi)局,給棋手不斷積累經(jīng)驗(yàn),讓棋手的技藝越來(lái)越高。同大部分經(jīng)濟(jì)模擬一樣,在策略選擇的經(jīng)濟(jì)模擬中,如果既要讓博弈簡(jiǎn)單明了以便分析,又要能夠說(shuō)明實(shí)際策略的迭接要素,那么如何表示博弈的策略選擇,就是一項(xiàng)藝術(shù)。似乎應(yīng)該使用多階段博弈,這樣才能捕獲到策略選擇行為的所有可能的內(nèi)容。在策略選擇的經(jīng)濟(jì)模擬中還有另一方面的考慮,乃就是一旦對(duì)手的行為被觀察到,那么對(duì)手的策略應(yīng)該是被承諾的或者是難以改變的。這導(dǎo)致了相當(dāng)不同的均衡,究竟哪一種是正確的呢?如果抽象地看待這個(gè)問(wèn)題,那么“哪一種模型正確”這樣的提問(wèn)并無(wú)什么意義。由此可知局中人甲和乙的反應(yīng)函數(shù)分別為,博弈的最優(yōu)解為。注意,以上關(guān)于反應(yīng)函數(shù)的討論,沒(méi)有要求策略集合的有限性,即集合和可以是任何集合。甲也再次對(duì)乙的行動(dòng)作出反應(yīng),采取新策略。利用反應(yīng)函數(shù),我們也可以解釋博弈的結(jié)局。當(dāng)乙采取了某種策略,而且被甲所覺(jué)察時(shí),甲必然有所反應(yīng),要確定出相應(yīng)的對(duì)策以使自己的收益在乙選擇的情況下達(dá)到最大,即要使。◆既然二人常和博弈的最優(yōu)解恰好就是收益函數(shù)的鞍點(diǎn),鞍點(diǎn)定理告訴我們,當(dāng)收益函數(shù)的鞍點(diǎn)存在時(shí),利用最小最大原理確定的博弈局勢(shì)就是二人常和博弈的最優(yōu)解。這就證明了。下面的定理給出了鞍點(diǎn)的判別條件。一般來(lái)講,要想一個(gè)二人博弈具有確定的結(jié)局,必須存在這樣的局勢(shì):滿足這個(gè)條件的的局勢(shì),叫做博弈的均衡或最優(yōu)解或最優(yōu)局勢(shì),其中的和分別叫做局中人甲和乙的最優(yōu)策略或均衡策略。但是,當(dāng)甲采取時(shí),乙采取的收益小于采取的收益,因而乙要改用策略。請(qǐng)看下面二人零和博弈的事例。但是,若乙采用的不是策略, 而是策略,那么甲如不重新選擇他的收益矩陣第列的最大值的話,他的最大最小收益就不一定能夠達(dá)到,這正是最大最小法同最小最大原理的區(qū)別。乙決策的最小最大原理是:乙先選出收益矩陣的各列的最小值,然后從這些最小值中選出最大值:局中人乙按照最小最大原理確定的策略,稱(chēng)為乙的穩(wěn)妥策略。從收益矩陣來(lái)看這個(gè)決策過(guò)程,即甲首先選出自己的收益矩陣的各行的最小值,然后從這些最小值中再選出最大值:這就是求解策略博弈的最小最大原理,其合理性表現(xiàn)為:如果甲采取按照最小最大原理確定的策略,那么不論乙采取什么策略,甲都可至少得到這個(gè)最小最大收益。二.最小最大原理局中人的目標(biāo)是選擇使自己收益最大化的策略,我們來(lái)分析局中人如何決策。否則,就是變和博弈。這樣每個(gè)局中人的收益不但與自己的選擇有關(guān),而且與對(duì)手的選擇有關(guān),收益函數(shù)是定義在局勢(shì)集合上的函數(shù),這里假定了局中人的收益是可以用實(shí)數(shù)來(lái)都來(lái)計(jì)量的。本節(jié)以二人博弈為重點(diǎn),介紹有關(guān)策略博弈的概念與理論。例如,便士匹配和囚徒難題都是有限博弈,而古諾博弈和貝特蘭博弈都是無(wú)限博弈。正象比較古諾博弈和貝特蘭博弈時(shí)說(shuō)明的問(wèn)題一樣,用博弈論研究經(jīng)濟(jì)問(wèn)題時(shí),對(duì)于同一經(jīng)濟(jì)現(xiàn)象,由于選擇了不同的策略集合,得到的博弈結(jié)果截然不同。要定義一個(gè)博弈,需要確定三件事情:一是局中人集合(set of players),一是局中人的策略集合(set of strategies),一是局中人的收益函數(shù)(payoff function)。當(dāng)然,每個(gè)局中人都知道其他局中人掌握著這些信息和知識(shí)。為了研究博弈,必須抓住博弈現(xiàn)象的基本要素,這些要素是:局中人、策略、收益??梢?jiàn),雙方合作起來(lái),對(duì)兩個(gè)廠商都有利,似乎應(yīng)該合作。這就是甲乙雙方不合作的結(jié)果,雙方都變得更差。假如甲先進(jìn)入該礦泉市場(chǎng),那么甲就按照利潤(rùn)最大化價(jià)格$P_1=Q_o/(2b)$獲取最大利潤(rùn)。如果甲和乙相互勾結(jié)串通起來(lái),采取相同的價(jià)格策略,即,那么甲和乙就能索要一個(gè)壟斷價(jià)格,并且每人可收取一半的壟斷利潤(rùn)。貝特蘭博弈中兩個(gè)局中人甲和乙也是面臨相同的市場(chǎng)需求函數(shù),不過(guò)現(xiàn)在價(jià)格是自變量,產(chǎn)量為因變量(古諾模型正好相反)。這就是說(shuō),我們假定消費(fèi)者只從最低價(jià)格廠商那里購(gòu)買(mǎi)產(chǎn)品。反應(yīng)函數(shù)說(shuō)明,古諾博弈中每個(gè)局中人的決策(選定的產(chǎn)量水平)不但依賴(lài)于其他局中人的決策,而且與市場(chǎng)的容量有關(guān)。用表示這局博弈中甲選擇的最優(yōu)產(chǎn)量,表示乙選擇的最優(yōu)產(chǎn)量水平,則甲乙各自的收益分別為和。在這個(gè)博弈中,甲乙雙方的策略都表現(xiàn)為選擇產(chǎn)量水平,局中人的收益即為廠商的利潤(rùn)。古諾假定:①有兩個(gè)天然礦泉在一起,分別為廠商甲和乙占有;②兩個(gè)礦泉都為自流井,生產(chǎn)成本為零,邊際成本也為零;③甲和乙面對(duì)相同的需求曲線,采用相同的價(jià)格;④雙方都以為對(duì)方的產(chǎn)量水平不會(huì)改變。總之,在收益最大化動(dòng)機(jī)的驅(qū)使下,局中人的最優(yōu)選擇是背叛。從收益表可以看出,甲乙雙方的收益之和不為零,而且收益和是變化的。奧曼(Aumann)1987年對(duì)囚徒博弈給出了一個(gè)特別簡(jiǎn)單的描述:每個(gè)局中人都可以對(duì)仲裁人簡(jiǎn)單地宣告“給我1000元”或“給對(duì)方3000元”??梢?jiàn),如果甲乙雙方都采取合作策略,雙方各得3000元收益。右表給出了囚徒博弈的局勢(shì)表。這就是所謂的囚徒博弈,也叫做囚徒難題。習(xí)慣上,人們喜歡把二人博弈的第一個(gè)局中人甲叫做“列”,第二個(gè)局中人乙叫做“行”,而且總是把列的收益寫(xiě)在前面(即左邊),行的收益寫(xiě)在后面(即右邊)。局中人的收益函數(shù)也可用表格或矩陣加以表示,并稱(chēng)其為收益表或收益矩陣。當(dāng)甲和乙都作出選擇時(shí),博弈的局勢(shì)就確定了。下面來(lái)舉例說(shuō)明。當(dāng)所有當(dāng)事人都拿定主意作出決策時(shí),博弈的局勢(shì)就暫時(shí)確定下來(lái)。大部分經(jīng)濟(jì)行為都可視作博弈的特殊情況,比如把經(jīng)濟(jì)系統(tǒng)看成是一種博弈,把競(jìng)爭(zhēng)均衡看成是該博弈的古諾納什均衡。第八章 博弈論前面章節(jié)對(duì)經(jīng)濟(jì)人最優(yōu)決策的討論,是在簡(jiǎn)單環(huán)境下進(jìn)行的,沒(méi)有考慮經(jīng)濟(jì)人之間決策相互影響的問(wèn)題。最近十幾年來(lái),博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛應(yīng)用,在揭示經(jīng)濟(jì)行為相互制約性質(zhì)方面取得了重大進(jìn)展。一般來(lái)講,博弈現(xiàn)象的特征表現(xiàn)為兩個(gè)或兩個(gè)以上具有利害沖突的當(dāng)事人處于一種不相容的狀態(tài)中,一方的行動(dòng)取決于對(duì)方的行動(dòng),每個(gè)當(dāng)事人的收益都取決于所有當(dāng)事人的行動(dòng)。在每個(gè)局中人的收益都依賴(lài)于其他局中人的選擇的情況下,追求收益最大化的局中人應(yīng)該如何采取行動(dòng)?顯然,為了確定出可行的策略,每個(gè)局中人都必須考慮其他局中人面臨的問(wèn)題。表1: 便士匹配博弈局勢(shì)表 乙甲正面反面正面(正,正)(正,反)反面(反,正)(反,反)對(duì)于這個(gè)博弈,每個(gè)局中人可選擇的策略都有兩種:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。本例中,甲的收益函數(shù)為:,;乙的收益函數(shù)為:。這種博弈就是所謂的二人零和博弈。他們可以選擇合作,拒絕供出任何犯罪事實(shí);也可以選擇背叛,供出對(duì)方的犯罪行徑。比如在雙頭壟斷的情況下,合作可以解釋為“保持索要一個(gè)高價(jià)”,背叛可解釋為“降價(jià)以爭(zhēng)奪對(duì)手的市場(chǎng)”。同樣,如果乙采取合作策略,那么甲就能得到3000元的收益。需要注意的是,囚徒博弈中的貨幣支付來(lái)自第三方——局外人,這正是囚徒博弈同便士匹配博弈的不同之處。表4列出了甲乙雙方的收益情況。但從收益表可以得出這樣的結(jié)論:如果一個(gè)局中人認(rèn)為另一個(gè)局中人將合作,從而他將得到3000元收益,那么他若采取背叛策略,就將總共能獲得4000元的收益;如果他認(rèn)為另一個(gè)局中人為了得到1000元鼓勵(lì)而將背叛,那么他也就只好為了自己也取得1000元鼓勵(lì)而采取背叛策略(否則,他將一無(wú)所獲)。例3.古諾博弈(雙頭壟斷:產(chǎn)量較量)法國(guó)經(jīng)濟(jì)學(xué)家古諾(Cournot)于1838年以天然礦泉井為例,首次建立了簡(jiǎn)單的雙頭壟斷博弈模型,其特點(diǎn)是,壟斷廠商雙方都天真地以為對(duì)方不會(huì)改變?cè)挟a(chǎn)量水平,雙方都追求各自利潤(rùn)最大化。當(dāng)甲的礦泉水產(chǎn)量為,乙的產(chǎn)量為時(shí),礦泉水的市場(chǎng)價(jià)格為,甲的利潤(rùn), 乙的利潤(rùn)為。為了說(shuō)明這個(gè)博弈的結(jié)果,假設(shè)甲乙雙方面臨的反需求函數(shù)。進(jìn)一步求解可得:, 即博弈的結(jié)果是雙方最終各占據(jù)礦泉市場(chǎng)的三分之一。不論市場(chǎng)價(jià)格如何,只要某一廠商降低價(jià)格,而其他競(jìng)爭(zhēng)對(duì)手保持原價(jià)格不變,那么降價(jià)廠商就能占有全部市場(chǎng)。這就是說(shuō),貝特蘭博弈的構(gòu)建同古諾博弈相似,所不同的是貝特蘭博弈中局中人的策略是選擇價(jià)格,而古諾博弈局中人的策略是選擇產(chǎn)量水平。如果甲和乙不相互勾結(jié)串通,當(dāng)乙采取了價(jià)格水平時(shí),甲認(rèn)為乙不會(huì)改變這一價(jià)格水平,從而為了占領(lǐng)市場(chǎng)而要采取低于乙的價(jià)格水平的價(jià)格,于是甲的利潤(rùn)為,乙的利潤(rùn)為零;同樣,當(dāng)甲采取了價(jià)格水平時(shí),乙認(rèn)為甲不會(huì)改變這一價(jià)格水平,從而為了占領(lǐng)市場(chǎng)而要采取低于甲的價(jià)格水平的價(jià)格,于是乙的利潤(rùn)為, 甲的利潤(rùn)為零。但是,占領(lǐng)市場(chǎng)的誘惑對(duì)每個(gè)局中人都存在,只要他稍微降價(jià),他就能獲得全部市場(chǎng)。這樣不斷往復(fù)下去,直至最后甲乙雙方都把價(jià)格水平定為零時(shí)才可達(dá)到均衡,此時(shí)雙方的收益為零,市場(chǎng)各占一半(即甲的銷(xiāo)售量和乙的銷(xiāo)售量相等,且)。合作,可以索要一個(gè)高的壟斷價(jià)格;背叛,則導(dǎo)致市場(chǎng)價(jià)格為零,雙方利潤(rùn)為零。實(shí)際上,經(jīng)濟(jì)學(xué)中大部分經(jīng)濟(jì)現(xiàn)象都可以作為博弈的特殊情形進(jìn)行研究,比如歷史上解決競(jìng)爭(zhēng)均衡的存在性這一經(jīng)濟(jì)學(xué)基本問(wèn)題時(shí),就把經(jīng)濟(jì)系統(tǒng)看成為一局博弈。我們假定每一個(gè)局中人都知道他自己和別人的策略集合與收益函數(shù),這就是說(shuō),每個(gè)局中人的策略集合與收益函數(shù)為所有局中人所共知。第二節(jié) 策略博弈為了能夠正確地應(yīng)用博弈論研究經(jīng)濟(jì)問(wèn)題,需要對(duì)
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1