freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈理論知識(shí)講義-預(yù)覽頁

2025-07-16 12:22 上一頁面

下一頁面
 

【正文】 博弈加以準(zhǔn)確地描述和定義。這種以策略定勝負(fù)的博弈,稱為策略博弈(game of strategy)。根據(jù)博弈的策略集合是否有限,博弈還又可分為有限博弈和無限博弈。二人零和有限博弈是所有博弈中最簡(jiǎn)單、最重要的一類,通常稱為矩陣博弈。當(dāng)甲采取策略,乙采取策略時(shí),稱為博弈的局勢(shì),集合就是局勢(shì)集合(局勢(shì)表、局勢(shì)矩陣),即每個(gè)局中人選擇自己的策略時(shí),都要考慮對(duì)手的行動(dòng)。記,,則甲和乙的收益矩陣分別為:,當(dāng)(常數(shù))時(shí),該博弈就是常和博弈。而矩陣博弈則可更簡(jiǎn)單地表示成,或者直接用甲的收益矩陣來表示矩陣博弈。首先,甲要從收益表中找出自己的每一種策略下至少可獲得的收益(即所能獲得的最小收益),即先求解,然后從這些最小收益策略中選擇出收益最大的策略,即“從最小收益中選擇最大收益”。對(duì)于局中人乙來說,他的決策行為和決策過程同甲是一樣的,只不過乙要依賴于收益矩陣。假如甲按照最大最小法選出了策略, 那么當(dāng)乙采用策略時(shí),甲可得到最大最小收益。當(dāng)甲和乙的穩(wěn)妥策略都已選定時(shí),二者結(jié)合起來能否成為博弈的結(jié)果呢?答案是未必。這說明甲的穩(wěn)妥策略是,乙的穩(wěn)妥策略是。這就讓我們看到:當(dāng)甲采取時(shí),乙要采用;然后甲改用,乙隨之改用;甲再改用,乙又改用,如此不斷往復(fù)下去,博弈的結(jié)局是高度不確定的。因此,是博弈的最優(yōu)解當(dāng)且僅當(dāng)是收益函數(shù)的鞍點(diǎn)。注意。所以,即是函數(shù)的鞍點(diǎn)。三.反應(yīng)函數(shù)博弈的局中人總是要考慮對(duì)手的行動(dòng),然后確定自己的對(duì)策。同樣的道理,可以確定出乙對(duì)甲的反應(yīng)函數(shù),即對(duì)任何,是按照來確定的。這時(shí),乙再次對(duì)甲的行為作出反應(yīng),采取新策略。事實(shí)上,是該方程組的解當(dāng)且僅當(dāng),而這正是博弈實(shí)現(xiàn)均衡的含義。假設(shè)局中人甲和乙的收益函數(shù)和可微,則甲對(duì)乙的反應(yīng)函數(shù)由方程(一階條件)決定,乙對(duì)甲的反應(yīng)函數(shù)由方程(一階條件)決定,從而博弈的最優(yōu)解就是如下方程組的解:例2.二人博弈的反應(yīng)函數(shù)及最優(yōu)解設(shè)二人博弈中,甲和乙的策略集合和為,收益函數(shù)和分別如下:求偏導(dǎo)數(shù)得方程組。古諾博弈中廠商的策略是選擇產(chǎn)量,廠商的收益是策略變量的連續(xù)函數(shù);而貝特蘭博弈中廠商的策略是選擇價(jià)格,廠商的收益是策略變量的非連續(xù)函數(shù)。比如,如果我們觀察OPEC公司的公告,就會(huì)發(fā)現(xiàn)OPEC企圖為每一個(gè)員工決定產(chǎn)量配額,并且允許按照世界石油市場(chǎng)價(jià)格定價(jià),這樣按照產(chǎn)量水平而不是按價(jià)格水平來模擬博弈策略,就可能更加合理。因此,盡管“一次性”博弈所描述的現(xiàn)象應(yīng)該是發(fā)生在實(shí)際生活中的現(xiàn)實(shí),但在“一次性”博弈中模擬這種能夠很快調(diào)整的策略反應(yīng)并不具有多大的意義。生產(chǎn)能力或產(chǎn)量水平似乎是廠商策略的天然選擇,即使一次性博弈中也是這樣。就好像棋手下棋一樣,一局結(jié)束了再開一局,前一局在某些著法上吃了虧,這一局中就會(huì)吸取教訓(xùn)而加以注意,正所謂“吃一暫,長(zhǎng)一智”。這樣一來,重復(fù)博弈中局中人的策略空間隨著博弈被重復(fù)的次數(shù)的增加而變得越來越大,也就是說,博弈歷史越長(zhǎng),局中人的策略空間越大,可以選擇的著法越多。對(duì)于每個(gè)局中人來說,可行的做法是試著給另一個(gè)局中人發(fā)出“信號(hào)”以表明他的“善意”,并且在博弈一開始移動(dòng)就進(jìn)行合作?;谶@種推理可以得到的事實(shí)是,一個(gè)局中人目前的做法將在未來將得到回應(yīng)——其他局中人的未來選擇可能依賴于這個(gè)局中人當(dāng)前的選擇??紤]最后一輪博弈實(shí)施之前局中人給予的推理,此時(shí)每個(gè)人都認(rèn)為他們?cè)谶M(jìn)行一次性博弈。采取合作是為了得到長(zhǎng)期利益,為了在將來最后一次移動(dòng)中得到回應(yīng)。再來考慮博弈可無限次重復(fù)的情況。重復(fù)博弈中,局中人的收益是各階段收益的貼現(xiàn)值之總和——貼現(xiàn)和(向時(shí)刻0貼現(xiàn))。假設(shè)兩個(gè)局中人一直合作,移動(dòng)到了時(shí)刻。比較和可知,只要貼現(xiàn)率,就有。所以,在貼現(xiàn)率不很高的情況下,囚徒博弈重復(fù)的均衡是局中人雙方在各階段都采取合作策略。采取這個(gè)策略的理由是,如果一個(gè)局中人背叛,那么他將在收益上得到永久性懲罰。例2.維持卡特爾考慮一個(gè)簡(jiǎn)單的重復(fù)雙頭壟斷,如果兩個(gè)廠商都執(zhí)行古諾博弈均衡策略,則得到利潤(rùn);如果以共同利潤(rùn)最大化決定產(chǎn)量水平,即執(zhí)行卡特爾行動(dòng),則得到利潤(rùn)。但是,如果這個(gè)博弈是不斷重復(fù)的,那么每個(gè)廠商都采取按照卡特爾產(chǎn)量生產(chǎn)的策略,即都選擇合作,將是雙頭壟斷重復(fù)博弈的最優(yōu)解。進(jìn)一步,實(shí)際中博弈局中人常常希望自己的行動(dòng)隱秘不被暴露,不被對(duì)手覺察。而且對(duì)于非嚴(yán)格確定的博弈來說,采用混合策略就可求得最優(yōu)解。設(shè)為有限二人策略博弈,其中為局中人甲的策略集合,為乙的策略集合,和分別為甲和乙的收益函數(shù)。通過借助隨機(jī)裝置,局中人原來對(duì)純策略的選擇變成為現(xiàn)在對(duì)各個(gè)純策略的概率大小的選擇。這就是說,混合策略是用概率分布來表示的,混合策略的變化完全反映為概率分布的變化。同樣,局中人乙的選擇集合也由原來的純策略集合擴(kuò)張成為混合策略集合。甲的收益函數(shù)由原來的擴(kuò)充成為,乙的收益函數(shù)由原來的擴(kuò)充成為。(2) 如果是常和博弈,則混合擴(kuò)充保持了原來博弈的收益和。可以證明:(3) 純策略博弈的最優(yōu)解必然是混合擴(kuò)充的最優(yōu)解。二.混合策略的意義有時(shí),給予混合策略一個(gè)有意義的解釋是困難的。除了混合策略在一定范圍內(nèi)缺乏現(xiàn)實(shí)意義外,還有一些邏輯上的原因?qū)е聦?duì)混合策略難以解釋。茹達(dá)喜歡看話劇,而卡夫喜歡看足球比賽。首先,讓我們尋找該博弈的所有純策略意義下的最優(yōu)解。因此,最優(yōu)混合策略問題可歸結(jié)為如下的約束極值問題:應(yīng)用KuhnTucker條件(參見第七章第八節(jié)),上述極值問題的解為,,,。本例說明,從邏輯上講,采用混合策略沒有多少道理。如果決定總出正面的人數(shù)等于決定總出反面的人數(shù),那么各個(gè)局中人的選擇問題不會(huì)有明顯變化:每個(gè)人仍然理性地以為他的對(duì)手以50%的可能性出正面或反面。比如,該人心想“正面”時(shí)就出正面,心想“反面”時(shí)就出反面。第五節(jié) 矩陣博弈的古諾均衡前面介紹的博弈最優(yōu)解(均衡)概念,假定了局中人各自獨(dú)立行動(dòng),沒有合作。一.均衡的存在性收益矩陣的鞍點(diǎn)未必存在,這使得矩陣博弈的均衡未必存在。具體來說,設(shè) 為矩陣博弈,,為的混合擴(kuò)充,則必存在滿足。本定理的證明將基于這一事實(shí)。以下的證明分三步走。從增廣矩陣的列中選出列,構(gòu)成一個(gè)階方陣:。例如,矩陣就是一個(gè)基?,F(xiàn)在對(duì)于任何一個(gè)基來說,用表示的第行。換句話說,基是最優(yōu)基,是指,即的首行向量與的后個(gè)列向量的內(nèi)積全非正。如果不是最優(yōu)基,則,此時(shí)需做下面的工作:(1) 找出一個(gè)使。事實(shí)上。如此找到的列必然是唯一的,即滿足該條件的是唯一的。這個(gè)矩陣必然也是基。所以,滿足條件(b1)。為此,令,其中 。再注意,和僅僅在第列上有區(qū)別:;而當(dāng)時(shí)?,F(xiàn)在來從的第1行到第行,考察各行第一個(gè)非零元素是否為正數(shù)??傊?,除了的首行外,其余各行的第一個(gè)非零元素都為正數(shù)。注意,被吸收進(jìn)來的列滿足條件:且。被排除出去,就不會(huì)把它重新吸收進(jìn)來,因?yàn)楸恍挛者M(jìn)來的列滿足,而不滿足這個(gè)條件,事實(shí)上。最后一次構(gòu)造出來的基必然是最優(yōu)基。令 ,并定義如下:對(duì)任何,當(dāng)時(shí),;而當(dāng)時(shí)。這樣,事實(shí)(I)和(II)就說明了是的均衡。這就證明了。這說明。根據(jù)基的性質(zhì)(b3)可知,對(duì)一切成立,這就保證了。再注意,不會(huì)全是增廣矩陣的后個(gè)列向量(因?yàn)榧偃邕@樣的話,就不可逆了)。到此,矩陣博弈古諾均衡的存在性得到證明。下面來證明(2)(1)。對(duì)和也不例外:,從而。今后,我們把數(shù)值叫做矩陣博弈的博弈值(value of the game),簡(jiǎn)稱的值。首先,如果我們能夠通過某種方法知道矩陣博弈的值,那么通過下面的性質(zhì)1就容易求得局中人的最優(yōu)混合策略。證明:我們來證明(1),其余留給讀者來完成。既然一定有最優(yōu)解且,存在使得對(duì)一切和成立 。證完。是甲的最優(yōu)混合策略,即存在使得為的最優(yōu)解。()式說明對(duì)一切成立。性質(zhì)3.設(shè)是矩陣博弈的混合擴(kuò)充,其中。首先根據(jù)性質(zhì)2可知,是的最優(yōu)解,因而。這樣就得到,出現(xiàn)矛盾。但其解是唯一的嗎?如不唯一,那么最優(yōu)解集合又是什么樣子呢?我們能有辦法把最優(yōu)解集合找出來嗎?下面我們來回答這些問題。性質(zhì)4.矩陣博弈的混合均衡集合是空間的非空有界閉凸子集。下面來證明是凸集。因此,用乘以(),用乘以(),然后把兩式相加即可得到:對(duì)任何,都有這就是說,也是的最優(yōu)解?;旌献顑?yōu)解集合的凸性得證。凸分析理論說,有限維歐氏空間中的任何非空有界閉凸集的端點(diǎn)集都是非空的,并且是的凸包。詳細(xì)介紹這些求解法,已超出本書的討論范圍,感興趣的讀者可參考有關(guān)博弈論或運(yùn)籌學(xué)方面的書籍,這里只簡(jiǎn)單介紹初等代數(shù)求解法的基本思路。根據(jù)這個(gè)收益矩陣,列出兩組不等式:和??梢娫诒闶科ヅ洳┺闹?,;同樣,局中人乙的最優(yōu)策略也是以均等的概率決定正面朝上和反面朝上;博弈值為零。為了使均衡點(diǎn)的數(shù)目減少下來,使多重性程度下降,需要有進(jìn)一步的準(zhǔn)則用來對(duì)均衡進(jìn)行區(qū)分,這種對(duì)均衡的詳細(xì)區(qū)分,稱為均衡的精化(refinements)。那么,“占優(yōu)”意指什么?下面對(duì)占優(yōu)的概念作出解釋,也即對(duì)均衡的精化準(zhǔn)則,就一般的(有限或無限)二人博弈情形作出規(guī)定。(2) 稱比占優(yōu),記作,是指對(duì)一切成立。所以,博弈的占優(yōu)解必是最優(yōu)解,這也就是把占優(yōu)解叫做占優(yōu)均衡的緣故。若用表示收益矩陣的第個(gè)行向量:,則當(dāng)且僅當(dāng)。所以,是乙的占優(yōu)策略當(dāng)且僅當(dāng)是收益矩陣的最小列向量。例1.廣告競(jìng)爭(zhēng)表2: 廣告競(jìng)爭(zhēng)的收益表 乙甲作廣告不作廣告作廣告10,515,0不作廣告 6,810,2有兩個(gè)廠商甲和乙在開展廣告競(jìng)爭(zhēng),雙方的利益都受到對(duì)方是否作廣告的影響。只要甲和乙都是理性經(jīng)濟(jì)活動(dòng)者,那么他們就都會(huì)采取“作廣告”策略。因此,“作廣告”是雙方的最優(yōu)選擇,但不是占優(yōu)選擇。則(1) 當(dāng)且僅當(dāng)對(duì)一切成立;(2) 當(dāng)且僅當(dāng)對(duì)一切成立;(3) 當(dāng)且僅當(dāng)且存在滿足;(4) 當(dāng)且僅當(dāng)且存在滿足。同樣,乙采取占優(yōu)混合策略,意味著不論甲采取什么純策略,乙的預(yù)期收益也都是最大的。究竟應(yīng)該剔除哪一些均衡呢?這需要一種標(biāo)準(zhǔn)和剔除辦法。同樣,我們可給出乙的半占優(yōu)策略和被占優(yōu)策略的定義。例2.被占優(yōu)策略的剔除表3:博弈的收益表乙甲左右上2,20,2下2,01,1考慮博弈由表3(收益表)表達(dá)的博弈,其中。第七節(jié) 多人非合作博弈二十世紀(jì)五十年代,美國(guó)數(shù)學(xué)家納什(. Nash)接連發(fā)表了多篇關(guān)于博弈論的研究論文,為現(xiàn)代博弈論的形成和發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。一.多人博弈的一般描述設(shè)博弈中有個(gè)局中人:局中人1,局中人2,…,局中人。每個(gè)局中人的收益不但取決于自己的策略,而且取決于其他局中人的策略。如果對(duì)任何,都有,則稱為人零和博弈。對(duì)于無限博弈,待留第九節(jié)中討論。同二人博弈情形一樣,局中人為了使自己的行動(dòng)具有隱秘性,可采取混合策略,即以一定的概率來選擇某種純策略,這就引出了人博弈的混合擴(kuò)充概念。當(dāng)局中人1選擇了混合策略,局中人2選擇了混合策略,…,局中人選擇了混合策略時(shí),構(gòu)成博弈的一個(gè)混合局勢(shì)。作了上面一般性描述之后,表面上看似乎人博弈只是局中人數(shù)的增加。這種質(zhì)的區(qū)別,表現(xiàn)為局中人之間的合作與非合作。前節(jié)討論的矩陣博弈是典型的非合作博弈,其特點(diǎn)是參加博弈的局中人雙方利害沖突,不是你輸,就是你贏,沒有任何調(diào)和的余地。設(shè)是人純策略博弈的混合擴(kuò)充,其中 ?;旌暇謩?shì)叫做在混合策略意義下的最優(yōu)解(即的最優(yōu)解),是指對(duì)每個(gè)局中人以及對(duì)任何混合策略,都有。這正是博弈均衡的含義之所在,用通俗的話來說就是,在均衡點(diǎn)處,任何局中人都不能從單方面改變策略來提高自己的收益。稱為局中人對(duì)其他局中人的行動(dòng)的反應(yīng)集合。容易看出,混合局勢(shì)是博弈的混合納什均衡當(dāng)且僅當(dāng),即當(dāng)且僅當(dāng)是反應(yīng)集值映射的不動(dòng)點(diǎn)。s Fixed Point Theorem).設(shè)是有限維歐氏空間的非空有界凸閉子集,是集值映射。首先,前面已經(jīng)指出,混合局勢(shì)集合是歐氏空間的非空有界凸閉子集,并且是非空閉集,因此也是非空閉集?,F(xiàn)在,已知,且。的上半連續(xù)性得證。下面,我們給出用純策略來判斷混合納什均衡的一個(gè)簡(jiǎn)便辦法。為此,設(shè)對(duì)每個(gè)局中人及任何純策略都成立。進(jìn)一步,同二人博弈一樣,由于均衡的不唯一,人博弈也有相應(yīng)的占優(yōu)策略、半占優(yōu)策略和被占優(yōu)策略這些相應(yīng)的概念,也要對(duì)被占優(yōu)策略進(jìn)行剔除,最好是能夠找到占優(yōu)均衡,最后使納什均衡得以精化,使均衡數(shù)目得以減少。由于存在合作的動(dòng)機(jī)或行動(dòng),因此一部分局中人會(huì)結(jié)成聯(lián)盟,在博弈中采取一致行動(dòng),并且最終把聯(lián)盟所得的收益重新分配給聯(lián)盟的各個(gè)成員。諾伊曼(von Neumann)建立的理論??傊?,如要討論形成聯(lián)盟的原因,那這就是一個(gè)相當(dāng)復(fù)雜的問題。諾伊曼建立的理論,尤其是他提出的特征函數(shù)概念,成為這方面研究的基石。諾伊曼理論可用來指導(dǎo)各個(gè)局中人的行動(dòng),并對(duì)博弈現(xiàn)象進(jìn)行解釋。下面我們將會(huì)看到,通過特征函數(shù)可以把有關(guān)局中人之間的聯(lián)盟,每一個(gè)聯(lián)盟之內(nèi)局中人之間進(jìn)行的補(bǔ)償,以及兩個(gè)聯(lián)盟之間的合并與斗爭(zhēng)等問題,都能確定下來。當(dāng)然,這個(gè)聯(lián)盟就是局中人集合的一個(gè)子集。在這個(gè)定義中,以下三點(diǎn)值得注意:第一,如果是聯(lián)盟,那么的余集也是聯(lián)盟,稱為聯(lián)盟的余聯(lián)盟。第三,只含一個(gè)局中人的集合(即的單點(diǎn)子集)也是聯(lián)盟,叫做單人聯(lián)盟。把局中人分成兩個(gè)聯(lián)盟和,聯(lián)盟中各個(gè)局中人在選擇策略時(shí)互通信息,彼此合作,協(xié)調(diào)行動(dòng)。博弈的局勢(shì)集合可看成的局勢(shì)集合,之所以可以這樣看待,是因?yàn)?。?lián)盟能把博弈變成為二人博弈,同樣也能把的混合擴(kuò)充變成為二人博弈。則我們有以下的表示:其中。在變換下,的局勢(shì)可與的局勢(shì)等同看待。所以,聯(lián)盟在把人博弈變成為二人博弈的同時(shí),也把的混合擴(kuò)充變成為二人博弈的混合擴(kuò)充。令則定義了集合上的一個(gè)實(shí)值函數(shù),稱這個(gè)函數(shù)為博弈的特征函數(shù)。對(duì)于一般的人博弈而言,特征函數(shù)的值表達(dá)了聯(lián)盟在博弈中至少可以得到的收入,即不論聯(lián)盟外的局中人采取什么行動(dòng),聯(lián)盟得到的收入不會(huì)低于。性質(zhì)2. 若且,則。如果把性質(zhì)2中的不等式換為等式,即要求特征函數(shù)滿足:對(duì)任何不相交的,都有,那么就稱具有可加性。鑒于此,凡是特征函數(shù)具有可加性的博弈,都稱為是非本質(zhì)博弈。這是因?yàn)?,?dāng)為零和博弈時(shí),通過聯(lián)盟所轉(zhuǎn)化成為的二人博弈及其混合擴(kuò)充也都是零和博弈,故聯(lián)盟的收入就是余聯(lián)盟的支出,即。性質(zhì)4. 設(shè),滿足條件:且對(duì)一切不相交的成立,則存在一個(gè)人有限博弈使得正好是的特征函數(shù)
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1