freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈理論知識(shí)講義-展示頁(yè)

2025-07-01 12:22本頁(yè)面
  

【正文】 和貝特蘭博弈都是無(wú)限博弈。根據(jù)局中人的多少,博弈可分為二人博弈和多人博弈。正象比較古諾博弈和貝特蘭博弈時(shí)說(shuō)明的問題一樣,用博弈論研究經(jīng)濟(jì)問題時(shí),對(duì)于同一經(jīng)濟(jì)現(xiàn)象,由于選擇了不同的策略集合,得到的博弈結(jié)果截然不同。局中人以策略決定勝負(fù),目標(biāo)是使他的收益最大化。要定義一個(gè)博弈,需要確定三件事情:一是局中人集合(set of players),一是局中人的策略集合(set of strategies),一是局中人的收益函數(shù)(payoff function)。我們?cè)偌俣總€(gè)局中人在給定的主觀信念下會(huì)選擇收益最大化的行動(dòng),并且當(dāng)新的信息根據(jù)貝葉斯規(guī)則到來(lái)時(shí),這些信息會(huì)得到修正(即根據(jù)貝葉斯全概率公式從先驗(yàn)概率計(jì)算后驗(yàn)概率)。當(dāng)然,每個(gè)局中人都知道其他局中人掌握著這些信息和知識(shí)。局中人從策略集合中選擇一種策略后所獲得的效用或利益,就是局中人的收益(payoffs),也叫做得失。為了研究博弈,必須抓住博弈現(xiàn)象的基本要素,這些要素是:局中人、策略、收益。本節(jié)所舉的這些事例說(shuō)明,寡頭壟斷廠商之間展開的競(jìng)爭(zhēng)與較量完全可以用博弈加以描述和研究。可見,雙方合作起來(lái),對(duì)兩個(gè)廠商都有利,似乎應(yīng)該合作。貝特蘭博弈也可用囚徒博以來(lái)解釋:合作是指兩個(gè)廠商的勾結(jié),背叛是指兩個(gè)廠商獨(dú)立行動(dòng),沒有勾結(jié)。這就是甲乙雙方不合作的結(jié)果,雙方都變得更差。由于乙奪走了市場(chǎng),甲同樣又會(huì)采取低于乙的價(jià)格水平的價(jià)格,以?shī)Z回市場(chǎng)。假如甲先進(jìn)入該礦泉市場(chǎng),那么甲就按照利潤(rùn)最大化價(jià)格$P_1=Q_o/(2b)$獲取最大利潤(rùn)。這里,利潤(rùn)最大化價(jià)格是按照確定的。如果甲和乙相互勾結(jié)串通起來(lái),采取相同的價(jià)格策略,即,那么甲和乙就能索要一個(gè)壟斷價(jià)格,并且每人可收取一半的壟斷利潤(rùn)。局中人的收益仍是他所獲得的利潤(rùn)。貝特蘭博弈中兩個(gè)局中人甲和乙也是面臨相同的市場(chǎng)需求函數(shù),不過現(xiàn)在價(jià)格是自變量,產(chǎn)量為因變量(古諾模型正好相反)。還以礦泉水為例,在貝特蘭博弈模型中各廠商都預(yù)期對(duì)手不會(huì)改變價(jià)格,從而將自己的價(jià)格確定在利潤(rùn)最大化的水平之上。這就是說(shuō),我們假定消費(fèi)者只從最低價(jià)格廠商那里購(gòu)買產(chǎn)品。實(shí)際上廠商之間的產(chǎn)量較量并不如價(jià)格較量那么普遍,寡頭之間應(yīng)該有激烈的價(jià)格競(jìng)爭(zhēng)。反應(yīng)函數(shù)說(shuō)明,古諾博弈中每個(gè)局中人的決策(選定的產(chǎn)量水平)不但依賴于其他局中人的決策,而且與市場(chǎng)的容量有關(guān)。其中,表示礦泉水市場(chǎng)容量(即價(jià)格為零時(shí)的礦泉水需求量)。用表示這局博弈中甲選擇的最優(yōu)產(chǎn)量,表示乙選擇的最優(yōu)產(chǎn)量水平,則甲乙各自的收益分別為和。同樣,當(dāng)乙的產(chǎn)量水平為時(shí),甲以為乙不會(huì)改變這一產(chǎn)量,而選擇一個(gè)合適的產(chǎn)量水平以使自己的利潤(rùn)達(dá)到最大。在這個(gè)博弈中,甲乙雙方的策略都表現(xiàn)為選擇產(chǎn)量水平,局中人的收益即為廠商的利潤(rùn)。設(shè)是甲乙雙方共同面臨的反需求函數(shù)。古諾假定:①有兩個(gè)天然礦泉在一起,分別為廠商甲和乙占有;②兩個(gè)礦泉都為自流井,生產(chǎn)成本為零,邊際成本也為零;③甲和乙面對(duì)相同的需求曲線,采用相同的價(jià)格;④雙方都以為對(duì)方的產(chǎn)量水平不會(huì)改變。這是一個(gè)典型的博弈悖論,問題的關(guān)鍵在于每個(gè)局中人都有背叛的鼓勵(lì),而不管其他局中人將做什么??傊?,在收益最大化動(dòng)機(jī)的驅(qū)使下,局中人的最優(yōu)選擇是背叛。直覺上看,甲和乙都應(yīng)采取合作策略(互不供出對(duì)方的犯罪事實(shí)),各得3000元收益。從收益表可以看出,甲乙雙方的收益之和不為零,而且收益和是變化的。如果雙方都采取背叛策略,則雙方的收益各為1000元。奧曼(Aumann)1987年對(duì)囚徒博弈給出了一個(gè)特別簡(jiǎn)單的描述:每個(gè)局中人都可以對(duì)仲裁人簡(jiǎn)單地宣告“給我1000元”或“給對(duì)方3000元”。這樣,只要局中人選擇背叛,他就會(huì)得到1000元鼓勵(lì),而不管另一個(gè)局中人會(huì)采取什么策略??梢?,如果甲乙雙方都采取合作策略,雙方各得3000元收益。如果甲采取合作策略,不供出乙的犯罪事實(shí),那么乙就能得到3000元的收益。右表給出了囚徒博弈的局勢(shì)表。囚徒博弈的意義在于它可以解釋寡頭壟斷廠商的行為,關(guān)鍵是賦予合作與背叛具體的經(jīng)濟(jì)含義。這就是所謂的囚徒博弈,也叫做囚徒難題。s Delimma)(二人變和博弈)表3: 囚徒博弈局勢(shì)表乙甲合作背叛合作(合作,合作)(合作,背叛)背叛(背叛,合作)(背叛,背叛)有兩個(gè)狂徒甲和乙因共同參與了一起犯罪活動(dòng)而被囚禁收審。習(xí)慣上,人們喜歡把二人博弈的第一個(gè)局中人甲叫做“列”,第二個(gè)局中人乙叫做“行”,而且總是把列的收益寫在前面(即左邊),行的收益寫在后面(即右邊)。該博弈的特點(diǎn)在于每個(gè)局中人的收益都是另一個(gè)局中人的付出,即甲和乙的收益之和為零,收支發(fā)生在局內(nèi),不涉及任何局外人。局中人的收益函數(shù)也可用表格或矩陣加以表示,并稱其為收益表或收益矩陣。表2: 甲和乙的收益表 乙甲正面反面正面 ,反面, ,每個(gè)局中人的收益都取決于所有局中人的決策,也就是說(shuō),局中人的收益是博弈局勢(shì)的函數(shù)。當(dāng)甲和乙都作出選擇時(shí),博弈的局勢(shì)就確定了。局中人的收益情況是這樣的:如果兩個(gè)局中人同時(shí)出示硬幣正面或反面,那么甲贏得1元,乙輸?shù)簦痹?;如果一個(gè)局中人出示硬幣正面,另一個(gè)局中人出示硬幣反面,那么甲輸?shù)簦痹?,乙贏得1元。下面來(lái)舉例說(shuō)明。博弈論推廣了標(biāo)準(zhǔn)的一人決策理論。當(dāng)所有當(dāng)事人都拿定主意作出決策時(shí),博弈的局勢(shì)就暫時(shí)確定下來(lái)。第一節(jié) 博弈事例博弈是一種日常現(xiàn)象,例如棋手下棋,雙方都要根據(jù)對(duì)方的行動(dòng)來(lái)決定自己的行動(dòng),雙方的目的都是要戰(zhàn)勝對(duì)方,互不相容,互相影響,互相制約。大部分經(jīng)濟(jì)行為都可視作博弈的特殊情況,比如把經(jīng)濟(jì)系統(tǒng)看成是一種博弈,把競(jìng)爭(zhēng)均衡看成是該博弈的古諾納什均衡。開展這種研究的的理論叫做博弈論,也稱為對(duì)策論(Game Theory)。第八章 博弈論前面章節(jié)對(duì)經(jīng)濟(jì)人最優(yōu)決策的討論,是在簡(jiǎn)單環(huán)境下進(jìn)行的,沒有考慮經(jīng)濟(jì)人之間決策相互影響的問題。本章討論這個(gè)問題,建立復(fù)雜環(huán)境下的決策理論。最近十幾年來(lái),博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛應(yīng)用,在揭示經(jīng)濟(jì)行為相互制約性質(zhì)方面取得了重大進(jìn)展。博弈論的思想精髓與方法,已成為經(jīng)濟(jì)分析基礎(chǔ)的必要組成部分。一般來(lái)講,博弈現(xiàn)象的特征表現(xiàn)為兩個(gè)或兩個(gè)以上具有利害沖突的當(dāng)事人處于一種不相容的狀態(tài)中,一方的行動(dòng)取決于對(duì)方的行動(dòng),每個(gè)當(dāng)事人的收益都取決于所有當(dāng)事人的行動(dòng)。博弈論就是研究這種不相容現(xiàn)象的一種理論,并把當(dāng)事人叫做局中人(player)。在每個(gè)局中人的收益都依賴于其他局中人的選擇的情況下,追求收益最大化的局中人應(yīng)該如何采取行動(dòng)?顯然,為了確定出可行的策略,每個(gè)局中人都必須考慮其他局中人面臨的問題。例1.便士匹配(Matching Pennies)(二人零和博弈)設(shè)博弈中有兩個(gè)局中人甲和乙,每個(gè)局中人都有一塊硬幣,并且各自獨(dú)立安排硬幣是否正面朝上。表1: 便士匹配博弈局勢(shì)表 乙甲正面反面正面(正,正)(正,反)反面(反,正)(反,反)對(duì)于這個(gè)博弈,每個(gè)局中人可選擇的策略都有兩種:正面朝上和反面朝上,即甲和乙的策略集合都是{正面,反面}。顯然,該博弈的局勢(shì)集合是{(正面,正面),(正面,反面),(反面,正面),(反面,反面)},即各種可能的局勢(shì)的全體,也稱為局勢(shì)表,即表1。本例中,甲的收益函數(shù)為:,;乙的收益函數(shù)為:。表2中,甲的收益列在左邊,乙的收益列在右邊。這種博弈就是所謂的二人零和博弈。例2.囚徒難題(Prisoner39。他們可以選擇合作,拒絕供出任何犯罪事實(shí);也可以選擇背叛,供出對(duì)方的犯罪行徑。博弈的局中人甲和乙都有兩種可選擇的策略:合作與背叛。比如在雙頭壟斷的情況下,合作可以解釋為“保持索要一個(gè)高價(jià)”,背叛可解釋為“降價(jià)以爭(zhēng)奪對(duì)手的市場(chǎng)”。局中人可以事先討論這局博弈,但實(shí)際決策必須獨(dú)立地做出。同樣,如果乙采取合作策略,那么甲就能得到3000元的收益。但是,審訊者用1000元獎(jiǎng)賞來(lái)鼓勵(lì)局中人采取背叛策略。需要注意的是,囚徒博弈中的貨幣支付來(lái)自第三方——局外人,這正是囚徒博弈同便士匹配博弈的不同之處。表4: 甲和乙的收益表 乙 甲合作背叛合作3000, 3000 0, 4000背叛4000, 01000, 1000簡(jiǎn)單分析一下就會(huì)發(fā)現(xiàn),如果一個(gè)局中人采取合作策略,而另一個(gè)局中人采取背叛策略,那么采取合作策略的局中人的收益為零,而采取背叛策略的局中人的收益為4000元(3000元收益再加上1000元的背叛鼓勵(lì))。表4列出了甲乙雙方的收益情況。因此,囚徒博弈是一種變和博弈。但從收益表可以得出這樣的結(jié)論:如果一個(gè)局中人認(rèn)為另一個(gè)局中人將合作,從而他將得到3000元收益,那么他若采取背叛策略,就將總共能獲得4000元的收益;如果他認(rèn)為另一個(gè)局中人為了得到1000元鼓勵(lì)而將背叛,那么他也就只好為了自己也取得1000元鼓勵(lì)而采取背叛策略(否則,他將一無(wú)所獲)。這樣一來(lái),甲乙雙方都采取背叛策略,各得1000元收益;而不是都采取合作策略,各得3000元。例3.古諾博弈(雙頭壟斷:產(chǎn)量較量)法國(guó)經(jīng)濟(jì)學(xué)家古諾(Cournot)于1838年以天然礦泉井為例,首次建立了簡(jiǎn)單的雙頭壟斷博弈模型,其特點(diǎn)是,壟斷廠商雙方都天真地以為對(duì)方不會(huì)改變?cè)挟a(chǎn)量水平,雙方都追求各自利潤(rùn)最大化。在這些假設(shè)前提下,甲和乙各自獨(dú)立決定自己的產(chǎn)量水平,以求利潤(rùn)最大化。當(dāng)甲的礦泉水產(chǎn)量為,乙的產(chǎn)量為時(shí),礦泉水的市場(chǎng)價(jià)格為,甲的利潤(rùn), 乙的利潤(rùn)為。當(dāng)甲的產(chǎn)量為時(shí),乙以為甲不會(huì)改變這一產(chǎn)量,而選擇一個(gè)合適的產(chǎn)量水平以使自己的利潤(rùn)達(dá)到最大。為了說(shuō)明這個(gè)博弈的結(jié)果,假設(shè)甲乙雙方面臨的反需求函數(shù)。由于實(shí)現(xiàn)了利潤(rùn)最大化,因此解之得:當(dāng)乙的產(chǎn)量水平為時(shí),甲決定的產(chǎn)量水平為(這是甲對(duì)乙的反應(yīng)函數(shù));當(dāng)甲的產(chǎn)量水平為時(shí),乙決定的產(chǎn)量水平為(這是乙對(duì)甲的反應(yīng)函數(shù))。進(jìn)一步求解可得:, 即博弈的結(jié)果是雙方最終各占據(jù)礦泉市場(chǎng)的三分之一。例4.貝特蘭博弈(雙頭壟斷:價(jià)格較量)古諾博弈模型描述了雙頭壟斷廠商之間展開的產(chǎn)量較量。不論市場(chǎng)價(jià)格如何,只要某一廠商降低價(jià)格,而其他競(jìng)爭(zhēng)對(duì)手保持原價(jià)格不變,那么降價(jià)廠商就能占有全部市場(chǎng)。為此,法國(guó)經(jīng)濟(jì)學(xué)家貝特蘭(Bertrand)于1883年提出了以價(jià)格為選擇策略的貝特蘭博弈模型,反對(duì)古諾關(guān)于產(chǎn)量的博弈模型。這就是說(shuō),貝特蘭博弈的構(gòu)建同古諾博弈相似,所不同的是貝特蘭博弈中局中人的策略是選擇價(jià)格,而古諾博弈局中人的策略是選擇產(chǎn)量水平。設(shè)市場(chǎng)需求函數(shù)為, 為了分析上簡(jiǎn)單起見,進(jìn)一步設(shè)(這里,,,即與古諾模型中的市場(chǎng)需求相同)。如果甲和乙不相互勾結(jié)串通,當(dāng)乙采取了價(jià)格水平時(shí),甲認(rèn)為乙不會(huì)改變這一價(jià)格水平,從而為了占領(lǐng)市場(chǎng)而要采取低于乙的價(jià)格水平的價(jià)格,于是甲的利潤(rùn)為,乙的利潤(rùn)為零;同樣,當(dāng)甲采取了價(jià)格水平時(shí),乙認(rèn)為甲不會(huì)改變這一價(jià)格水平,從而為了占領(lǐng)市場(chǎng)而要采取低于甲的價(jià)格水平的價(jià)格,于是乙的利潤(rùn)為, 甲的利潤(rùn)為零。由此可見,甲和乙的利潤(rùn)函數(shù)分別為: , 如果甲和乙勾結(jié)串通,合作起來(lái),那么雙方就能按照最大利潤(rùn)價(jià)格獲得壟斷價(jià)格,并且各得最大利潤(rùn)的一半。但是,占領(lǐng)市場(chǎng)的誘惑對(duì)每個(gè)局中人都存在,只要他稍微降價(jià),他就能獲得全部市場(chǎng)。 繼而乙進(jìn)入這個(gè)市場(chǎng),且乙認(rèn)為甲不會(huì)改變他的價(jià)格$P_1$,于是乙為了奪取市場(chǎng)而采取低于甲的價(jià)格水平的一個(gè)價(jià)格(。這樣不斷往復(fù)下去,直至最后甲乙雙方都把價(jià)格水平定為零時(shí)才可達(dá)到均衡,此時(shí)雙方的收益為零,市場(chǎng)各占一半(即甲的銷售量和乙的銷售量相等,且)。以上分析表明:把貝特蘭博弈與古諾博弈作比較,對(duì)同一市場(chǎng)來(lái)說(shuō),由于選擇了不同的策略集合(一個(gè)以產(chǎn)量作為策略,另一個(gè)以定價(jià)作為策略),得出了不同的博弈結(jié)果,貝特蘭博弈的均衡價(jià)格、均衡產(chǎn)量和均衡利潤(rùn)都呈完全競(jìng)爭(zhēng)狀態(tài)(超額利潤(rùn)為零),而古諾博弈的結(jié)果不是這樣;再把貝特蘭博弈同囚徒難題博弈作比較,二者具有相似的結(jié)構(gòu),即局中人合作會(huì)取得最好的結(jié)果,但利益的誘惑促使他們采取不合作的行動(dòng),致使雙方博弈的結(jié)局都變得更差。合作,可以索要一個(gè)高的壟斷價(jià)格;背叛,則導(dǎo)致市場(chǎng)價(jià)格為零,雙方利潤(rùn)為零。但博弈的最終結(jié)果是雙方都采取背叛策略,導(dǎo)致誰(shuí)也得不到利潤(rùn)。實(shí)際上,經(jīng)濟(jì)學(xué)中大部分經(jīng)濟(jì)現(xiàn)象都可以作為博弈的特殊情形進(jìn)行研究,比如歷史上解決競(jìng)爭(zhēng)均衡的存在性這一經(jīng)濟(jì)學(xué)基本問題時(shí),就把經(jīng)濟(jì)系統(tǒng)看成為一局博弈。也就是說(shuō),博弈可以用局中人集合、策略集合和收益函數(shù)加以描述。我們假定每一個(gè)局中人都知道他自己和別人的策略集合與收益函數(shù),這就是說(shuō),每個(gè)局中人的策略集合與收益函數(shù)為所有局中人所共知。局中人的收益不但依賴于他自己的策略選擇,而且依賴于其他局中人的策略選擇。第二節(jié) 策略博弈為了能夠正確地應(yīng)用博弈論研究經(jīng)濟(jì)問題,需要對(duì)博弈加以準(zhǔn)確地描述和定義。這三件事情中,確定策略集合是至關(guān)重要的。這種以策略定勝負(fù)的博弈,稱為策略博弈(game of strategy)。用表示博弈的局中人集合,表示局中人的策略集合,表示的收益函數(shù),則就表示了一個(gè)博弈。根據(jù)博弈的策略集合是否有限,博弈還又可分為有限博弈和無(wú)限博弈。還可根據(jù)所有局中人的收益總和是否固定,把博弈分為常和博弈和變和博弈。二人零和有限博弈是所有博弈中最簡(jiǎn)單、最重要的一類,通常稱為矩陣博弈。一.策略表與收益矩陣設(shè)二人博弈的局中人是甲和乙。當(dāng)甲采取策略,乙采取策略時(shí),稱為博弈的局勢(shì),集合就是局勢(shì)集合(局勢(shì)表、局勢(shì)矩陣),即每個(gè)局中人選擇自己的策略時(shí),都要考慮對(duì)手的行動(dòng)。用表示局中人甲的收益函數(shù),用表示局中人乙的收益函數(shù)。記,,則甲和乙的收益矩陣分別為:,當(dāng)(常數(shù))時(shí),該博弈就是常和博弈。局中人的策略與收益也可用收益表加以表達(dá):表1: 博弈的收益表乙的策略甲的策略……,……,,……,……,……,一般情況下,二人博弈可表示成。而矩陣博弈則可更簡(jiǎn)單地表示成,或者直接用甲的收益矩陣來(lái)表示矩陣博弈。假定甲乙雙方彼此了解對(duì)方的收益表。首先,甲要從收益表中找出自己的每一種策略下至少可獲得的收益(即所能獲得的最小收益),即先求解,然后從這些最小收益策略中選擇出收益最大的策略,即“從最小收益中選擇最大收益”。由此可見,最小最大
點(diǎn)擊復(fù)制文檔內(nèi)容
醫(yī)療健康相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1