【正文】
........................................................ 15 納什存在性定理及其證明 ................................................................................. 21 其它的納什均衡存在性定理 ............................................................................. 23 抽象非合作博奕系統(tǒng)的納什均衡 ............................................................................... 24 . Banach 空間框架下的 n 重對策:一些概念與定義 ......................................... 24 (收益 )的納什均衡的存在性定理 ........................................................... 26 第五章 納什均衡在經(jīng)濟系統(tǒng)中的應用 ................................................................................. 30 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 引言 ................................................................................................................................. 30 經(jīng)濟均衡的存在性 ........................................................................................................ 30 壟斷市場 ......................................................................................................................... 34 結束語 ........................................................................................................................................... 38 致 謝 ........................................................................................................................................... 39 附錄 X .............................................................................................................. 錯誤 !未定義書簽。博弈論主要研究公式化了的激勵結構間的相互作用。也是運籌學的一個重要學科。生物學家使用博弈理論來理解 和預測進化論的某些結果。首先,一個博弈問題必須至少有兩個參與博弈的主題(可能是個人,也可能是團體) ,他們在博弈過程中都有各自的切身利益。其次,博弈中的各個主題之間總不可避免地存在著競爭。最后,博弈的結果隨主題的戰(zhàn)略不同而不同。 博弈論分類 局中人 在一場競賽或博弈中,每一個有決策權的參與者成為 一個局中人 ,或稱為參與人、參與者 。 信息:信息指的是參與者在博弈過程中能了解到和觀察到的知識。 分為完全信息與非完全信息,完全信息即是指每個參與者對自己以及其他參與者的行動,以及各參與者選擇的行動組合產(chǎn)生的收益等知識有完全的了解。它是一個與過程有關的概念,行動是與時序無關的動作。效用通常表現(xiàn)為博弈結果中的輸贏、得失、盈虧。博弈論的一個基本特征是一個局中人的收益不僅取決于自己的戰(zhàn)略選擇,而且取決于其他局中人的戰(zhàn)略選擇。 靜態(tài)博弈:如果局中人同時選擇各自的行動,則這列博弈稱為靜態(tài)的。一種含義就是參 與者在同一時間一起行動;另一種含義是局中人行動雖然有先有后,但后行動者并不知道先行動者采取了具體的活動。后行動者就依據(jù)所獲得的信息,采取自己認為最有利的戰(zhàn)略。 納什均衡由來及定義 約翰 其研究成果見于 題為《非合作博弈》( 1950)的博士論文。納什在上述論文中,介紹了合作博弈與非合作博弈的區(qū)別。 這個 概念后來被稱為納什均衡。所有局中人策略構成一個策略組合。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。 納什均衡經(jīng)典案例 囚徒困境 假設有兩個小偷 A 和 B 聯(lián)合犯事、私入民宅被警察抓住。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑 8年;如果另 一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據(jù)表明其有罪)再加刑 2年,而坦白者有功被減刑 8年,立即釋放。表 給出了這個博弈的支付矩陣。但是由于兩人處于隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己 以求自保、其次才是亞當 這兩個人都會有這樣一個盤算過程:假如他坦白,我抵賴,得坐 10年監(jiān)獄,坦白最多才 8 年;他要是抵賴,我就可以被釋放,而他會坐 10 年牢。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結果都被判 8年刑期。這樣兩 人都選擇坦白的策略以及因此被判 8 年的結局,納什均衡 ” 首先對亞當 但是我們可以從 “ 納什均衡 ” 中引出 “ 看不見的手 ” 原理的一個悖論 :從利己目的出發(fā) ,結果損人不利己 ,既不利己也不利他。 現(xiàn)實生活中有 許多類似于 “囚徒的兩難處境 ”這樣的例子。 納什均衡的重要影響可以概括為以下六個方面 ( 1)改變了經(jīng)濟學的體系和結構。 ( 2)擴展了經(jīng)濟學研 究經(jīng)濟問題的范圍。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟學家們提供了深入的分析工具。納什均衡理論不回避經(jīng)濟個體之間直接的交互作用,A╲ B 坦白 抵賴 坦白 8, 8 0, 10 抵賴 10, 0 1, 1 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 4 不滿足于對經(jīng)濟個體之間復雜經(jīng)濟關系的簡單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強調從微觀個體行為規(guī)律的角度發(fā)現(xiàn)問題的根源, 因而可以更深刻準確地理解和解釋經(jīng)濟問題。即可以將各種問題或經(jīng)濟關系 ,按照經(jīng)典博弈的類型或特征進行分類,并根據(jù)相應的經(jīng)典博弈的分析方法和模型進行 研究,將一個領域所取得的經(jīng)驗方便地移植到另一個領域。納什均衡 普 遍 到幾乎無處不在。納什均衡和博弈論的橋梁作用,使經(jīng)濟學與其他社會科學、自然科學的聯(lián)系更加緊密,形成了經(jīng)濟學與 其他學科相互促進的良性循環(huán)。 博弈論的應用在最近一些年的發(fā)展開始從原來單純集中于經(jīng)濟學領域向著整個社會科學多個領域滲透,同時,即使是經(jīng)濟學本身也有一些新的發(fā)現(xiàn),如著名的 Bertrand 價格競爭模型也發(fā)現(xiàn)有新的混合戰(zhàn)略納什均衡,這種新的混合戰(zhàn)略納什均衡可以對我們實際所觀察到的價格多樣性現(xiàn)象作出解釋。博弈論這種工具使得經(jīng)濟學逐步從一種抽象的純粹理論形態(tài)向著可操作的應用形態(tài)的轉變開始變得可能。不管這一富于想象力的創(chuàng)意最終是否能夠實現(xiàn),博弈論在把抽象經(jīng)濟理論變得更加可操作這一點上起著至關重要的作用毋庸置疑的。231。231。231。231。231。231。231。247。 247。247。 247。桫LLLLLLLL第二章 矩陣對策下均衡與鞍點的存在性 矩陣對策 博弈論 中,用來描述兩個人或多個參與人的策略和支付的矩陣。也稱 “ 贏得矩陣 ” ,是指從支付表中抽象出來由損益值組成的矩陣。 定義 : 若局中人 1選擇策略 i ,局中人 2選擇策略 j ,局中人 1從局中人 2得到的支付是 ija ,則支付矩陣是 式 (21) 對策由該支付矩陣完全決定,所以這種對策稱為 矩陣對策。 在這種對策里,局中人 1 希望支付值 ija 越大越好,局中人 2 則希望付出的 ija 越小越好 .因此,矩陣對策完全是對抗性的。 并且有 11maxmin ijjnim a## 163。 首先,一個矩陣對策如果有鞍點,則可能不只一個。例如:對策的支付矩陣是 0 1 0 32 5 1 33 3 3 4A驏 247。 247。247。 247。 247。 247。 247。桫 較容易得到,該矩陣對策的鞍點為 31a , 32a 和 33a 。 其次,對于某些離散策略集下未必有均衡與鞍點存在。231。231。231。=231。231。231。247。 桫 其中1111m a x m i n m i n m a xi j i jj n i mi m j naaee####= =。鑒于這種情況,我們引入混合戰(zhàn)略。 這類博弈雖然在一次操作中有輸有贏,但這個博弈多次重復進行,可以研究某個戰(zhàn)略應賦予多大的概率,能獲取最大的期望收益。 對完全信息靜態(tài)博弈來說,一個參與者的純戰(zhàn)略是他可以選擇的一種特定的行動。 假設 { }12, ,..., ,i i i iKS s s s= ,選擇戰(zhàn)略 iKs 的概率為 iKp ,則有如下分布律。我們用 ( )12, ,...,i i i iKp p p p= 表示基于戰(zhàn)略空間 iS的任意一個混合戰(zhàn)略,正如之前用 is 表示 iS 中任意一個純戰(zhàn)略。 設 局中人 1 的混合策略 是一組數(shù) 0ix179。 局中人 2 的一個混合策略是一組數(shù) 0iy179。 設 ( )1,..., mX x x= 和 ( )1,..., nY y y= 分別是局中人 1 和 2 的混合策略。因此,局中人 1 選擇策略 i ,局中人 2 選擇策略j ,并且支付為 ija 的概率是 ijxy ,每一個支付相應的概率乘以 ijxy ,對所有的 i 和所有的 j求和,我們就得到局中人 1 的期望支付 11mnij i jija x y==邋 式 (28) 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 8 局中人 1 希望這個期望支付越大越好,局中人 2 則相反,希望它越小越好,設 mS 是滿足 0ix179。 的一切 ( )1,..., mX x x= 的集,如果局中人 1 選用策略 mXS206。 ==邋 式 (29) 這里 mS 是滿足 0iy179。 的一切 ( )1,..., nY y y= 的集。 使 式 ()為最大,即它可以保證自己能得到的期望支付不小于 11m a x m innmmnij i jYSXS ij a x y206。 ==邋 式 (210) 其中,121 1 1 1m a x m i n m i n m a xnnmmm n m ni j i j i j i jY S Y SX S X Si j i jv a x y a x y v撾撾 = = = ==?邋邋 混合策略下的均衡與鞍點存在性 定理 :矩陣對策 ( )ijAa= 有鞍點的充要條件是 11m a x m innmmnij i jYSXS ij a x y206。 ==邋和11m in m a xn mmnij i jYS XS ij a x y206。 ==邋 式 (211) 存在且相等。 ()中二式顯然存在。XAY 有鞍點,并設 ( )*, *XY 是一個鞍點。 和一切 nYS206。由 式 ()左邊的不等式有 m a x * * *mttXS X A Y X A Y206。 因而 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 9 m in m a x 39。 206。 式 (213) 同理,有 式 ()右邊的不等式有 * * m in * m a x m in *mm nttY S Y SXSX A Y X A Y X A Y撾 206。 式 (215) 但已知 反方向的不等式成立,因此, m in m a x m a x m inmmnnttY S Y SX S X SX A Y X A Y撾 撾 = 式 (216)