freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

靜態(tài)博奕的多重nash均衡及其在經(jīng)濟系統(tǒng)均_衡中應用畢業(yè)論文(編輯修改稿)

2024-09-30 20:58 本頁面
 

【文章內(nèi)容簡介】 罪(因已有證據(jù)表明其有罪)再加刑 2年,而坦白者有功被減刑 8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄 1 年。表 給出了這個博弈的支付矩陣。 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 3 表 1:支付矩陣 關于案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判 1 年。但是由于兩人處于隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己 以求自保、其次才是亞當 斯密的理論,假設每個人都是 “ 理性的經(jīng)濟人 ” ,都會從利己的目的出發(fā)進行選擇。這兩個人都會有這樣一個盤算過程:假如他坦白,我抵賴,得坐 10年監(jiān)獄,坦白最多才 8 年;他要是抵賴,我就可以被釋放,而他會坐 10 年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結果都被判 8年刑期。 基于經(jīng)濟學中 Rational agent 的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被釋放就不會出現(xiàn)。這樣兩 人都選擇坦白的策略以及因此被判 8 年的結局,納什均衡 ” 首先對亞當 斯密的 “ 看不見的手 ” 的原理提出挑戰(zhàn):按照斯密的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。但是我們可以從 “ 納什均衡 ” 中引出 “ 看不見的手 ” 原理的一個悖論 :從利己目的出發(fā) ,結果損人不利己 ,既不利己也不利他。 納什均衡的重要影響 從 “納什均衡 ”的普遍意義中我們可以深刻領悟司空見 慣的經(jīng)濟、社會、政治、國防、管理和日常生活中的博弈現(xiàn)象。 現(xiàn)實生活中有 許多類似于 “囚徒的兩難處境 ”這樣的例子。如價格戰(zhàn)、軍奮競賽、污染等等。 納什均衡的重要影響可以概括為以下六個方面 ( 1)改變了經(jīng)濟學的體系和結構。非合作博弈論的概念、內(nèi)容、模型和分析工具等,均已滲透到微觀經(jīng)濟學、宏觀經(jīng)濟學、勞動經(jīng)濟學、國際經(jīng)濟學、環(huán)境經(jīng)濟學等經(jīng)濟學科的絕大部分學科領域,改變了這些學科領域的內(nèi)容和結構,成為這些學科領域的基本研究范式和理論分析工具,從而改變了原有經(jīng)濟學理論體系中各分支學科的內(nèi)涵。 ( 2)擴展了經(jīng)濟學研 究經(jīng)濟問題的范圍。原有經(jīng)濟學缺乏將不確定性因素、變動環(huán)境因素以及經(jīng)濟個體之間的交互 作用模式化的有效辦法,因而不能進行微觀層次經(jīng)濟問題的解剖分析。納什均衡及相關模型分析方法,包括擴展型博弈法、逆推歸納法、子博弈完美納什均衡等概念方法,為經(jīng)濟學家們提供了深入的分析工具。 ( 3)加強了經(jīng)濟學研究的深度。納什均衡理論不回避經(jīng)濟個體之間直接的交互作用,A╲ B 坦白 抵賴 坦白 8, 8 0, 10 抵賴 10, 0 1, 1 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 4 不滿足于對經(jīng)濟個體之間復雜經(jīng)濟關系的簡單化處理,分析問題時不只停留在宏觀層面上而是深入分析表象背后深層次的原因和規(guī)律,強調(diào)從微觀個體行為規(guī)律的角度發(fā)現(xiàn)問題的根源, 因而可以更深刻準確地理解和解釋經(jīng)濟問題。 ( 4)形成了基于經(jīng)典博弈的研究范式體系。即可以將各種問題或經(jīng)濟關系 ,按照經(jīng)典博弈的類型或特征進行分類,并根據(jù)相應的經(jīng)典博弈的分析方法和模型進行 研究,將一個領域所取得的經(jīng)驗方便地移植到另一個領域。 ( 5)擴大和加強了經(jīng)濟學與其他社會科學、自然科學的聯(lián)系。納什均衡 普 遍 到幾乎無處不在。納什均衡理論既適用于人類的行為規(guī)律,也適合于人類以外的其他生物的生存、運動和發(fā)展的規(guī)律。納什均衡和博弈論的橋梁作用,使經(jīng)濟學與其他社會科學、自然科學的聯(lián)系更加緊密,形成了經(jīng)濟學與 其他學科相互促進的良性循環(huán)。 ( 6)改變了經(jīng)濟學的語言和表達方法。 博弈論的應用在最近一些年的發(fā)展開始從原來單純集中于經(jīng)濟學領域向著整個社會科學多個領域滲透,同時,即使是經(jīng)濟學本身也有一些新的發(fā)現(xiàn),如著名的 Bertrand 價格競爭模型也發(fā)現(xiàn)有新的混合戰(zhàn)略納什均衡,這種新的混合戰(zhàn)略納什均衡可以對我們實際所觀察到的價格多樣性現(xiàn)象作出解釋。最近一些年,心理學與博弈論的結合也逐漸取得了引人注目的成就,建立在心理學證據(jù)上的博弈論法則是當前這個領域中出現(xiàn)十分有趣的現(xiàn)象,而作為博弈論比較陳舊的領域之一的合作博弈也有新的 發(fā)現(xiàn)。博弈論這種工具使得經(jīng)濟學逐步從一種抽象的純粹理論形態(tài)向著可操作的應用形態(tài)的轉變開始變得可能。這一點從匹配問題解決過程中可以比較明確地看出來,以至于有人提出通過博弈論方法的應用將許多經(jīng)濟領域的機制設計統(tǒng)一形成一個所謂“經(jīng)濟工程學”的新興學科的構想。不管這一富于想象力的創(chuàng)意最終是否能夠實現(xiàn),博弈論在把抽象經(jīng)濟理論變得更加可操作這一點上起著至關重要的作用毋庸置疑的。 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 5 11 12 121 22 21 2 11nnmma a aa a aa a a驏 247。231。 247。231。 247。231。 247。231。247。231。 247。231。 247。231。 247。247。231。 247。231。247。231。 247。231。桫LLLLLLLL第二章 矩陣對策下均衡與鞍點的存在性 矩陣對策 博弈論 中,用來描述兩個人或多個參與人的策略和支付的矩陣。不同參與人的利潤或效用就是支付。也稱 “ 贏得矩陣 ” ,是指從支付表中抽象出來由損益值組成的矩陣。 設局中人 1有個策略 1,...,im? ;局中人 2有 n 個策略 1,...,jn= 。 定義 : 若局中人 1選擇策略 i ,局中人 2選擇策略 j ,局中人 1從局中人 2得到的支付是 ija ,則支付矩陣是 式 (21) 對策由該支付矩陣完全決定,所以這種對策稱為 矩陣對策。 見文獻 [2]。 在這種對策里,局中人 1 希望支付值 ija 越大越好,局中人 2 則希望付出的 ija 越小越好 .因此,矩陣對策完全是對抗性的。 如果局中人 1 選擇他的第 1個策略,即 1i? ,則他至少可以得到支付 1min ijjna# 一般地,如果局中人 1 采用他的第 i 個策略,則他至少 可以得 到支付 1min ijjna# 式 (22) 這就是支付矩陣第 i 行元素中的最小元素 .由于局中人 1 希望 ija 越大越好,因此,他可以選擇 i使 式 ()為最大 .這就是說,局中人 1可以選擇 i ,使得他得到的支付不少于 11maxmin ijjnim a## 式 () 同樣,如果局中人 2選擇他的第 1個策略,即 1j? ,則他最多失去 (輸?shù)?) 1max ijina# 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 6 一般地,如果局中人 2 采用他的第 j 個策略,則他至多失去 1max ijina# 式 () 這是支付矩陣第 j 列的最大元素 .由于局中人 2 希望 ija 越小越好,因此,他可以選擇 j使 式 ()為最小 .這就是說,局中人 2可以選擇 j,保證他失去的不大于 1 1minmax ijim jna# # 式 () 也可以說,如果局中人 2處理得當,局中人 1得到的支付不會大于 ()中的值 。 并且有 11maxmin ijjnim a## 163。 1 1minmax ijim jna# # 式 () 鞍點 一個矩陣對策,如果支付矩陣 ()ija 的元素滿足 11maxminijjnim a##v= =1 1minmaxijim jn# # 式 (27) 此時設存在 *i 和 *j ,使得 **ijva= ,此時的 ( )*, *ij 成為對策的一個鞍點。 首先,一個矩陣對策如果有鞍點,則可能不只一個。但對于不同的鞍點支付值是相同的,且都等于對策的值。例如:對策的支付矩陣是 0 1 0 32 5 1 33 3 3 4A驏 247。231。 247。231。247。231。 247。= 231。 247。231。 247。231。 247。231。桫 較容易得到,該矩陣對策的鞍點為 31a , 32a 和 33a 。其中 31a = 32a = 33a =v =3。 其次,對于某些離散策略集下未必有均衡與鞍點存在。例如矩陣對策: 0 00Aeeeeee驏 247。231。 247。231。247。231。 247。=231。 247。231。 247。231。 247。247。231。 桫 其中1111m a x m i n m i n m a xi j i jj n i mi m j naaee####= =。 混合策略 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 7 在博弈中,一旦每個參與者 都在竭力猜測其他參與者的戰(zhàn)略選擇 ,而不能通過收益函數(shù)作出最有反映,那么在這類博弈中,因為最有行為是不確 定的,所以就不存在納什均衡。鑒于這種情況,我們引入混合戰(zhàn)略。 定義 : 混合策略: 是指參與者以一定的概率去選擇某種戰(zhàn)略。 這類博弈雖然在一次操作中有輸有贏,但這個博弈多次重復進行,可以研究某個戰(zhàn)略應賦予多大的概率,能獲取最大的期望收益。 定義 : 規(guī)范的表述,參與者 i 的混合戰(zhàn)略是在其戰(zhàn)略空間 iS 中戰(zhàn)略 is 的概率分布 ,is 稱為純戰(zhàn)略。 對完全信息靜態(tài)博弈來說,一個參與者的純戰(zhàn)略是他可以選擇的一種特定的行動。一個參與者的混合戰(zhàn)略就是規(guī)定他以某種概率分布隨機去選擇不同的行動。 假設 { }12, ,..., ,i i i iKS s s s= ,選擇戰(zhàn)略 iKs 的概率為 iKp ,則有如下分布律。這時,概率分布 ( )12, ,...,i i iKp p p 就是參與者 i 的一個混合戰(zhàn)略,其中 01ikp# 且 12 ... 1i i iKp p p+ + + =,概率不同就構成參與者不同的混合戰(zhàn)略。我們用 ( )12, ,...,i i i iKp p p p= 表示基于戰(zhàn)略空間 iS的任意一個混合戰(zhàn)略,正如之前用 is 表示 iS 中任意一個純戰(zhàn)略。 設矩陣對策矩陣 ( )ijAa= ,其中 1,...,im= , 1,...,jn= 。 設 局中人 1 的混合策略 是一組數(shù) 0ix179。 , 1,...,im= ,滿足 1 1mii x= =229。 局中人 2 的一個混合策略是一組數(shù) 0iy179。 , 1,...,jn= ,滿足 1 1nij y= =229。 設 ( )1,..., mX x x= 和 ( )1,..., nY y y= 分別是局中人 1 和 2 的混合策略。局中人 1 以概率 ix 選用策略 i ,局中人 2 以概率 jy 選用策略 j 。因此,局中人 1 選擇策略 i ,局中人 2 選擇策略j ,并且支付為 ija 的概率是 ijxy ,每一個支付相應的概率乘以 ijxy ,對所有的 i 和所有的 j求和,我們就得到局中人 1 的期望支付 11mnij i jija x y==邋 式 (28) 南京郵電大學 2020 屆本科生畢業(yè)設計(論文) 8 局中人 1 希望這個期望支付越大越好,局中人 2 則相反,希望它越小越好,設 mS 是滿足 0ix179。 , 1,...,im= ,1 1mii x= =229。 的一切 ( )1,..., mX x x= 的集,如果局中人 1 選用策略 mXS206。 ,則它的期望支付至少是 11m innmnij i jYS ija x y206。 ==邋 式 (29) 這里 mS 是滿足 0iy179。 , 1,...,jn= ,1 1nij y= =229。 的一切 ( )1,..., nY y y= 的
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1