【正文】
期刊文章:非常多,關于博弈論基本問題的文章自 1995陸續(xù)發(fā)表。 ? 它之所以不被廣泛應用的一個猜測是:人們目前還不熟悉、不適應這種多維的思維方式。博弈論與信息經濟學 范文正 述 關于博弈論的某些光環(huán) ? 博弈論很時髦,也有點神秘,誰懂博弈論,或在文章中使用博弈方法,似乎很有面子 ? Why?因為它以數學為基礎,似乎不容易學懂 ? 它有廣泛的用途,但很直接有效的運用似乎也不多見 ? 發(fā)展很快 這些光環(huán)的一點猜測性說明 ? 它曾經很落寞,少數人自己玩得很高興 ? 它 1994獲得諾貝爾獎了,好萊塢居然還拿納什的故事拍電影 ? 它來自數學,對數學不太有感覺的人會覺得它很枯燥,而數學意識強的人卻覺得它很好玩 ? 還不夠成熟,因為它“重在建設” ? 我國的博弈論運用還很落后,幾乎看不到高水平的運用 博弈論之“數學”的特征 ? 只是數學思維、數學符號 ,有些符號怪模怪樣 ,甚至不會讀 ,但很少有什么艱深的數學 ? 這里的符號比較麻煩,因為它和代數中的純粹抽象而無意義的符號不同,在腦子里要時刻記得它們的實際意義 ? 但要熟悉這種簡捷、抽象的思維方式,記住這些符號的代表意義 ? 所以,一個比較有效的學習方法是重復 博弈論的開拓之功 ? “開拓”一般具備什么特征? ? 從學理看:新方法,新模式,新領域 …… ? 從功效看:新辦法,新答案 …… ? 博弈論兼有之 ? 新方法:不同主體之間數量比較和概率思想的結合 ? 新模式:經驗層次的一些“高妙手段”具有邏輯剛性,并非巧合,如“囚徒困境” ? 新領域:突破了傳統(tǒng)經濟學的苛刻假設,而且把觸角不客氣地伸到政治、管理、系統(tǒng)論等領域 博弈論在研究對象之特點上的根本不同 ? 通常的學問或理論體系都以“系統(tǒng)內”為研究對象 ,如果研究多個主體之間的關系,也須納入一個框架之中??此坪唵蔚姆椒?,其實開創(chuàng)了一個思路。 博弈論的學習特點 ? 很多人對博弈論有所期待,似乎它有很強的功效。以前只有陸軍,現在有了空軍,其差異不可以道里計 ? 博弈論研究的是:當成果無法由個體完全掌握,而結局須視群體共同決策而定時,個人為了取勝,應該采取什么策略 ? 博弈論成為通用方法論,經濟學、政治學、管理、軍事、外交、國際關系、公共選擇、犯罪學 ? “深藍”和“更深的藍”使用動態(tài)博弈理論編寫程序,后來戰(zhàn)勝了無敵的卡斯帕羅夫 博弈論要點 ? 著名案例 ——囚徒困境 prisoner39。參與人的行動有先后順序 – 從擁有信息角度: ? 完全信息博弈。分為有限博弈和無限博弈 ,后者表現為連續(xù)對策、重復博弈和微分對策等。信息在博弈中占重要地位 ,博弈的贏得很大程度上依賴于信息的準確度與多寡。如果完全了解則稱之為“具有完美信息”的博弈。分為零和博弈和變和博弈。 ? 有時,雙方會形成這樣一種狀態(tài):我的最好策略所依賴的條件就是你的最好策略。 ? 如果一個協(xié)議不構成納什均衡,它就不可能自動實施,需要外力脅迫,這就無所謂“協(xié)議” Nash Equilibrium A Nash equilibrium, named after John Nash, is a set of strategies, one for each player, such that no player has incentive動機 to unilaterally單方面 change her action. Players are in equilibrium if a change in strategies by any one of them would lead that player to earn獲得 less than if she remained保持 with her current strategy. For games in which players randomize (mixed strategies), the expected or average payoff must be at least as large as that obtainable能得到的 by any other strategy. 納什均衡,一個策略集合,其中每個參與人沒有動機去但方面地改變自己的行為。哈丁成功地將“囚徒的困境”與資源耗竭結合起來 , 揭示了生態(tài)環(huán)境問題與囚徒困境的相似之處。 ? 從“納什均衡”還可以悟出:合作是有利的“利己策略”,但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。反映了所有人的絕對偏好,因此十分穩(wěn)定。如果這種解只有一組,此即上策均衡。它選擇了參與人的特征類型。 不完全信息靜態(tài)博弈: 貝葉斯 納什均衡 貝葉斯統(tǒng)計簡介 ? 經典統(tǒng)計學需要兩種信息:總體和樣本 ? 貝葉斯統(tǒng)計加入了“先驗信息”,來源于經驗和歷史資料。先行者知道自己的行為會被他人利用,就會設法傳遞有利信息。 u=ui(s1, sn*) –均衡:一種所有動作的影響都互相抵消,整個系統(tǒng)處于平穩(wěn)的、均勢的、不變的狀態(tài) *39。≠ si* 是數理邏輯符號,全稱量詞, 讀作“對于全部”或“對于每一個” Universal quantifier, read for all or for every ? ? G ? 博弈的參與人集合 ? 每個人的戰(zhàn)略空間 ? 每個人的支付函數 ? 如果:參與人個數有限,每個參與人的戰(zhàn)略有限,則為“有限博弈” ? 兩人有限博弈的戰(zhàn)略式表述可以用矩陣表示 – 納什均衡是完全信息靜態(tài)博弈的一般概念,也是 所有 其他類型博弈的基本要求 ? – 占優(yōu)戰(zhàn)略均衡的定義 – 如果所有參與人都有占優(yōu)戰(zhàn)略存在,則占優(yōu)戰(zhàn)略均衡是可以預測到的惟一的均衡 納什均衡 – 占優(yōu)戰(zhàn)略均衡是非常合理的預測,但經常不存在,這才是博弈論真正的用武之地 ? – 智豬博弈中,沒有占優(yōu)戰(zhàn)略均衡 – 首先找出某個參與人的劣戰(zhàn)略,剔除之,再找,再剔除,直到最后的一個 – 劣戰(zhàn)略、占優(yōu)戰(zhàn)略的定義 – 弱占優(yōu)戰(zhàn)略的定義 – 重復剔除的占優(yōu)均衡的定義 納什均衡 ? ? 很多博弈無法使用重復剔除的方法找到均衡解 ? 定義 ? 沒有任何一個戰(zhàn)略嚴格優(yōu)于納什均衡戰(zhàn)略 (嚴格優(yōu),大于,不包括等于 ) ? 強納什均衡 納什均衡 ? ? 兩個寡頭企業(yè),市場總產量為 Q=q1+q2。高于各自產量為 2時的總得益 8。 ? 如果一個博弈有兩個純戰(zhàn)略納什均衡,那么,一定存在第三個混合戰(zhàn)略納什均衡 納什均衡的存在性和多重性的討論 ? ? p113圖 ? X本來是一組自變量,每一個自變量都有一些取值,必然存在一點,使每個人的選擇所形成的結果等于自己在這一點上所期望的結果。以及相應的符號 – 信息集:某個參與人都知道些什么 – 信息集是用來標注某個人知道些什么信息的,不同的標注表示這個人知道不同的信息p142 博弈的擴展式表述 ? 如果博弈樹的所有信息集都是單結的,則稱為“完美信息博弈”,沒有任何兩個決策結是用虛線連起來的 ? 自然信息集總是假設為單結的 ? 博弈樹上是否出現連接不同決策結的虛線取決于如何劃決策結的順序 p145 ? 一個參與人在決策之前所適當的事情必須出現在該參與人的決策結之前 ? 有了信息集的概念,擴展式表述也可用來表述靜態(tài)博弈 擴展式表述博弈的納什均衡 博弈樹:房地產開發(fā)博弈 I A 開發(fā) 不開發(fā) 大 小 大 小 開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (3,3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4 博弈樹:不允許的情形 博弈樹的結構 信息集:房地產博弈 II A 開發(fā) 不開發(fā) 大 小 大 小 開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (3,3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4 信息集:房地產博弈 III A 開發(fā) 不開發(fā)