【文章內容簡介】
所謂競合,就是競爭合作的簡寫,一個博弈,并不僅僅是競爭,實際上競爭種包含著潛在合作的種子,合作中包含著潛在競爭的種子。合作博弈并不是指合作各方具有合作的意向或態(tài)度,而是指在博弈中有一些對博弈各方有約束力的協(xié)議或契約,或者說是博弈各方不能公然“串通”或“共謀”。合作博弈最典型的例子就是石油輸出國組織歐佩克(Organization of Petroleum Exporting Countries,簡稱 Opec),其 1960 年 9 月,由伊朗、伊拉克、科威特、沙特阿拉伯和委內瑞拉的代表在巴格達開會,決定聯(lián)合起來共同對付西方石油公司,維護石油收入。隨著成員的增加,歐佩克發(fā)展成為亞洲、非洲和拉丁美洲一些主要石油生產國的國際性石油組織。歐佩克協(xié)調和統(tǒng)一各成員國的石油政策,并以石油生產配額制的手段來維護它們各自和共同的利益,把國際石油價格穩(wěn)定在公平合理的水平上。比如有些時候為防止石油價格飚升,歐佩克可依據市場形勢增加其石油產量;為阻止石油價格下滑,歐佩克則可依據市場形勢減少其石油產量。智力游戲與博弈相近似的本質是,在確定游戲規(guī)則的約束下,游戲參與者決策、行動的過程。各種智力游戲實際上就是一個實際社會、經濟、管理、軍事、政治等現(xiàn)象抽象出來的縮微模擬的模型。在這個意義上不妨說,博弈論就是研究怎么玩好游戲的理論。游戲是一種抽象。面對復雜現(xiàn)象時,人們經常會“見樹木不見森林”,無法抓住某種現(xiàn)象的關鍵所在。而在游戲中,可以通過抽象出現(xiàn)實生活中的要點,并將干擾因素減至最6 / 66低,從而輕松地分析問題并找到合理可行的解決方法。中國最古老的圍棋最初的功能形態(tài)就是模擬戰(zhàn)爭。圍棋包含最多的是軍事內涵,如圍而殲之,生死存亡為先,爭地奪利為上。圍棋以獲得最大的利益為勝,抽象出戰(zhàn)爭的本質和目的,非常符合戰(zhàn)爭規(guī)律。圍棋游戲的規(guī)則極其簡單,不過是兩氣生,一氣死,附加帖目、打劫等輔助規(guī)則,最終以所占地盤大小定勝負。但其作為一項智力游戲,與戰(zhàn)爭在很多方面都相通。圍棋棋手在小小棋盤上較量,就是戰(zhàn)爭、戰(zhàn)場、戰(zhàn)斗在棋盤上的演繹。戰(zhàn)爭理念和戰(zhàn)爭指導思想是“基于毀傷”,以破壞、消耗、摧毀敵方為上?,F(xiàn)代西方國家提出“基于效果”的作戰(zhàn)思想,美國人將這一戰(zhàn)爭理念上的革命稱為新的戰(zhàn)爭哲學?;谛Ч褪?,著眼于敵方整個作戰(zhàn)系統(tǒng)的控制,使之喪失作戰(zhàn)能力。美軍在伊拉克發(fā)動“斬首行動”的前一天,還專門召開了推出基于效果作戰(zhàn)理念的新聞發(fā)布會,接著就發(fā)動了進攻。圍棋模擬出“基于效果”的戰(zhàn)爭理念,強調從全局上控制,而不是基于蠅頭小利。即所有的作戰(zhàn)方法都必須是有效的,著子要看在全局中是否有用、有效,而不再是基于棋理、棋道、棋風等虛幻的在形式。基于效果的思想就是贏棋第一,實事求是。比如韓國棋手李昌鎬就是基于效果的典范?,F(xiàn)在很多世界級公司都已經明白智力游戲的作用。比如著名的微軟公司在招聘員工時出過非常“兒童化”的招聘考題,題目是這樣的:“某合唱團的4名成員A、B、C、D往演出現(xiàn)場,他們途中要經過一座小橋。當他們趕到橋頭時,天已經黑了,周圍沒有燈。他們只有一只手電筒?,F(xiàn)在規(guī)定:一次最多只許兩人一起過橋,過橋人手里必須有手電筒,而且手電筒不能用扔的方式傳遞。4個人的步行速度都不同,若兩人同行,則以較慢者的速度為準。A需花1分鐘過橋,B過橋需花2分鐘,C需花5分鐘過橋,D需花10分鐘過橋。請問:他們能在17分鐘內過橋嗎?” 這可不是微軟公司的別出心裁,據說世界上許多躋身世界500強的公司在招收新員工時,都要出類似的智力題。 智力游戲可以鍛煉人的思維能力,培養(yǎng)人的思維方法。良好的思維方法能使我們從錯綜復雜的現(xiàn)象中找到事物的本質,從紛繁的因素中找到事物變化的主要原因,使事物呈現(xiàn)出條理性。思維方法是抽象的,它不像1+1=2那么簡單,只有通過自己的想像,親自動手操作,經歷失敗,才能逐步形成。思維科學化程度越高的人,工作中發(fā)現(xiàn)問題、解決問題的能力就越強。這一點已成為人們的共識。在許多智力游戲中,都存在這么一個共同的特點,就是參與者所選擇的策略對于勝負有著舉足輕重的影響。一個游戲一點規(guī)則制訂好之后,策略選擇的好壞就成了游戲參加者所能自由運用的左右游戲結果的最關鍵因素。特別是在圍棋、象棋之類參與者的初始條件完全相同的游戲中,策略選擇就成了游戲結果的唯一決定因素。至于從圍棋初段段到九段之間的差別,從博弈論的角度去看,就是他們之間策略選擇的技巧高低不同而已。博弈論的策略思維是一種技巧。策略思維從一些基本技巧出發(fā),考慮的是怎樣將這些基本技巧最大限度地發(fā)揮出來。任何游戲都有自己的規(guī)則(Rule of the game) 。實際現(xiàn)實自然也是如此,這就是法律、道德和各種成文或不成文的規(guī)章制度和慣例等。當然,這些規(guī)則也不是一成不變的,它會隨著情況的改變和人們的要求不斷修正,但是只要規(guī)則存在,這個規(guī)則就是確定了人們行為的前提條件。因此博弈與游戲都有一個重要的共同特征,那就是這些規(guī)則規(guī)定游戲參加者可以做什么,不可以作什么,按照什么次序去做,什么時候結束游戲,一旦參與者犯規(guī)將受到怎樣的處罰等。游戲者的策略有相互依存的關系。每一個游戲者從游戲所得結果的好壞不僅取決于自身的策略選擇,同時也取決于其它參加者的策略選擇。有時甚至一個壞的策略會給選它的7 / 66一方帶來并不壞的結果,原因是其它方選擇了更壞的利他而不利己的策略。這一點也是游戲與博弈重要的相似之處。3.博弈論不是“萬金油”博弈論并不是“萬金油”,正如諾貝爾經濟學獎得主萊因哈德澤爾滕教授所說,“博弈論并不是療法,也不是處方,它不能幫我們在賭博中獲勝,不能幫我們通過投機來致富,也不能幫我們在下棋或打牌中贏對手。它不告訴你該付多少錢買東西,這是計算機或者字典的任務。” 要求博弈論能夠完全刻畫真實的世界,那么這命中注定會徒勞無功。根據著名的哥德爾不完備定理,任何一個理論體系必定是不完全的,任何理論包含了既不能證明為真也不能證明為假的命題。對這個世界的最好描述可能只有其本身,但是正如羅賓遜夫人的妙語“比例尺是一比一的地圖是沒用的” 。博弈論也是這樣,博弈論力圖用最簡單的假設下得到最大范圍的推理應用。博弈論的這種方法與很多應用廣泛學科都是相似的。如歐幾里德幾何的基本假設是兩點之間直線,推演出龐大而嚴密的幾何體系,可以說,在生活中或工程應用中,歐幾里德幾何學的思想方法是無處不在、無時不有。其基本公設之一就是,人是理性的(rational) 。所謂理性的人是指行動者具有推理能力,在具體策略選擇時的目的是使自己的利益最大化。而現(xiàn)實生活中,人們再做決策時往往是有限理性。所謂有限理性,也就是說人不是機器,人的理性是有限度的。比方說,某人要簽署一份合同,有三種方法可供選擇:一種是計劃好,安排好一切,然后不動腦筋按部就班地照計劃進行;另一種是做進度安排的時候都留一點余地,可供簽訂合同雙方私下協(xié)商解決:最后一種是完全沒有安排,憑著當時的感情與直覺任意為之,這種方法當然不可能是理性的。后兩種一眼就可看出完全不滿足博弈論意義上的理性,即使是第一種方法也不是真正意義上的經濟理性。這是因為人們很難對每個措施將要產生的結果具有完全的了解和正確的預測,常常要在缺乏完全了解的情況下,一定程度地根據主觀意識進行決策,個人或企業(yè)的決策都是在有限理性的條件下進行的。完全理性,意味著對每個抉擇的確切后果都有完完全全的了解。事實上,一個人對自己的行動條件的了解,從來都只能是零碎的;至于使他得以從對當前狀況的了解去推想未來后果的那些規(guī)律和法則,他也是所知甚微的。人類的精力和時間永遠是有限的,人不可能具備完全理性,不可能掌握所有知識和信息。人類也不可能搜尋到所需的全部的信息。另一方面也要意識到信息的搜尋需要成本,而不是毫不費成本的,因為人類必須為此付出大量的時間、精力和財力等等。意圖搜尋到所有信息,企圖做出收益最優(yōu)的決策行為有時反而是最不理性的行為?! 〉斘覀兺硕笃浯螘r,博弈論可以得到對現(xiàn)實的客觀世界描述的近似。所以博弈論仍然是我們目前所能得到的最好但非唯一的工具。就像并不完美的力學是自然科學的哲學和數學一樣,博弈論是社會科學的力學和數學。沒有牛頓力學我們連最簡單的物理現(xiàn)象都無法理解,馬用了多大的力拉動一車貨物?上帝說“讓牛頓來做吧” ,于是我們知道了馬用的力相當于克服摩擦力。同樣的道理,沒有博弈論我們也無法解釋分析很多現(xiàn)實的社會現(xiàn)象。著名的博弈論大師魯賓斯坦(Rubinstein)說過, “一個博弈模型是我們關于現(xiàn)實的觀念的近似,而不是現(xiàn)實的客觀描述的近似” 。看來“理論之樹是灰色的,生命之樹常青!”這句話,我們應該謹記于心。8 / 66第二章 納什均衡、純策略與混和策略1.從圍棋定式談納什均衡我們已經知道,博弈論的基本前提是,某人或某物的行為效果如何,有賴于他人或他物的行為。由于世上人間的事物很少不依賴于其他事物而存在。非合作博弈強調利益的沖突,即非合作甚至對抗狀態(tài)。比如, “零和博弈”就是典型的非合作博弈,它是指博弈各方的所得之和為零,在特殊情況下如兩人博弈時,一方所得與另一方所失相等。從嚴格的數學角度來看,圍棋 19?19 的 361 個交叉點就是圍棋對弈者所得的總和,因此圍棋棋手非輸即贏,可見圍棋明顯是數學意義上的嚴格的零和博弈。世事如棋局,而棋局是可以用博弈思維加以概括的。比如過分的“騙著” , “本手”與“緩著”之間,一般都會選擇本手,著法過分如不遇反擊,可能占到便宜,如遇反擊則可能虧損,因此如果棋力相當,則應考慮到對手的反擊手段。對手也同樣考慮到在追求利益中不可能占盡便宜。這就導致雙方都能接受的方案。圍棋定式從策略層面看,如一方的策略是搶占實地,另一方是獲得外勢,而結果相當,互有所得,雙方就愿意那樣下。搶占實地考慮現(xiàn)實利益,獲得外勢考慮將來發(fā)展,這便形成一個雙方的“均衡” ;另一方面,可以從具體行棋效果來看,如果一步棋能考慮到對手各種應手而依然成立,對手也運用同樣法則找到應對,則可以說雙方達成了“均衡” 。在經濟學中,均衡(equilibrium)意即相關量處于穩(wěn)定值。比如在經典的供需分析中,若某一商品的市場價格使得欲購買該商品的人均能買到,同時想賣的人均能將商品賣出去,此時該商品的供求達到了均衡。這個市場價格可稱之為均衡價格,產量可稱之為均衡產量。均衡分析是經典經濟學中的重要方法。在講解納什均衡之前,我們再來看這樣一個例子。一般對博弈論稍微有些了解的人,都會知道“囚徒困境”這個名詞。這個例子就是在“囚徒困境”的基礎上所作的修改。A 和 B 是兩個因盜竊而被抓的慣犯。警察局局長 C 正在調查該局管轄區(qū)域內的一宗懸而未決的銀行搶劫案,并且他根據一系列的線索判定 A 和 B 是這樁案子的兇犯。因為該局管轄地區(qū)治安一向混亂不堪,C 的上級對 C 非常惱火,直接威脅 C 如果銀行案破不了,就要撤銷 C 局長的職位,給予降級懲罰。 C 在上級的壓力下不得不耗費大量時間、精力提審A 和 B。為了能夠讓兩個囚犯認罪,C 想讓 A 和 B 明白,假如只有他們其中的一人坦白認罪則這個人可能受到的最嚴厲的懲罰是什么,但向他們遵守承諾,若兩個人都坦白,則會從輕發(fā)落。于是,這個警察局長 C 分別與 A、B 立下許諾:如果只有一個人坦白認罪,則認罪的一方會收到所有指控,會因銀行搶劫而判無期徒刑,另一個人則不會再加刑罰。如果無人認罪,兩個人都會因盜竊罪而判刑 2 年。如果兩個人都坦白,則兩個人都被判處有期徒刑5 年。這樣,警察局長 C 給 A 和 B 構造了一個博弈。不妨假設,A 和 B 都是極其精明的會打小算盤的自私自利不講“江湖義氣”的人,同時 A 和 B 被分別審查不能夠進行溝通。在這種情況下,A 會在腦子里打小算盤,他會想:如果選擇坦白,那么 B 選擇坦白時將判刑5 年,B 選擇不坦白時將判刑 20 年,因此選擇坦白時最壞的打算就把牢底坐穿;若是選擇不坦白,那么 B 選擇坦白時將無罪釋放獲得自由, B 選擇不坦白時將判有期徒刑 5 年,因此選擇不坦白時最壞的可能就是被囚禁 5 年。兩害相權,取其輕。因此在這種情況下,A必然會選擇不坦白,同樣的道理,B 也會選擇不坦白。這個時候,博弈達到了這樣一種局9 / 66面,這種局面就是納什均衡(Nash Equilibrium ) 。納什均衡的思想其實并不復雜,在博弈達到納什均衡時,局中的每一個博弈者都不可能因為單方面改變自己的策略而增加獲益,于是各方為了自己利益的最大化而選擇了某中最優(yōu)策略,并與其他對手達成了某種暫時的平衡。這種平衡在外界環(huán)境沒有變化的情況下,倘若有關各方堅持原有的利益最大化原則并理性面對現(xiàn)實,那么這種平衡狀況就能夠長期保持穩(wěn)定。再簡單一點說,一策略組合中,所有的參與者面臨這樣的一種情況:當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略,他的收益將會降低。在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的沖動。由此可見,納什均衡是一穩(wěn)定的博弈結果。打一個比方,如果把一個乒乓球,放到一個光滑的鐵鍋里,不論其初始位置在何處,最終乒乓球都會穩(wěn)定地停留在鍋底,這時的鍋底就可稱為是一個納什均衡點。相反,如果鍋是扣在地上的,那么鍋底部位是很難放穩(wěn)一個乒乓球的,因為往任何方向的一點點移動,都會使球徹底離開鍋底。這時的鍋底部位就不是一個納什均衡點了。博弈的結果并不都能成為均衡。博弈的均衡是穩(wěn)定的,則必然可以預測。納什均衡的另一層含義是:在對方策略確定的情況下,每個參與者的策略是最好的,此時沒有人愿意先改變或主動改變自己的策略。在上面的“囚徒困境”變形的博弈中,A 和 B 都不坦白就是一個納什均衡,這對雙方來說都是最優(yōu)選擇。同時在這個博弈中,其均衡對雙方來說是全局最優(yōu)的。當然博弈達到納什均衡,并不一定是對參與者最有利的結果,更不意味著是對整個社會作為一個整體而言最