【正文】
因為它讓對方得到了高分。進化實驗揭示了一個哲理:一個策略的成功應(yīng)該以對方的成功為基礎(chǔ)。這個程序一開始發(fā)展很快,但等到除了一報還一報之外的其它程序開始消失時,它就開始下降了。另外,有一些程序在進化過程中消失了。實驗結(jié)果很有趣。按這樣的思路,艾氏設(shè)計了一個實驗,假設(shè)63個對策者中,誰在第一輪中的得分高,他在第二輪的群體中所占比例就越高,而且是他的得分的正函數(shù)。第三,學習。第二,遺傳。假設(shè)對策者所組成的策略群體是一代一代進化下去的,進化的規(guī)則包括:一,試錯。一報還一報就有很好的清晰性,讓對方很快發(fā)現(xiàn)規(guī)律,從而不得不采取合作的態(tài)度。可激怒性和寬容性也得到了證明。艾氏總結(jié)這次游戲的結(jié)論是:第一,一報還一報仍是最優(yōu)策略。第二次征集到了62個程序,加上他自己的隨機程序,又進行了一次競賽。艾克斯羅德還發(fā)現(xiàn),得分排在前面的程序有三個特點:第一,從不首先背叛,即善良的;第二,對于對方的背叛行為一定要報復(fù),不能總是合作,即可激怒的;第三,不能人家一次背叛,你就沒完沒了的報復(fù),以后人家只要改為合作,你也要合作,即寬容性。結(jié)果得分最高的程序是加拿大學者羅伯布寫的一報還一報(tit for tat)。他要求每個參賽者把追求得分最多的策略寫成計算機程序,然后用單循環(huán)賽的方式將參賽程序兩兩博弈,以找出什么樣的策略得分最高。對于總是不合作的人,也只能采取不合作的策略。對這種對策者,當然合作下去是上策。在多人對策持續(xù)進行下去,且W比較大,即未來充分重要時,最優(yōu)的策略是與別人采取的策略有關(guān)的。這樣,合作的動機就顯現(xiàn)出來。既然如此,前面的每一次也就沒有合作的必要,因此,在次數(shù)已知的多次博弈中,對策者沒有一次會合作。在數(shù)學上,這個一次性決策的矩陣沒有最優(yōu)解。這個結(jié)果在矩陣中并非最優(yōu)。這是A單方面的優(yōu)超策略。在矩陣中,對于A來說,當對方選C,他選D得5分,選C只得3分;當對方選D,他選D得1分,選C得零分。如果兩人都選D,總體得2分。顯然,對群體來說最好的結(jié)果是雙方都選C,各得3分,共得6分。選擇C代表合作,選擇D代表不合作。對策論以著名的囚犯困境來描述這個問題。比如國家之間的關(guān)稅報復(fù),對他國產(chǎn)品提高關(guān)稅有利于保護本國的經(jīng)濟,但是國家之間互提關(guān)稅,產(chǎn)品價格就提高了,喪失了競爭力,損害了國際貿(mào)易的互補優(yōu)勢。在此前提下,合作要研究的問題是:第一、人為什么要合作;第二、人什么時候是合作的,什么時候又是不合作的;第三、如何使別人與你合作?!∫弧?博弈中最優(yōu)策略的產(chǎn)生 艾克斯羅德在開始研究合作之前,設(shè)定了