freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

身邊的博弈論-博弈論與信息經(jīng)濟(jì)學(xué)淺說(doc65)-博弈論-資料下載頁

2025-08-07 18:39本頁面

【導(dǎo)讀】1.秦始皇因何統(tǒng)一天下?

  

【正文】 在足球比較開場,裁判將手中的硬幣拋擲到空中,讓雙方隊(duì)長猜硬幣落下的正反面。由于硬幣落下是正是反是隨機(jī)的,概率應(yīng)該都是 1/2。那么,猜硬幣游戲的參與者都是 1/2 的概率選擇正與反,這時博弈達(dá)到混和策略納什均衡。再比如我們兒時玩的“ 剪、布 、錘”就 不存在純策略均衡,對每個小孩來說,自己采取出 “ 剪 ” 、“ 布 ” 還是 “錘” 的策略應(yīng)當(dāng)是隨機(jī)的。 一旦一 方知道 另一方 出其中 某個 策略的可能性 增 大,那么 這個對弈者 在游戲中輸?shù)目赡苄跃?增 大。因此,每個小孩的最優(yōu)混合策略是采取每個策略的可能性是 l/ 3。在這樣的博弈中,每個小孩各取三個策略的 1/ 3 是納什均衡。由此可見:純策略是參與者一 次性選取的,并且堅(jiān)持他選取的策略;而混合策略是參與者在各種備選策略中采取隨機(jī)方式選取的。在博弈中,參與者可以改變他的策略,而使得他的策略選取滿足一定的概率。當(dāng)博弈是零和博弈時,即一方所得是另外一方的所失時,此時只有混合策略均衡。對于任何一方來說,此時不可能有純策略的占優(yōu)策略。 4.位置博弈與商家策略 有這么一個大家都很熟悉的現(xiàn)象,那就是在每個大大小小的城市街道上,經(jīng)常見到一些地段上的商店十分擁擠,構(gòu)成一個繁榮的商業(yè)中心區(qū),但另一些地段卻十分冷僻,沒什么商店。更有意思的是,往往在一個同類型的商家總是聚集在比較 近的地方,比如在任何城市肯德基、麥當(dāng)勞之間總是津津相鄰。再如超市現(xiàn)象,前兩年有很多人對超市的布局發(fā)表了一些議論。因?yàn)橛腥俗⒁獾?,如果在一條街上有 2~ 3 家超市的話,這幾家超市經(jīng)常性地會“相依為鄰”,選址離得很近,倘若它們稍微分散地布置于街上,無疑對市民的購物提供相當(dāng)?shù)谋憷虼怂麄冋J(rèn)為超市“擁擠”在一起屬于資源浪費(fèi)。 類似的事情發(fā)生于電視臺的節(jié)目播放。很多電視迷會發(fā)現(xiàn),大部分電視臺總是將最精彩的節(jié)目放在相同的時間段,甚至有些時候是在相同時間段播放類似的節(jié)目,比如你播“快樂大本營”,我就播“超級總動員”;你播“ 玫瑰有約”,我就播“單身男女”。人都說文人相輕,電視臺也是這么相煎太急。 博弈論能夠?qū)@個現(xiàn)象作出科學(xué)的解釋。首先看一個簡單的博弈模型進(jìn)行敘述: 假設(shè)有條完全筆直的公路,連接城市 A 到城市 B 之間的交通。這條公路上每天行駛著大量的車輛,并且車流量在公路上是均勻分布的。假設(shè)有兩家快餐店,我們不妨假設(shè)為靠高速公路起家的麥當(dāng)勞與肯德基,它們要在這條公路上選擇一個位置開設(shè)快餐,招攬來往車輛。為了能夠更加清晰的說明這個博弈,我們不得不畫一張圖。 再對該模型作一個合乎邏輯的假定:通常情況下,車輛總是樂意到距自己最近的快餐店購買食物。根據(jù)這個原則,從資源的最佳配置來看,麥當(dāng)勞、肯德基應(yīng)該分別開在 1/ 3/41/4 麥當(dāng)勞 3/4 肯德基 1/2 0 A 1 B 圖 1 位置博弈 《身邊的博弈論:博弈論與信息經(jīng)濟(jì)學(xué)淺說》 第 13 頁 共 65 頁 處是最優(yōu)。在這種均勻散布的情況下,每家快餐店所有擁有的客戶從距離最近的城市到兩家快餐店的中心為止,因此都擁有 1/2 的顧客量,同時對于開車的人們總體來說,這種策略的選擇,車輛到快餐店的總的距離最短。 然而,天總不能遂人之愿??系禄c麥當(dāng)勞都是百年老店,自然是精明之至,從經(jīng)濟(jì)學(xué)上就是具有經(jīng)濟(jì)理性。他們只要手段合法,總是希望自己的生意盡可能 地紅火,至于其他人的生意的好壞則與己無關(guān)。出于這種理性,肯德基分店經(jīng)理肯定會想到:如果我將店鋪從3/4 點(diǎn)處向左移一點(diǎn),那麼 1/4 點(diǎn)之間的中點(diǎn)不在是 1/2 點(diǎn)處,而是位于 1/2 點(diǎn)的靠左邊一點(diǎn)。這等于說,這一移位,肯德基將從麥當(dāng)勞搶奪走部分顧客,這對于肯德基單方面來說無疑是一個好主意。當(dāng)然麥當(dāng)勞也不甘示弱,作為一個“理性人”,麥當(dāng)勞自然也應(yīng)該想到將自己的店鋪從 1/4 點(diǎn)處向右移動以爭取更多的顧客。不難想象,雙方博弈的結(jié)果將使他們的店鋪設(shè)置在 l/2 中點(diǎn)附近達(dá)到納什均衡狀態(tài),甲乙兩人相依為鄰且相安無事地做起快餐生意。如果我們放寬條件,不是兩家快餐店,而是很多家快餐店,很容易分析得到結(jié)果:這些快餐店仍然會在 1/2 處設(shè)店達(dá)到納什均衡。 同樣的道理,如果地段的繁華等其他原因在一條路上上都可以認(rèn)為到處相同的話,沒有一個商家會將自己安置于某條路的一頭,只要條件許可,超市將幾乎趨向于相依為鄰,這種現(xiàn)象完全可以看作公正的市場競爭的合理結(jié)果。 這就是很多城市商業(yè)中心形成的原理,在博弈論中稱為位置博弈。 電視臺之間在時間段上的重疊問題在本質(zhì)上就是位置博弈。事實(shí)上,我們只要將時間設(shè)想為上述案例中的公路,就不難分析到它們都將得到大部分 觀眾青睞的精彩節(jié)目放在同一黃金時段完全是市場競爭的結(jié)果。在這種情況下,電視臺之間的競爭會更加激烈,為了獲得收視率,電視臺只能在制作質(zhì)量上下功夫,獲得真正實(shí)惠的依然是廣大觀眾。 5.獵鹿模型的合作哲學(xué) 來看這樣一個“狩獵”故事:設(shè)想在原始社會,人們靠狩獵為生。某一天有兩個獵人圍住了一頭鹿,他們各卡住鹿可能逃跑的兩個路口中的一個。只要他們齊心協(xié)力,鹿就會成為他們的獵物,不過僅憑一個人的力量是無法獵捕到鹿的。如果此時周圍跑過一群兔子,兩位獵人中的任何一個只要去抓兔子一定會獲得成功,他會抓住 4 只兔子。從能夠填飽 肚子的角度來看, 4 只兔子可以供一個人吃 4 天, 1 只鹿如果被抓住將被兩個獵人平分,可供每人吃10 天。這里不妨假設(shè)兩個獵人叫 A 和 B。我們引入一種矩陣式的對兩人博弈的描述方法,見下圖。 4 4 0 4 4 0 10 10 在這個矩陣圖中,每一個格子都代表一種博弈的結(jié)果。具體說來,在左上角的格子表示,獵人 A 和 B 都抓兔子,結(jié)果是獵人 A 和 B 都能 吃飽 4 天;在左下角的格子表示,獵人 A 抓兔子,獵人 B 打鹿,結(jié)果是獵人 A 可以吃飽 4 天, B 則一無所獲;在右上角,獵人 A 打鹿,獵人 B 抓兔子,結(jié)果是獵人 A 一無所獲,獵人 B 可以吃飽 4 天;在右下角,獵人 A 和 B 合獵人 A 獵 人 B 抓兔子 打鹿子 打鹿子 抓兔子 圖 2 獵鹿模型 《身邊的博弈論:博弈論與信息經(jīng)濟(jì)學(xué)淺說》 第 14 頁 共 65 頁 作抓捕鹿,結(jié)果是兩人平分獵物,都可以吃飽 10 天。 在這個博弈中,根據(jù)納什均衡的定義,應(yīng)用博弈論中的“嚴(yán)格劣勢刪除法”(有興趣的讀者可以找本書參考文獻(xiàn)中的相關(guān)書籍閱讀,這里不做詳細(xì)介紹。)可以得到該博弈有兩個納什均衡點(diǎn),那就是:要么分別打兔子,每人吃飽 4 天;要么合作,每人吃飽 10 天。 兩個納什均衡,就是兩個可能的結(jié)局 。兩種結(jié)局到底哪一個最終發(fā)生,這無法用納什均衡本身來確定。比較 [10, 10]和 [4, 4]兩個納什均衡,明顯的事實(shí)是,兩人一起去獵鹿比各自去抓兔子可以讓每個人多吃 12 天。按照經(jīng)濟(jì)學(xué)的說法,合作獵鹿的納什均衡,分頭抓打兔子的納什均衡,具有帕累托優(yōu)勢。與 [4, 4]相比, [10, 10]不僅有整體福利改進(jìn),而且每個人都得到福利改進(jìn)。換一種更加嚴(yán)密的說法就是, [10, 10]與 [4, 4]相比,其中一方收益增大,而其它各方的境況都不受損害。這就是 [10, 10]對于 [4, 4]具有帕累托優(yōu)勢的含義。 在經(jīng)濟(jì)學(xué)中,帕累托效率準(zhǔn)則 是:經(jīng)濟(jì)的效率體現(xiàn)于配置社會資源以改善人們的境況,主要看資源是否已經(jīng)被充分利用。如果資源已經(jīng)被充分利用,要想再改善我就必須損害你或別的什么人,要想再改善你就必須損害另外某個人,一句話,要想再改善任何人都必須損害別的人了,這時候就說一個經(jīng)濟(jì)已經(jīng)實(shí)現(xiàn)了帕累托效率。相反,如果還可以在不損害別人的情況下改善任何人,就認(rèn)為經(jīng)濟(jì)資源尚未充分利用,就不能說已經(jīng)達(dá)到帕累托效率。 目前在世界上比比皆是的企業(yè)強(qiáng)強(qiáng)聯(lián)合就很接近于獵鹿模型的帕累托改善,跨國汽車公司的聯(lián)合、日本兩大銀行的聯(lián)合等等均屬此列,這種強(qiáng)強(qiáng)聯(lián)合造成的結(jié)果是資金 雄厚、生產(chǎn)技術(shù)先進(jìn)、在世界上占有的競爭地位更優(yōu)越,發(fā)揮的影響更顯赫。總之,他們將蛋糕做得更大,雙方的效益也就越高。比如寶山鋼鐵公司與上海鋼鐵集團(tuán)強(qiáng)強(qiáng)聯(lián)合也好,最重要的就是將蛋糕做大。在寶鋼與上鋼的強(qiáng)強(qiáng)聯(lián)合中,寶鋼有著資金、效益、管理水平、規(guī)模等各方面的優(yōu)勢,上鋼也有著生產(chǎn)技術(shù)與經(jīng)驗(yàn)的優(yōu)勢。兩個公司實(shí)施強(qiáng)強(qiáng)聯(lián)合,充分發(fā)揮各方的優(yōu)勢,發(fā)掘更多更大的潛力,形成一個更大更有力的拳頭,將蛋糕做得比原先兩個蛋糕之和還要大。 獵鹿模型的討論,我們的思路實(shí)際只停留在考慮整體效率最高這個角度,而沒有考慮蛋糕做大之后的分配。獵 鹿模型是假設(shè)獵人雙方平均分配獵物。 我們不妨做這樣一種假設(shè),獵人 A 比獵人 B 狩獵的能力水平要略高一籌,但 B 獵人卻是酋長的之子,擁有較高的分配權(quán)??梢栽O(shè)想, A 獵人與 B 獵人合作獵鹿之后的分配不是兩人平分成果,而是 A 獵人僅分到了夠吃 2 天的鹿肉, B 獵人卻分到了夠吃 18 天的鹿肉。在這種情況下,整體效率雖然提高,但卻不是帕累托改善,因?yàn)檎w的改善反而傷害到獵人A 的利益。我們假想,具有特權(quán)的獵人 B 會通過各種手段方法讓獵人 A 乖乖就范。但是獵人 A 的狩獵熱情遭到傷害,這必然會導(dǎo)致整體效率的下降。進(jìn)一步推測,如果不是兩個人進(jìn)行狩獵 ,而是多人狩獵博弈,根據(jù)分配可以分成既得利益集團(tuán)與弱勢群體,這和我國的現(xiàn)狀非常相似。 我國改革進(jìn)程根據(jù)著名經(jīng)濟(jì)學(xué)家左大培先生的研究,在九十年代中期以前是一種帕累托改善的過程。但是隨著國企改制失誤、教育體制改革失誤、醫(yī)療改革失誤、腐敗等因素的影響,逐漸是極少數(shù)既得利益集團(tuán)獲得最大的利益(中國千萬富翁超過 24 萬人),基尼指數(shù)接近 ,社會極度不平等,貧富差距極度拉大,帕累托改善已不存在。很顯然,這種情況如果繼續(xù)下去,社會穩(wěn)定和改革深化會受到?jīng)Q定性的沖擊。 《身邊的博弈論:博弈論與信息經(jīng)濟(jì)學(xué)淺說》 第 15 頁 共 65 頁 第三章 “囚徒困境”的啟示 1.“囚徒困境”的深刻哲理 在前面的章節(jié),筆者討論一個“囚徒困境” (Prisoner’ s dilemma)變形博弈,很明顯,該警察局長所采取的策略必然不能夠使得兩名囚犯坦白罪行。其實(shí),只有改變游戲規(guī)則,利用“囚徒困境”模型策略才可以達(dá)到目的?!疤拱讖膶?,抗拒從嚴(yán)”的道理人人都懂,從博弈論的角度來看,其實(shí)就是一個囚徒困境模型的應(yīng)用。我們前面所討論的愛情博弈其實(shí)也是囚徒困境的一種形式。 這里我們繼續(xù)前面的討論,這個警察局局長 C如果足夠明智的話,必然不要求兩名囚犯都招供,而是讓兩名囚犯中的任何一名坦白,招出另外一個人。這樣警察局局長 C就要 確定,對不坦白的人施以最嚴(yán)厲的刑罰。 這種情況下,警察局局長 C對囚犯 A和 B作成如下許諾:如果他們之中有一人坦白,而另一人不坦白,則坦白者無罪釋放,而不坦白者要被判無期徒刑,囚禁終生;如果兩人都坦白,則兩人都被判有期徒刑 5年;如果兩人都不坦白,則兩人都被判 2年監(jiān)禁。 囚徒困境仍然需要 2個前提預(yù)設(shè):囚徒 A和 B兩人都是自利理性的個人,即只要給出兩種可選的策略,每一方將總是選擇其中對他更有利的那種策略;兩人無法溝通,要在不知道對方所選結(jié)果的情況下,獨(dú)自進(jìn)行策略選擇。在這種條件下,從囚犯 A的立場來看,共有 2種可能情況 :第一種可能是 B采取坦白的策略,這時如果囚犯 A也坦白,則要入獄 5年,如果不坦白,則要囚禁終生,兩相比較,結(jié)論是應(yīng)該坦白。第二種可能是囚犯 B采取沉默的態(tài)度,這時若甲也沉默,要入獄 2年,如果囚犯 A坦白,則可獲得自由,兩相比較結(jié)論是應(yīng)該坦白。因此,無論囚犯 B是坦白還是沉默,囚犯 A采取坦白的策略對自己更為有利。同樣以上推理對于囚犯 B也適用。結(jié)果兩個囚徒都坦白了,都被判刑 5年。囚徒困境的“困境”在于如果甲乙二人都保持沉默,則都只被判刑一年,顯然比兩人都坦白的結(jié)果要好。 兩名囚犯都作出招供的選擇,這對他們個人來說都是 最佳的,即最符合他們個體理性的選擇。照博弈論的說法,這是惟一的納什均衡點(diǎn)。除了這個均衡點(diǎn), A與 B的任何一人單方面改變選擇,他只會得到更加不經(jīng)濟(jì)的結(jié)果。而在其它的結(jié)果中,比如兩人都不坦白的情況下,都有一人可以通過單方面改變選擇,來減少自己的刑期??墒莾扇私?jīng)過一番理性計(jì)算后,卻選擇了一個使自己陷入不利的結(jié)局。 其實(shí)“囚徒困境”不允許囚犯 A和 B進(jìn)行溝通的假設(shè),與實(shí)際生活中大部分情況的現(xiàn)實(shí)是有差異的。比如,在愛情博弈中,很多戀人會經(jīng)?;ㄇ霸孪?、徹夜廝守;在企業(yè)的價格戰(zhàn)中,企業(yè)之間也會多有溝通,價格;即使是二十世紀(jì)下 半世紀(jì)的美蘇軍備競賽中,兩個超級大國也會經(jīng)常進(jìn)行外交交談,及時交換信息。 筆者不妨將條件放寬,允許囚犯 A和 B在審訊室李一起單獨(dú)呆上 10 分鐘,然后再決定是否坦白。很明顯,雙方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能訂立一個口頭協(xié)議,要求雙方都不去坦白。然后,雙方再單獨(dú)被提審。我們不妨設(shè)想,囚犯 A的心理,他一定會認(rèn)為,如果囚犯 B遵守約定的話,則自己坦白就可獲得自由;如果囚犯 B告密的話,若不坦白就會被終生囚禁。事實(shí)上,囚犯 A的策略并沒有因?yàn)楹唵蔚臏贤ɑ騾f(xié)議而擺脫兩難境地。 戀人們在戀愛中的海誓山盟,最終 還是分手;企業(yè)之間相互溝通信誓旦旦,價格戰(zhàn)仍然會爆發(fā);美蘇兩國經(jīng)常會晤,甚至簽訂核不擴(kuò)散條約,但軍費(fèi)一年高過一年。這些現(xiàn)象都反映了上面所說明的問題。 《身邊的博弈論:博弈論與信息經(jīng)濟(jì)學(xué)淺說》 第 16 頁
點(diǎn)擊復(fù)制文檔內(nèi)容
法律信息相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1