freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈論與決策行為ppt課件-資料下載頁

2025-05-12 07:00本頁面
  

【正文】 囚徒 2 坦白 不坦白 坦白 囚徒 1 不坦白 5 , 5 0 , 8 8 , 0 1 , 1 ?考慮該博弈重復(fù)兩次,兩博弈方先進(jìn)行第一次博弈,看到第一次結(jié)果后再進(jìn)行第二次博弈。兩囚徒最后得益是兩階段得益之和。 用逆推歸納法分析: ?由于此時前一階段的結(jié)果已經(jīng)成為既成事實,此后也不再有任何的后續(xù)階段,因此實現(xiàn)當(dāng)前自身利益最大化是兩博弈方在該階段中決策的唯一原則。因此,可以推斷出,不論前一階段結(jié)果如何,第二階段的唯一結(jié)果就是原博弈唯一的納什均衡(坦白,坦白),雙方得益( 5, 5)。 ? 回到第一階段,即第一次博弈,理性的博弈方應(yīng)當(dāng)對第二階段的結(jié)局非常清楚,知道第二個階段的結(jié)果必然是(坦白,坦白),雙方在整個重復(fù)博弈中的最終得益,都將是第一階段得益基礎(chǔ)上各加 5。該重復(fù)博弈與下圖得益矩陣表示的一次性博弈是完全等價的:該等價博弈仍然有唯一的純策略納什均衡(坦白,坦白)。 囚徒 2 坦白 不坦白 坦白 囚徒 1 不坦白 10 , 10 5 , 13 13 , 5 6 , 6 依照上述分析方法,我們可以證明 3次、 4次或者 n次重復(fù)囚徒困境的博弈結(jié)果都是一樣的,就是每次博弈方都會采用原博弈唯一的純策略納什均衡。 一般結(jié)論: ?原博弈具有唯一純策略納什均衡的博弈,有限次重復(fù)博弈的均衡即各博弈方在每個階段(每次重復(fù))中都采用原博弈的納什均衡策略。 有限次重復(fù)削價競爭博弈 寡頭 1 高價 低價 由于兩個寡頭在同一個市場的競爭常??梢跃S持相當(dāng)長的時間,因此可以看成重復(fù)博弈。如果假設(shè)兩寡頭都意識到相互競爭的市場格局大約可以持續(xù) 3年,也就是面臨著一個 3次重復(fù)博弈,他們是否還會采用低價,不斷打價格戰(zhàn)呢? 用逆推歸納法分析這個問題,答案是肯定的。上述寡頭市場削價競爭博弈的原博弈是有唯一純策略納什均衡的博弈,在有限次重復(fù)博弈中,各博弈方都會采用一次性博弈中的納什均衡策略。 上述結(jié)論不僅與人們的直覺經(jīng)驗有矛盾,而且在理論上也會引起某些悖論。 100, 100 20, 150 150, 20 70, 70 寡頭 2 高價 低價 連鎖店悖論 ? 一個在 n個市場上都開設(shè)有連鎖店的企業(yè),對于各個市場的競爭者是否應(yīng)當(dāng)采取打擊策略 在位者 默許 斗爭 進(jìn)入 進(jìn)入者 不進(jìn)入 40, 50 10, 0 0, 300 0, 300 競爭者選擇進(jìn)入,先占領(lǐng)市場的連鎖企業(yè)選擇默許是原博弈的唯一納什均衡策略,用逆推歸納法可以證明,該重復(fù)博弈的納什均衡是“每個市場的競爭者都進(jìn)入,連鎖企業(yè)都不打擊”。 容易推斷,如果連鎖企業(yè)對開頭幾個市場的競爭者不惜代價地進(jìn)行打擊,其示范效應(yīng)通??梢試樛似溆嗍袌龅臐撛诟偁幷?,其利益總體上是合算的。 問題的癥結(jié)可能在于逆推歸納法的適用性 多個純策略納什均衡博弈的有限次重復(fù)博弈 三價博弈 廠商 2 H M L H 廠商 1 M L 5,5 0,6 0,2 6,0 3,3 0,2 2,0 2,0 1,1 ( H, H)不是納什均衡,因此一次性博弈的結(jié)果不可能是效率最高的。兩次重復(fù)這個博弈情況會如何呢? 考慮如下策略: 博弈方 1:第一次選 H,如果第一次結(jié)果為( H,H),則第二次選 M,如果第一次結(jié)果為任何其他策略組合,則第二次選 L。 博弈方 2:同 1 在上述策略組合下,兩次重復(fù)博弈的均衡路徑是第一階段( H,H),第二階段( M,M) 三價博弈 廠商 2 H M L H 廠商 1 M L 5,5 0,6 0,2 6,0 3,3 0,2 2,0 2,0 1,1 第二階段采用( M,M)是一個納什均衡策略,兩個博弈方都不愿意單獨偏離;第一階段的( H,H)不是納什均衡,博弈方單獨偏離采用 M策略將增加 1的收益,但這樣做的后果是第二階段至少要損失 2單位的得益,由于雙方采用有“ 報復(fù)機制 ”的策略,因此偏離( H,H)是得不償失的。 首先試探合作,一旦發(fā)現(xiàn)對方不合作則也用不合作相報復(fù)的策略,稱為 “觸發(fā)策略” (Trigger Strategy)(冷酷策略) 。觸發(fā)策略是重復(fù)博弈中實現(xiàn)合作和提高均衡效率的關(guān)鍵機制,是重復(fù)博弈分析的主要構(gòu)件之一。 廠商 2 H M L H 廠商 1 M L 5,5 0,6 0,2 6,0 3,3 0,2 2,0 2,0 1,1 博弈方 1:第一次選 H,如果第一次結(jié)果為( H,H),則第二次選 M,如果第一次結(jié)果為任何其他策略組合,則第二次選 L。 博弈方 2:同 1 博弈方采取上述觸發(fā)策略,當(dāng)?shù)谝浑A段結(jié)果為( H,H)時,第二階段必為( M,M),得益為( 3, 3)而當(dāng)?shù)谝浑A段結(jié)果為其他 8種時,第二階段必為 (L,L),得益為( 1, 1)。 我們把( 3, 3)加到( H,H)上,把( 1, 1)加到其他 8種策略上,就將該兩次博弈轉(zhuǎn)化為一個等價的一次博弈,( H,H)是納什均衡 如果該博弈進(jìn)行 n次,仍然可以用觸發(fā)策略取得較好的結(jié)果,納什均衡路徑為:除了最后一次采用原博弈的納什均衡( M,M),每次都采用( H,H),當(dāng)重復(fù)的次數(shù)較多時,平均得益趨近于( 5,5)。 廠商 2 H M L H 廠商 1 M L 8, 8 1, 7 1, 3 7, 1 4, 4 1, 3 3, 1 3, 1 2, 2 報復(fù)機制的可信性 廠商 2 H M L H 廠商 1 M L 5,5 0,6 0,2 6,0 3,3 0,2 2,0 2,0 1,1 如果第一階段有一方偏離了均衡路徑,另一方將在第二階段采用報復(fù)性的 L策略,偏離一方也只能采用 L,雙方均得到較差的結(jié)果。觸發(fā)策略在報復(fù)偏離均衡的博弈方時,報復(fù)者自己也受到了損失。如果未偏離的一方不記前嫌,還是與對方共同采用 M,對他自己也是有利的。這就引起了上述觸發(fā)策略是否真正可信的問題。 如果認(rèn)為上述觸發(fā)策略不可信,認(rèn)為博弈方不會真正采用觸發(fā)策略,就相當(dāng)于不論第一階段結(jié)果如何,第二階段都會是( M,M),則兩次博弈等價于下述一次博弈: 廠商 2 H M L H 廠商 1 M L 8, 8 3, 9 3, 5 9, 3 6, 6 1, 3 5, 3 5, 3 4, 4 廠商 2 H M L H 廠商 1 M L 5,5 0,6 0,2 6,0 3,3 0,2 2,0 2,0 1,1 ?觸發(fā)策略中報復(fù)機制的可信性是一個很復(fù)雜的問題,會受到相互預(yù)期等因素的影響。 ?假如未偏離一方并不想報復(fù)偏離一方,而偏離一方卻因為害怕被報復(fù)而采用 L,結(jié)果是心慈手軟的未偏離一方再次受到打擊。 ?這種可能性的存在,會使報復(fù)機制的實施可能性增加。 5, 5 0, 6 0, 2 0, 0 0, 0 6, 0 3, 3 0, 2 0, 0 0, 0 2, 0 2, 0 1, 1 0, 0 0, 0 0, 0 0, 0 0, 0 4, 0, 0 0, 0 0, 0 0, 0 0, 0 , 4 重復(fù)博弈觸發(fā)策略可信性較強的博弈 博弈方 2 H M L P Q 博弈方 1 H M L P Q 在兩次重復(fù)中,兩博弈方分別采用這樣的觸發(fā)策略: 博弈方 1:在第一階段采用 H,如果第一階段的結(jié)果是 (H,H),那么第二階段采用 M,否則采用 P 博弈方 2:在第一階段采用 H,如果第一階段的結(jié)果是 (H,H),那么第二階段采用 M,否則采用 Q。 上述觸發(fā)策略組合構(gòu)成該博弈的納什均衡,觸發(fā)策略中的報復(fù)機制是可信的,因為報復(fù)對報復(fù)者自己是有利的。 無限次重復(fù)博弈 ?從對有限次重復(fù)博弈分析可知,存在最后一次重復(fù)是使其無法實現(xiàn)高效率均衡的關(guān)鍵問題。 ?無限次重復(fù)與有限次重復(fù)相似之處在于:懲罰不合作是實現(xiàn)理想均衡的關(guān)鍵。 ?兩人零和博弈的無限次重復(fù)博弈 : ?重復(fù)次數(shù)的無限增加也不能改變原博弈中博弈方之間在利益上的對立關(guān)系,不會創(chuàng)造出潛在的合作利益,博弈方仍然是每次重復(fù)都采用原博弈的混合策略納什均衡。 唯一純策略納什均衡博弈的無限次重復(fù)博弈 兩種情況: 原博弈唯一的納什均衡是帕累托意義上的最佳策略組合,符合各博弈方最大利益。因此不論是有限次重復(fù)博弈還是無限次重復(fù)博弈,都不會與一次性博弈有什么區(qū)別。 唯一的納什均衡并不是效率最高的策略組合,因此存在潛在合作利益囚徒困境式的博弈。 ?以第二種博弈為原博弈的無限次重復(fù)博弈的結(jié)果將有較大的不同,是無限次重復(fù)博弈重點關(guān)注的。 ?囚徒困境式博弈的無限次重復(fù) 4, 4 0,
點擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1