freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

《博弈論與決策行為》ppt課件-預(yù)覽頁

2025-06-05 07:00 上一頁面

下一頁面
 

【正文】 ite game),如果一個(gè)博弈中至少有某些參與人的戰(zhàn)略有無限多個(gè),則稱為 “無限博弈 ”(infinite game)。靜態(tài)博弈與動(dòng)態(tài)博弈就是依據(jù)行動(dòng)的順序進(jìn)行區(qū)分的。 ?除一般意義上的參與人外,博弈論中還有 “虛擬參與人 ”( pseudo player) —— 自然( nature), “自然 ”是指不以博弈參與人意志為轉(zhuǎn)移的外生事件, “自然 ”選擇的是外生事件的各種可能現(xiàn)象,并用概率分布來描述 “自然 ”的選擇機(jī)理。參與人可以是自然人,也可以是企業(yè)、團(tuán)隊(duì)、國家,甚至是國家組成的集團(tuán)(如歐盟、 OPEC等)。 ?與行動(dòng)相關(guān)的一個(gè)重要問題是行動(dòng)的順序。各參與人可以選擇的全部戰(zhàn)略或戰(zhàn)略選擇的范圍稱為“戰(zhàn)略空間”。 ?五、信息 ?信息指的是參與人在博弈過程中能夠了解和觀察到的知識(shí),這些知識(shí)包括“自然”的選擇、其他參與人的特征和行動(dòng)等。 ?當(dāng)前,非合作博弈是博弈論研究的主流領(lǐng)域。 2. 2. 1 博弈的標(biāo)準(zhǔn)式表述和求解 ?博弈標(biāo)準(zhǔn)式表述含有以下三個(gè)要素: ?( 1)參與人集合, ?( 2)每一個(gè)參與人可供選擇的戰(zhàn)略集, ?( 3)針對(duì)所有參與人可能選擇的戰(zhàn)略組合,每一個(gè)參與人獲得的收益。 ?占優(yōu)戰(zhàn)略均衡只要求所有的參與人是理性的,而并不要求每個(gè)參與人知道其他參與人也是理性的。 ?劣戰(zhàn)略 (dominated strategies): 是指在其他博弈參與人戰(zhàn)略為既定的條件下,某一參與人可能采取的戰(zhàn)略中,對(duì)自己相對(duì)不利的戰(zhàn)略。在上例中,如果大豬不能排除小豬按按鈕的可能性,按按鈕就不一定是大豬的最優(yōu)選擇。u1,…,u n}中,如果由各個(gè)博弈方的各一個(gè)策略組合( s1*, …,s n*)中,任一博弈方 i的策略 si*都是對(duì)其余博弈方策略組合( s1*, …, s i1*, si+1*,…, s n*)的最佳策略,即 ui( s1*, …, s i1*, si*,si+1*,…, s n*) ≥ui( s1*, …, s i1*, sij,si+1*,…, s n*)對(duì)任意 sij∈ Si都成立,則稱( s1*, …,s n*)為 G的一個(gè)納什均衡。 在這個(gè)假設(shè)下 ,如果企業(yè)的競爭戰(zhàn)略是價(jià)格而不是產(chǎn)量 , 伯川德( Bertrand) 證明 , 即使只有兩個(gè)企業(yè) , 在均衡情況下 , 價(jià)格等于平均成本 , 企業(yè)的利潤為零 ,與完全競爭市場均衡一樣 。因此,直至價(jià)格被壓低至成本水平(假如雙方相同),雙方都將價(jià)格定為在略低于對(duì)手的水準(zhǔn)。 在存在產(chǎn)品差異的情況下 , 均衡價(jià)格不會(huì)等于成本 。 ? 假定有一個(gè)長度為 1的線性城市 , 消費(fèi)者均勻分布在[0,1]區(qū)間里 , 分布密度為 1。 需求函數(shù) Di(p1, p2),( i=1, 2)。 D2(p1, p2) = ( p2 c )(ttpp221??) ?求使得利潤最大的價(jià)格水平 , 分別令以下一階導(dǎo)數(shù)為零: 0221211???????ptcppu 0222122???????ptcppu ?解得: ?p1* = p2* = c + t ?每個(gè)企業(yè)的均衡利潤為: ?u1 = u2 = t/2 ?當(dāng)旅行成本為零時(shí) , 不同商店的產(chǎn)品之間具有完全的替代性 , 沒有任何一個(gè)商店可以把價(jià)格定得高于成本 , 我們就得到伯川德均衡結(jié)果 : ?p1* = p2* =c ?u1 = u2 = 0 ?更為一般地 , 我們可以討論商店位于任何位置的情況 。 ?在人們完全從自利動(dòng)機(jī)出發(fā)自由利用公共資源時(shí) ,公共資源傾向于被過度利用 、 低效率使用和浪費(fèi) ,并且過度使用會(huì)達(dá)到任何利用它們的人都無法得到實(shí)際好處的程度 。 ? 假設(shè)所有農(nóng)戶都清楚這片公共草地最多只能養(yǎng)多少只羊和羊只總數(shù)的不同水平下每只羊的產(chǎn)出 。V(q1+… +qn)qic 假設(shè) n=3, 即只有三個(gè)農(nóng)戶 , 每只羊的產(chǎn)出函數(shù)為 V=100- Q=100- (q1+ q2+ q3), 成本 c=4。 當(dāng) n 趨向于無窮大時(shí)呢 ? 三、二級(jí)價(jià)格拍賣 ?一個(gè)賣主有一個(gè)不可分單位的標(biāo)的要出售 , 有 I個(gè)潛在的買主 ( 投標(biāo)者 ) , 他們對(duì)標(biāo)的估價(jià)是 ?投標(biāo)者同時(shí)選擇投標(biāo) , 最高的投標(biāo)者贏得標(biāo)的 ,并收益第二投標(biāo)金額 。 ii vs ?令 首先設(shè) ?如果 , 則投標(biāo)者獲得效用 0, 而這一效用可以通過以投標(biāo) 而獲得; ?如果 投標(biāo)者獲得效用 , 這還是他通過以 投標(biāo)可以獲得的效用 。 由于以估價(jià)出價(jià)是一種優(yōu)勢策略 , 所以投標(biāo)者是否具有關(guān)于彼此估價(jià)的信息并不重要 。 ( 3) 如果博弈一方已經(jīng)采用隨機(jī)選擇的方法決定出正面還是反面 , 但總體上出正面的機(jī)會(huì) ( 概率 ) 大于出反面的機(jī)會(huì) ( 概率 ) , 那么另一方仍然有機(jī)可乘 。我們稱這種策略選擇方式為“混合策略”( mixed strategies),與此相對(duì),把博弈中原來意義上的策略稱為“純策略”( pure strategies)。 ? 當(dāng)我們把博弈方的策略從純策略擴(kuò)展到混合策略,把策略空間從純策略空間擴(kuò)展到混合策略空間的時(shí)候,納什均衡的基礎(chǔ)也就擴(kuò)大了。 Pt(P)=0 PVPPSDSpgt????V, D P, 0 0, S 0, 0 守衛(wèi) 睡 不睡 偷 小偷 不偷 ?失職守衛(wèi)長期中的真正作用 , 恰恰是會(huì)降低盜竊發(fā)生的概率 。 ?“每一個(gè)有限博弈都至少有一個(gè)混合策略納什均衡”。 ?對(duì)有些博弈問題僅僅進(jìn)行納什均衡分析是不夠的,必須在納什均衡分析的基礎(chǔ)上再作進(jìn)一步的深入分析。 ?盡管事前的磋商確實(shí)可能使帕雷托均衡出現(xiàn),但這一結(jié)論并不總是成立。 ?上述反饋機(jī)制會(huì)隨著相互信任的難度而加強(qiáng)。 ?溝通與信心 ?搭便車 ?三 、 聚點(diǎn)均衡 ?博弈方利用博弈規(guī)則以外的特定信息,如博弈方共同的文化背景中的習(xí)慣或規(guī)范,共同的知識(shí),或者具有特定意義事物的特征、某些特殊的數(shù)量、位置關(guān)系等,在多重納什均衡制作選擇 ?例:兩個(gè)博弈方同時(shí)報(bào)一個(gè)時(shí)間,所報(bào)時(shí)間相同各可獲得 100元的獎(jiǎng)勵(lì),所報(bào)時(shí)間不同則不能獲得獎(jiǎng)勵(lì) ?這個(gè)博弈有無窮多個(gè)納什均衡,雙方選擇任何一個(gè)相同時(shí)間都是該博弈的納什均衡,而且這些納什均衡相互之間完全不存在效率意義上的優(yōu)劣關(guān)系。 2. 3 完全且完美信息動(dòng)態(tài)博弈 2. 3. 1 動(dòng)態(tài)博弈的表示法和特點(diǎn) ? 動(dòng)態(tài)博弈一般用“擴(kuò)展形” (或稱“博弈樹”)表示。 ?例如下象棋是動(dòng)態(tài)博弈,但它不僅博弈階段很多,而且每各階段的可能選擇也很多,因此很難用擴(kuò)展形表示。我們稱這種問題為動(dòng)態(tài)博弈中的“相機(jī)選擇”( Contingent Play)。 ?所以,承諾行為就意味著當(dāng)事人要為自己的諾言付出成本,盡管這種成本不一定真的發(fā)生。 ? 子博弈完美納什均衡能夠排除均衡策略中不可信的威脅和承諾,因此是真正穩(wěn)定的。 ?一般方法:從動(dòng)態(tài)博弈的最后一個(gè)階段開始分析 , 每一次確定出所分析階段博弈方的選擇和路徑 , 然后再確定前一個(gè)階段的博弈方的選擇和路徑 。在第二個(gè)階段廠商 2決策時(shí) , 廠商 1選擇的 q1實(shí)際上已經(jīng)決定了 , 并且廠商 2 知道 q1, 因此對(duì)于廠商 2來說 , 相當(dāng)于在給定 q1的情況下求使 u2實(shí)現(xiàn)最大值的 q2。 e?2)( e?? ??e??假定政府要設(shè)定通貨膨脹率 π, 但是政府關(guān)心的不僅是通貨膨脹問題 , 還關(guān)心失業(yè)率和產(chǎn)出問題 。 ?假設(shè)政府的效用函數(shù)如下: c0, k1 π是通貨膨脹率 , y*是自然失業(yè)率下的均衡產(chǎn)量 ,y是實(shí)際產(chǎn)量 。 0),(* ???? ???? eyye??由于政府是在給定私人部門通貨膨脹預(yù)期的情況下選擇貨幣政策 , 因此政府面臨的問題是: 將 代入上式 , 可得到政府短期的最優(yōu)通貨膨脹率為 ?k1可以理解為政府認(rèn)為產(chǎn)出扭曲的程度 。 2. 3. 4 逆推歸納法的問題 ?首先逆推歸納法只能分析明確設(shè)定的博弈問題 ,要求博弈的結(jié)構(gòu) , 包括次序 、 規(guī)則和得益情況等都非常清楚 , 并且各個(gè)博弈方了解博弈結(jié)構(gòu) , 互相知道對(duì)方了解博弈結(jié)構(gòu) 。 ?第三 , 逆推歸納法更大的問題是對(duì)博弈方的理性要求太高 , 不僅要求所有博弈方都有高度的理性 ,不允許博弈方犯任何錯(cuò)誤 , 而且要求所有博弈方相互了解和信任對(duì)方的理性 , 對(duì)理性 ( 個(gè)人理性 、集體理性 、 風(fēng)險(xiǎn)偏好 ) 有相同的理解 , 或進(jìn)一步有 “ 理性的共同知識(shí) ” 。如果放棄,博弈進(jìn)入下一階段。被實(shí)驗(yàn)者似乎在參加多次(與不同的人進(jìn)行博弈)實(shí)驗(yàn)后,更顯現(xiàn)出倒推式理性。因?yàn)樗豢赡荛L期存在下去 , 隨時(shí)會(huì)出現(xiàn)價(jià)格大幅度重挫 , 回到甚至低于基本價(jià)值 。 求解蜈蚣博弈: ? 假設(shè) B能夠向第三方簽訂一張 2美元的債券,約定只要他沒有選擇“放棄”,進(jìn)入下一階段,就會(huì)失去債券,如果選擇了放棄,債券最終還歸還與他。 ?例如商業(yè)活動(dòng)中的回頭客問題,商店和顧客的每次交易都是一個(gè)獨(dú)立博弈關(guān)系,都有愿買愿賣或公平誠信的選擇,都有利益和虧損,把每次獨(dú)立交易維系成回頭客問題的僅僅是可能間接影響雙方未來選擇和利益信譽(yù)、信任。而 G 則稱為 G(T)基本博弈, G(T)中的每次重復(fù)稱為 G(T)的一個(gè)“階段” ? 重復(fù)博弈具有三個(gè)特征: 1. 階段博弈之間沒有“物質(zhì)上”的聯(lián)系( no physical links),即前一階段的博弈不改變后一階段博弈的結(jié)構(gòu)。 囚徒 2 坦白 不坦白 坦白 囚徒 1 不坦白 5 , 5 0 , 8 8 , 0 1 , 1 在兩階段的囚徒困境博弈中,第一階段有四種可能的結(jié)果,(坦白,坦白),(坦白,不坦白),(不坦白,坦白),(不坦白,不坦白),它們代表了參與者在第二階段開始時(shí)面臨的四種不同的情況,每一個(gè)參與者都要針對(duì)這些情況作出各自的反應(yīng)。 ? 考慮時(shí)間價(jià)值:引入貼現(xiàn)系數(shù) δ將每一階段的得益折現(xiàn)成當(dāng)前階段的得益。 ?重復(fù)博弈可能使參與人不得不考慮這一階段的行為對(duì)后面階段博弈的影響,即注重聲譽(yù) ?原來在單階段博弈中不會(huì)出現(xiàn)的“合作”均衡(如囚徒困境中的 (抵賴,抵賴 )),在重復(fù)博弈中就可能作為均衡出現(xiàn),而這正是研究重復(fù)博弈的意義所在。 ?事實(shí)上,所有以零和博弈為原博弈的有限次重復(fù)博弈與猜硬幣博弈一樣,博弈方的正確策略都是重復(fù)一次性博弈中的納什均衡策略。因此,可以推斷出,不論前一階段結(jié)果如何,第二階段的唯一結(jié)果就是原博弈唯一的納什均衡(坦白,坦白),雙方得益( 5, 5)。 一般結(jié)論: ?原博弈具有唯一純策略納什均衡的博弈,有限次重復(fù)博弈的均衡即各博弈方在每個(gè)階段(每次重復(fù))中都采用原博弈的納什均衡策略。 上述結(jié)論不僅與人們的直覺經(jīng)驗(yàn)有矛盾,而且在理論上也會(huì)引起某些悖論。兩次重復(fù)這個(gè)博弈情況會(huì)如何呢? 考慮如下策略: 博弈方 1:第一次選 H,如果第一次結(jié)果為( H,H),則第二次選 M,如果第一次結(jié)果為任何其他策略組合,則第二次選 L。 廠商 2 H M L H 廠商 1 M L 5,5 0,6 0,2 6,0 3,3 0,2 2,0 2,0 1,1 博弈方 1:第一次選 H,如果第一次結(jié)果為( H,H),則第二次選 M,如果第一次結(jié)果為任何其他策略組合,則第二次選 L。觸發(fā)策略在報(bào)復(fù)偏離均衡的博弈方時(shí),報(bào)復(fù)者自己也受到了損失。 ?假如未偏離一方并不想報(bào)復(fù)偏離一方,而偏離一方卻因?yàn)楹ε卤粓?bào)復(fù)而采用 L,結(jié)果是心慈手軟的未偏離一方再次受到打擊。 無限次重復(fù)博弈 ?從對(duì)有限次重復(fù)博弈分析可知,存在最后一次重復(fù)是使其無法實(shí)現(xiàn)高效率均衡的關(guān)鍵問題。因此不論是有限次重復(fù)博弈還是無限次重復(fù)博弈,都不會(huì)與一次性博弈有什么區(qū)別
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1