freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈論與決策行為ppt課件-wenkub.com

2025-05-09 07:00 本頁面
   

【正文】 ?以第二種博弈為原博弈的無限次重復(fù)博弈的結(jié)果將有較大的不同,是無限次重復(fù)博弈重點(diǎn)關(guān)注的。 ?兩人零和博弈的無限次重復(fù)博弈 : ?重復(fù)次數(shù)的無限增加也不能改變原博弈中博弈方之間在利益上的對(duì)立關(guān)系,不會(huì)創(chuàng)造出潛在的合作利益,博弈方仍然是每次重復(fù)都采用原博弈的混合策略納什均衡。 5, 5 0, 6 0, 2 0, 0 0, 0 6, 0 3, 3 0, 2 0, 0 0, 0 2, 0 2, 0 1, 1 0, 0 0, 0 0, 0 0, 0 0, 0 4, 0, 0 0, 0 0, 0 0, 0 0, 0 , 4 重復(fù)博弈觸發(fā)策略可信性較強(qiáng)的博弈 博弈方 2 H M L P Q 博弈方 1 H M L P Q 在兩次重復(fù)中,兩博弈方分別采用這樣的觸發(fā)策略: 博弈方 1:在第一階段采用 H,如果第一階段的結(jié)果是 (H,H),那么第二階段采用 M,否則采用 P 博弈方 2:在第一階段采用 H,如果第一階段的結(jié)果是 (H,H),那么第二階段采用 M,否則采用 Q。這就引起了上述觸發(fā)策略是否真正可信的問題。 我們把( 3, 3)加到( H,H)上,把( 1, 1)加到其他 8種策略上,就將該兩次博弈轉(zhuǎn)化為一個(gè)等價(jià)的一次博弈,( H,H)是納什均衡 如果該博弈進(jìn)行 n次,仍然可以用觸發(fā)策略取得較好的結(jié)果,納什均衡路徑為:除了最后一次采用原博弈的納什均衡( M,M),每次都采用( H,H),當(dāng)重復(fù)的次數(shù)較多時(shí),平均得益趨近于( 5,5)。 首先試探合作,一旦發(fā)現(xiàn)對(duì)方不合作則也用不合作相報(bào)復(fù)的策略,稱為 “觸發(fā)策略” (Trigger Strategy)(冷酷策略) 。 容易推斷,如果連鎖企業(yè)對(duì)開頭幾個(gè)市場的競爭者不惜代價(jià)地進(jìn)行打擊,其示范效應(yīng)通??梢試樛似溆嗍袌龅臐撛诟偁幷撸淅婵傮w上是合算的。如果假設(shè)兩寡頭都意識(shí)到相互競爭的市場格局大約可以持續(xù) 3年,也就是面臨著一個(gè) 3次重復(fù)博弈,他們是否還會(huì)采用低價(jià),不斷打價(jià)格戰(zhàn)呢? 用逆推歸納法分析這個(gè)問題,答案是肯定的。該重復(fù)博弈與下圖得益矩陣表示的一次性博弈是完全等價(jià)的:該等價(jià)博弈仍然有唯一的純策略納什均衡(坦白,坦白)。兩囚徒最后得益是兩階段得益之和。 ?在以猜硬幣博弈為原博弈的有限次重復(fù)博弈中,每個(gè)博弈方唯一正確的策略就是在每次重復(fù)時(shí)都采用一次性博弈的納什均衡策略,即各以 面和反面的混合策略。 ?? ?tt tt1 1???參與人是從總收益最大化的角度進(jìn)行決策的。 ? 重復(fù)博弈的收益: ? 重復(fù)博弈中博弈方的行為、策略選擇不可能只考慮本階段的得益,而會(huì)考慮整個(gè)重復(fù)博弈過程得益的總體情況。 3. 參與人的總收益是所有階段博弈收益的貼現(xiàn)值或加權(quán)平均值。 重復(fù)博弈的定義和特征 ? 重復(fù)博弈是指由同樣結(jié)構(gòu)的基本博弈重復(fù)多次進(jìn)行構(gòu)成的博弈過程,其中的每次博弈稱為階段博弈。 A B 放棄 放棄 接受 接受 4, 1 5, 5 2, 6 A B 放棄 放棄 接受 接受 4, 1 5, 5 2, 4 ? 當(dāng)引入債券后,對(duì)該博弈的完整表述如下: 簽債券 不簽債券 A B 放棄 放棄 接受 接受 4, 1 2, 6 A B 放棄 放棄 接受 接受 4, 1 2, 4 B 5, 5 5, 5 B簽債券的收益為 5,不簽的收益為 1, B會(huì)選擇簽。 為什么理性行為者組成的市場會(huì)出現(xiàn)“ 泡沫 ” 資產(chǎn)市場現(xiàn)象 ? 當(dāng)成交價(jià)非常高時(shí) ,這種高價(jià)格絕不可能源于對(duì)基本價(jià)值的樂觀態(tài)度 。每一個(gè)行為者可能是理性的,但卻可能不確定其他人是否理性,也許只有通過經(jīng)驗(yàn)才能認(rèn)識(shí)其他人的理性。 紅方 藍(lán)方 紅方 藍(lán)方 紅方 放棄 放棄 放棄 放棄 接 接 接 接 受 受 受 受紅方受益: 40 20 160 80 640藍(lán)方受益: 10 80 40 320 160?這一博弈的納什均衡 是第一個(gè)選擇者選擇接受,取走較多的收入,馬上結(jié)束博弈。在有限階段里,兩個(gè)人交替在兩份大小不一的資產(chǎn)中做選擇。 ?其次是逆推歸納法也不能分析比較復(fù)雜的動(dòng)態(tài)博弈 。 因此 , 政府將一面忍受著通貨膨脹之苦 , 一面又無法享受產(chǎn)出增加之益 。 ?政府的上述效用函數(shù)表明 , 雖然政府并不喜歡通貨膨脹 , 但如果通貨膨脹能使產(chǎn)出水平提高到政府所希望的水平 ky*, 政府會(huì)容忍某個(gè)程度的通貨膨脹 。 名義工資一旦確定 , 真實(shí)的通貨膨脹率如果高于預(yù)測的通貨膨脹率 , 將會(huì)使工人的實(shí)際收入下降 , 導(dǎo)致企業(yè)擴(kuò)大雇用人數(shù) , 擴(kuò)張生產(chǎn) 。 ?凱 德 蘭 德 和 普 瑞 斯 考 特 ( Kydland and Prescott,1977) 提出一個(gè)貨幣政策模型 ?博弈的參與人是政府和私人部門 , 私人部門選擇預(yù)期的通貨膨脹率 , 政府在給定預(yù)期通貨膨脹率的情況下選擇實(shí)際的通貨膨脹率 。 ?所謂“精煉納什均衡”就是將納什均衡中包含的不可置信的威脅戰(zhàn)略剔除出去 ?要求參與人的決策在任何時(shí)點(diǎn)上都是最優(yōu)的 ?決策者要隨機(jī)應(yīng)變,而不是固守舊略 ?由于剔除了不可置信的威脅戰(zhàn)略,在許多情況下,精煉納什均衡也縮小了納什均衡的個(gè)數(shù),這一點(diǎn)對(duì)預(yù)測是非常有意義的。 2. 3. 2 逆推歸納法( Backwards Induction) ?邏輯基礎(chǔ):動(dòng)態(tài)博弈中先行動(dòng)的理性的博弈方 ,在前面階段選擇行為是必然會(huì)考慮 后行為博弈方在后面階段中將會(huì)怎樣選擇行動(dòng) , 只有在博弈的最后一個(gè)階段選擇的不再有后續(xù)階段牽制的博弈方 , 才能做出明確的選擇 。 子博弈 ? 定義:由一個(gè)動(dòng)態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構(gòu)成的,有初始信息集和進(jìn)行博弈所需要的全部信息,能夠自成一個(gè)博弈的原博弈的一部分,稱為原動(dòng)態(tài)博弈的一個(gè)“子博弈”。 ?承諾行動(dòng)是當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動(dòng)。 動(dòng)態(tài)博弈的策略和結(jié)果 ?動(dòng)態(tài)博弈的結(jié)果首先是指各博弈方的策略組合; ?其次,動(dòng)態(tài)博弈的結(jié)果是各博弈方的策略組合形成的一條連接各個(gè)階段的“路徑”( PATH); ?最后,實(shí)施上述策略組合的最終結(jié)果,即路徑終端處得益數(shù)組中的數(shù)字。 ( 1)參與人集合; ( 2)行動(dòng)順序( order of move),即誰在何時(shí)采取行動(dòng); ( 3)行動(dòng)空間( action set),每次輪到某一參與人行動(dòng)時(shí),可供選擇的行動(dòng); ( 4)信息集( information set),參與人進(jìn)行選擇時(shí)所知道的信息; ( 5)收益函數(shù),每個(gè)參與人可能選擇的每一種行動(dòng)所構(gòu)成的行動(dòng)組合相對(duì)應(yīng)的各個(gè)參與人的收益; ( 6)外生事件的概率分布,即虛擬參與人(自然)的可能選擇,它在博弈中的作用只是在相應(yīng)的地方在若干外生事件中根據(jù)一定的概率分布隨即選取,而沒有自己的利益目標(biāo)和收益函數(shù)。 ?在多重納什均衡的博弈中,聚點(diǎn)均衡首先是納什均衡,是多重納什均衡中比較容易被選擇的納什均衡。 ?數(shù)量悖論 ?人數(shù)雖多 , 卻人多勢不眾 , 形不成強(qiáng)有力的反映意見的共同聲音 。 ? 博弈方對(duì)風(fēng)險(xiǎn)上策均衡的選擇傾向,有一種自我強(qiáng)化的機(jī)制。 帕雷托上策均衡 國家 1 戰(zhàn)爭 和平 戰(zhàn)爭 國家 2 和平 - 5 ,- 5 8 ,- 10 - 10 , 8 1 0 , 10 ?思考:本例與 “ 囚徒困境 ” 有何區(qū)別 ? ?為什么還有那么多戰(zhàn)爭 ? 試寫出博弈矩陣并作分析 。 ?如果這個(gè)博弈沒有純策略納什均衡,至少有一個(gè)混合策略納什均衡。 2. 2. 4 納什均衡的存在性和多重納什均衡博弈的分析 ?納什定理:在一個(gè)由 n各博弈方的博弈 G={ S1,…,S n。S=0 Pg這時(shí)任何博弈方單獨(dú)改變自己的策略,都不能給自己增加任何利益 ?尋找混合策略納什均衡概率分布的思路 , 即令各個(gè)博弈方隨機(jī)選擇純策略的概率分布 , 滿足使對(duì)方或其他博弈方采用不同策略的期望得益相同 ,從而計(jì)算出各個(gè)博弈方隨機(jī)選擇各純策略概率的方法 。u1,… ,un} 中 , 博弈方 i的策略空間為 Si={ si1,… sik} , 則博弈方 I以概率分布 pi=(pi1,… ,pik)在其 k個(gè)可選策略中選擇的“ 策略 ” 稱為一個(gè)混合策略 , 其中 0 對(duì) j=1,… ,k都成立 , 且 pi1+… +pik=1。 因此本例中的任何一個(gè)博弈方最可靠的方法就是以相同的概率隨機(jī)出正面和反面 , 即取 p=, 這樣 , 另一方就無法從你對(duì)策略的偏好中占到任何便宜 。 這正是沒有納什均衡的博弈與存在唯一納什均衡的博弈之間的一個(gè)重要本質(zhì)區(qū)別 。 jiji sr ?? m a xivii vr ? ii rv ?iviii srv ?? 0?? ii rvivii vs ?ii sr ??對(duì)于 有類似的推理: ?當(dāng) 或 時(shí) , 投標(biāo)者的效用與他以 出價(jià)時(shí)相同 ?而當(dāng) 投標(biāo)者由于出價(jià)過低而損失了正效用 。 如果多個(gè)投標(biāo)者投出最高價(jià)格 , 則標(biāo)的在它們之間隨機(jī)分配 。 解此聯(lián)立方程組 , 得: q1*=q2*=q3*=24 u1 *=u2 *=u3 *=576 為了對(duì)公共資源的利用效率做出評(píng)價(jià) , 我們來討論一下總體利益最大的最佳羊只數(shù)量 。 ? 博弈方就是 n個(gè)農(nóng)戶 , 他們各自的策略空間就是他們可能選擇的養(yǎng)羊數(shù)目 qi(i=1,… ,n)的取值范圍; ? 當(dāng)各戶養(yǎng)羊數(shù)為 q1,… qn時(shí) , 在公共草地上放牧羊只的總數(shù)是 Q=q1+… +qn ? 每 只 羊 的 產(chǎn) 出 應(yīng) 是 羊 只 總 數(shù) 的 減 函 數(shù)V=V(Q)=V(q1+… +qn)。由于這片草地的面積有限,因此只能讓不超過某一數(shù)量的羊吃飽,如果在這片草地上放牧羊群的實(shí)際數(shù)量超過這個(gè)限度,則每只羊都無法吃飽,從而每只羊的產(chǎn)出(毛、皮、肉的總價(jià)值)就會(huì)減少,甚至只能勉強(qiáng)存活或餓死。 如果旅行成本是旅行距離的二次式 , 即旅行成本為 td2, d為消費(fèi)者到商店的距離 ?需求函數(shù)分別為: )1(221),(12211batppbaaxppD????????? )1(2211),(21212batppbabxppD?????????? ?納什均衡為: ?當(dāng) a=b=0時(shí) , 商店 1位于 0, 商店 2位于 1: ?當(dāng) a=1b時(shí) , 兩個(gè)商店位于同一位置: )31)(1(),(*1babatcbap?????? )31)(1(),(*2abbatcbap?????? tcpp ??? )1,0()1,0(*2*1 caapaap ???? )1,()1,(*2*1 二、公共資源問題 ?在經(jīng)濟(jì)學(xué)中 , 所謂公共資源是指具有: ( 1) 沒有哪個(gè)人 、 企業(yè)或組織擁有所有權(quán); ( 2) 大家都可以自由利用 。 則需求函數(shù)分別為: ? D
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號(hào)-1