freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈論與決策行為講義(文件)

2025-02-21 17:16 上一頁面

下一頁面
 

【正文】 中,先站在女方的立場上選擇最優(yōu)戰(zhàn)略,如果男方選擇看歌劇,女方選擇看歌劇的得益是 2,選擇足球的得益是 0,因此,女方的最優(yōu)選擇是看歌?。蝗绻蟹竭x擇看足球,女方選擇看歌劇的收益是 0,選擇看足球的收益是 1,因此女方的最優(yōu)選擇是看足球。 ? 事實(shí)上,這個博弈還有一個混合戰(zhàn)略納什均衡,就是女方以 2/3的概率選擇歌劇, 1/3的概率選擇足球;男方以 2/3的概率選擇足球, 1/3的概率選擇歌劇。其實(shí),也可以看做混合戰(zhàn)略,即選擇相應(yīng)純戰(zhàn)略的概率為 1,選擇其余占率的概率為 0. ? 混合戰(zhàn)略納什均衡:如果一個戰(zhàn)略組合滿足各參與人的戰(zhàn)略,相互是其他參與人戰(zhàn)略的最佳對策時,就是一個納什均衡。支付矩陣如下表所示。 ? 在有些情況下,公共物品的供給也可能變成一個斗雞博弈。 ? 總之,納什均衡是參與人將如何博弈的“一致性”預(yù)測:如果所有參與人預(yù)測到一個特定的納什均衡將會出現(xiàn),那么沒有人有興趣作不同的選擇。) 5. 納什均衡的存在性 ? 納什均衡的存在性定理(納什, 1950):每一有限博弈至少存在一個納什均衡(純戰(zhàn)略的或混合戰(zhàn)略的)。納什均衡是 局中人的一致性預(yù)測,但當(dāng)納什均衡多于一個時,多重納什均衡就出現(xiàn)了。兩參與人的戰(zhàn)略空間是他們可選擇的產(chǎn)量(因?yàn)楫a(chǎn)量是連續(xù)可分的,因此兩參與有無限多種可選策略),得益是兩廠商各自的利潤(即各自的銷售收入減去各自的成本),兩參與人的得益取決于他們的產(chǎn)量水平。這一對產(chǎn)量組合就是古諾雙寡頭模型的納什均衡。因此從兩廠商的總體看,根據(jù)總體利潤最大化確定產(chǎn)量效率更高。 ? 因此,關(guān)于產(chǎn)量博弈的古諾模型也是一種囚徒困境。 在這個假設(shè)下 , 如果企業(yè)的競爭戰(zhàn)略是價格而不是產(chǎn)量 , 伯川德 ( Bertrand) 證明 , 即使只有兩個企業(yè) , 在均衡情況下 , 價格等于平均成本 , 企業(yè)的利潤為零 , 與完全競爭市場均衡一樣 。因此,直至價格被壓低至成本水平(假如雙方相同),雙方都將價格定為在略低于對手的水準(zhǔn)。在存在產(chǎn)品差異的情況下 , 均衡價格不會等于成本 。 ? 如果將位置差異解釋為產(chǎn)品差異 , 則差異越大 ,均衡價格及利潤就越高 。 完全信息動態(tài)博弈 ? 動態(tài)博弈的根本特征是:參與博弈的各方行動不是同時 , 而是有先后順序 。 ? 擴(kuò)展形表述要給出每個參與人戰(zhàn)略的動態(tài)描述,即參與人在什么時點(diǎn)、什么情況下選擇什么樣的行動。 房地產(chǎn)開發(fā)博弈樹(圖) A 開發(fā) 不開發(fā) 大 小 大 小 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā) N B N B (4, 4) (8, 0) (3, 3) (1, 0) (0, 8) (0, 0) (0, 1) (0, 0) 圖 1 房地產(chǎn)開發(fā)博弈 博弈樹的構(gòu)造 ? 博弈樹給出了有限博弈的幾乎所有信息。在這個例子中,決策結(jié)包括有 A、 N、 B的七個圓圈。 ? 并不是所有的動態(tài)博弈都可以用擴(kuò)展形表示,因?yàn)橛行﹦討B(tài)博弈的階段很多,或者博弈方在一個階段有許多可以選擇的行為,這時用擴(kuò)展形表示動態(tài)博弈就很困難,或者根本不可能 。 2 子博弈精煉納什均衡 ? 納什均衡的缺陷: ( 1)一個博弈可能有多個納什均衡,究竟哪一個均衡實(shí)際會發(fā)生?博弈論沒有一般結(jié)論。 ? 納什均衡的這些缺陷促使博弈論專家,從 20世紀(jì) 60年代開始就不斷尋求改進(jìn)和精煉納什均衡概念,以得到更為合理的博弈解。 2. 子博弈 ? 定義: 在動態(tài)博弈中,從每一個行動選擇(即一個決策結(jié))開始至博弈結(jié)束,構(gòu)成一個博弈,稱為“子博弈”。 ? 子博弈 精煉 納什均衡能夠排除均衡策略中不可置 信的威脅和承諾,因此是真正穩(wěn)定的。 ? 如此不斷到初始結(jié) , 每一步得到對應(yīng)子博弈的一個納什均衡 , 并且根據(jù)定義 , 這個納什均衡一定是該子博弈的所有子博弈的納什均衡 。 ? 應(yīng)該強(qiáng)調(diào)的是,一個精煉均衡首先必須是一個納什均衡,但納什均衡不一定是精煉均衡。 ? 承諾行動是當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動。 不完全信息靜態(tài)博弈:貝葉斯納什均衡 ? 完全信息博弈的基本假設(shè)是所有的參與人 對其他參與人的情況(特征、戰(zhàn)略空間、 支付函數(shù) )有完全的了解 。 ? 不滿足完全信息假設(shè)的博弈稱為不完全信息博弈。這樣,不完全信息博弈就轉(zhuǎn)換成完全但不完美信息 博弈 。 ? 貝葉斯納什均衡就是:給定自己的類型和別人類型的概率分布的情況下,每個參與人的期望效用達(dá)到了最大化。由于行動有先后次序,后行動者可以觀察到先行動者的行動。 ? 精煉貝葉斯均衡的要點(diǎn)是:當(dāng)事人要根據(jù)所觀察到的他人的行為來修正自己關(guān)于后者類型的 “信念 ”(主觀概率),并由此選擇自己的行動。 它滿足如下條件: 給定每個人有關(guān)其他人類型的信念的情況下,他的戰(zhàn)略選擇是最優(yōu)的; 每個人有關(guān)他人類型的信念都是使用貝葉斯法則從所觀察到的行為中獲得的 。然后,我們會根據(jù)新的信息來修正這個判斷。 ? 在不完全信息動態(tài)博弈中,參與人所采取的行動具有傳遞信息的作用。 演講完畢,謝謝觀看! 。 ? 精煉貝葉斯均衡的一個重要的應(yīng)用是:“信息傳遞模型”。貝葉斯法則就是人們根據(jù)新的信息從先驗(yàn)概率得到后驗(yàn)概率的基本方法。 3 貝葉斯法則 ? 貝葉斯法則:就是人們根據(jù)觀察到的現(xiàn)象對有關(guān)概率分布的主觀判斷進(jìn)行修正的一種標(biāo)準(zhǔn)方法。 2 精煉貝葉斯均衡 ? 精煉貝葉斯均衡,是對應(yīng)于不完全信息動態(tài)博弈的均衡概念,是澤爾騰完全信息動態(tài)博弈子博弈精煉納什均衡和海薩尼不完全信息靜態(tài)博弈貝葉斯均衡的結(jié)合。 ? 先行動者可以理性的預(yù)期到自己的行動將被后行動者所利用,就會設(shè)法傳遞對自己最有利的信息,而避免傳遞對自己不利的信息。 不完全信息動態(tài)博弈: 精煉貝葉斯納什均衡 ? 1 不完全信息動態(tài)博弈 ? 在不完全信息動態(tài)博弈中, “ 自然 ” 首先選擇參與人的類型,參與人自己知道,其他參與人不知道。 ? 有了 海薩尼 轉(zhuǎn)換,不完全信息和不完美信息之間的區(qū)別就不重要了。因?yàn)楫?dāng)一個參與人不知道他在與誰博弈時,無法選擇自己的戰(zhàn)略。 ? 完全信息博弈假設(shè)是存在的,但是現(xiàn)實(shí)中的許多博弈并不滿足完全信息的需求。 ? 所以,承諾行為就意味著當(dāng)事人要為自己的諾言付出成本,盡管這種成本不一定真的發(fā)生。 ? 所謂 “精煉納什均衡 ”就是將納什均衡中包含的不可置信的威脅戰(zhàn)略剔除出去 ? 要求參與人的決策在任何時點(diǎn)上都是最優(yōu)的 ? 由于剔除了不可置信的威脅戰(zhàn)略,在許多情況下,精煉納什均衡也縮小了納什均衡的個數(shù),這一點(diǎn)對預(yù)測是非常有意義的。 ? 用逆推歸納法求解子博弈精煉納什均衡的過程,實(shí)質(zhì)是重復(fù)剔除劣戰(zhàn)略過程在擴(kuò)展式博弈上的擴(kuò)展:從最后一個決策結(jié)開始依次剔除掉每一個子博弈的劣戰(zhàn)略,最后剩下來的戰(zhàn)略構(gòu)成精煉納什均衡。 —— 逆推歸納法 ? 逆推歸納 法:從博弈的最后一個階段開始分析 , 每一次確定出所分析階段博弈方的選擇和路徑 , 該階段參與人的最優(yōu)選擇 , 這個最優(yōu)選擇就是該階段的子博弈的納什均衡 。 ? 在博弈論中,任何博弈本身為自身的 一個子博弈。這是對納什均衡概念的第一個最重要的改進(jìn),其目的是把動態(tài)博弈中的“合理納什均衡”與“不合理納什均衡”分開,將那些包含不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給動態(tài)博弈結(jié)果一個合理預(yù)測。納什均衡很難說是動態(tài)博弈的一個合理解。 ? 無法用擴(kuò)展形表示的動態(tài)博弈,通常可以直接用文字描述和數(shù)學(xué)函數(shù)式表示。 ( 2)枝:在博弈樹上,枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個枝代表參與人的一個行動選擇。 ( 1)結(jié):博弈中某一參與人(包括自然)采取行動的時點(diǎn),或博弈結(jié)束的時點(diǎn)。 它在博弈中的作用只是在相應(yīng)的地方在若干外生事件中根據(jù)一定的概率分布隨即選取,而沒有自己的利益目標(biāo)和收益函數(shù)。 1 動態(tài)博弈的擴(kuò)展式表述 ? 擴(kuò)展式表述,可用“博弈樹”來表示。 ? 當(dāng) 交通 成本為零時 , 不同商店的產(chǎn)品之間具有完全的替代性 , 沒有任何一個商店可以把價格定得高于成本 , 我們就得到伯川德均衡結(jié)果 :價格等于邊際成本 , 利潤為零 。 在模型中 , 產(chǎn)品在物質(zhì)性能上是相同的 , 但
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1