freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

數(shù)據(jù)模型與決策--博弈論-文庫(kù)吧在線文庫(kù)

  

【正文】 同的質(zhì)量向日光浴者提供同一品牌的礦泉水(或啤酒)。設(shè)想如果將高雅藝術(shù)節(jié)目與較低檔趣味的節(jié)目比作海灘的兩端,那么觀賞電視節(jié)目的觀眾就相當(dāng)于散步在海灘上的日光浴者。你想這樣,他想那樣,這也是人之常情。按一下按鈕會(huì)有 10個(gè)單位的豬食進(jìn)槽,但誰(shuí)按按鈕誰(shuí)就需付出相當(dāng)于 2個(gè)單位豬食的成本。 tSp SD? ? 設(shè)守衛(wèi)選擇睡的概率為 pg,則選擇不睡的概率為 1pg,那么小偷選擇偷的期望支付為 小偷選擇不偷的期望支付為 要達(dá)到一種均衡狀態(tài),守衛(wèi)選擇睡與不睡不能讓小偷在選擇偷與不偷之間有明顯的傾向性。這時(shí)就簡(jiǎn)化為下表表示的博弈。博弈方Ⅱ 也作同樣考慮,給數(shù)字 數(shù)字 4下面都劃了短線。 同樣,博弈方 2針對(duì)博弈方 1的任一策略 q1的策略選擇是求解最大化問(wèn)題 Max u2=max(6q2q1q2q22) q2 博弈方 2對(duì)博弈方 1任一策略 q1的最佳反應(yīng),即反應(yīng)函數(shù)為 q2=R2(q1)=1/2(6q1) 顯然可用坐標(biāo)平面的兩條直線表示這兩條反應(yīng)函數(shù),如圖所示。 Nash定理 :在 n人策略式博弈 G={S1,?,S n。 乙 Ⅱ 1 Ⅱ 2 Ⅰ 1 甲 Ⅰ 2 設(shè) x,y分別表示甲選策略 Ⅰ 1 、乙選策略 Ⅱ 1的概率,則 1 x, 1y就為甲選策略 Ⅰ 乙選策略 Ⅱ 2的概率, (x,1x)為甲的混合策略 ,(y,1y)為乙的混合策略。 前兩個(gè)為純策略 Nash均衡解,第三個(gè)為混合策略的 Nash均衡解。 一個(gè)非合作博弈包括四個(gè)構(gòu)成要素:參與人、博弈規(guī)則、博弈結(jié)局和博弈效用。比如,混亂的企業(yè)在行業(yè)協(xié)會(huì)或某個(gè)大企業(yè)的引導(dǎo)下,統(tǒng)一某些技術(shù)標(biāo)準(zhǔn),大家共同使用這些標(biāo)準(zhǔn)。 夏普利值便是這樣的期望貢獻(xiàn)的反映。 由表可知, A的邊際貢獻(xiàn)之和為 650; B的邊際貢獻(xiàn)之和為 500, C的邊際貢獻(xiàn)之和為 350。企業(yè)有足夠的資本與技術(shù)不一定必然成功,成功還取決于管理。60年代初,雷 通往城市的道路只有甲乙兩條。大學(xué) A有辦某種培訓(xùn)計(jì)劃的資格, B、 C則沒(méi)有。假設(shè)該博弈問(wèn)題雙方的贏得情況如表所示。 麥當(dāng)勞的特許加盟和連鎖經(jīng)營(yíng)制度具有以下特點(diǎn):第一,統(tǒng)一加盟條件并嚴(yán)格挑選加盟商;第二,統(tǒng)一企業(yè)名稱、標(biāo)識(shí)與廣告宣傳;第三,統(tǒng)一產(chǎn)品質(zhì)量、服務(wù)規(guī)范、作業(yè)程序與員工培訓(xùn)等。然而,因?yàn)闄?quán)利和義務(wù)沒(méi)有規(guī)定明確,那些付了一定的加盟費(fèi)的加盟店,其經(jīng)營(yíng)沒(méi)有遵循麥當(dāng)勞的經(jīng)營(yíng)管理制度,結(jié)果使麥當(dāng)勞的形象和聲譽(yù)受到損害,麥當(dāng)勞兄弟的嘗試失敗了。認(rèn)可這樣的標(biāo)準(zhǔn)的條件下,按照該值進(jìn)行分配,便是公平的;若不按照這樣的值來(lái)進(jìn)行分配,便是不公平的。在這兩種可能的情況下, A和 B的平均貢獻(xiàn)或者期望貢獻(xiàn)為 : (0+c)/2=c/2。 五、合作博弈 夏普利值 利用公理化方法得到合作博弈的唯一解,這一概念,首先由夏普利 ()在 1953年提出,它為如何決定一個(gè) n人討價(jià)還價(jià)博弈中每個(gè)參與人的所得的分配比例提供了一種很好的方法。 企業(yè)建立聯(lián)盟是有條件的,這個(gè)條件便是:訂立協(xié)議、建立聯(lián)盟的聯(lián)盟值大于單獨(dú)行動(dòng)。 合作首先是一個(gè)態(tài)度問(wèn)題,然而,光有態(tài)度是不夠的,合作能否實(shí)施,重要的是方法。 將博弈方甲反應(yīng)函數(shù)表示在坐標(biāo)圖上。人們通過(guò) Pareto均衡、風(fēng)險(xiǎn)均衡、聚點(diǎn)均衡等來(lái)選擇 Nash均衡解。 定義 :對(duì)策略式博弈 G={S1,?,S n。這時(shí)常常用反應(yīng)函數(shù)法來(lái)求 Nash均衡解。u1,?u n}中,重復(fù)剔除嚴(yán)格劣勢(shì)策略最后若只剩下唯一的策略對(duì),則此策略對(duì)一定是純 Nash均衡解;而且重復(fù)剔除嚴(yán)格劣勢(shì)策略不會(huì)消去 Nash均衡解。 求解過(guò)程要用到逆向歸納法,即從動(dòng)態(tài)博弈的最后一個(gè)階段博弈方的行為開(kāi)始分析,逐步倒推回前一個(gè)階段相應(yīng)博弈方的行為選擇,一直到第一個(gè)階段的分析方法。如果小偷不偷,則他既無(wú)得也無(wú)失;守衛(wèi)不睡則出一份力掙一份工資同樣也是既無(wú)得也無(wú)失。如果一進(jìn)一退,則有一方可以過(guò)橋,另一方收益為 0。 博弈的分類(lèi) 女方 足球 芭蕾 足球 男方 芭蕾 情侶博弈與經(jīng)濟(jì)決策的關(guān)系 兩個(gè)相鄰的企業(yè)都要解決各自的供水問(wèn)題。 ② 同城航空公司航班起飛時(shí)刻確定問(wèn)題 。所以誰(shuí)都不想偏離中點(diǎn)的位置。 190。 三、博弈論的經(jīng)典模型 博弈的分類(lèi) 乙 坦白 抵賴 坦白 甲 抵賴 有兩個(gè)人因?yàn)樯嫦臃缸锒徊?,被警方分別關(guān)在兩個(gè)房間內(nèi)審訊。如果有,就是合作博弈;反之,則是非合作博弈。各參與人在各自的策略集中選擇一個(gè)特定的策略所構(gòu)成的策略組合稱為一個(gè)局勢(shì)。博弈分析的目的是使用博弈規(guī)則預(yù)測(cè)均衡。當(dāng)策略情形大量重復(fù)出現(xiàn)時(shí),即便個(gè)體間有直接的利益沖突,達(dá)成合作的機(jī)率也會(huì)上升,因?yàn)槊總€(gè)個(gè)體在未來(lái)時(shí)間內(nèi),都會(huì)與另一方反復(fù)打交道。阿克爾洛夫就此得出結(jié)論:市場(chǎng)放開(kāi)并不能解決所有問(wèn)題,信息是有價(jià)值的。 2023年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng) 2023年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予了三位美國(guó)經(jīng)濟(jì)學(xué)家,他們是伯克利加州大學(xué)經(jīng)濟(jì)系的喬治 維克瑞( William Vickrey)教授,表彰他們對(duì)信息經(jīng)濟(jì)學(xué)的貢獻(xiàn)。 核指兩個(gè)或多個(gè)聯(lián)盟互動(dòng)的結(jié)果:當(dāng)其他聯(lián)盟的策略不變時(shí),沒(méi)有任何聯(lián)盟可以通過(guò)單方面改變其策略而取得對(duì)該聯(lián)盟所有成員更好的結(jié)果。 一、博弈論的產(chǎn)生和發(fā)展 20世紀(jì) 50年代 ,合作博弈發(fā)展到全盛期,非合作博弈論也開(kāi)始創(chuàng)立; 20世紀(jì) 60年代后,非合作博弈得到進(jìn)一步發(fā)展; 幾十年來(lái),眾多的博弈論學(xué)者花費(fèi)了無(wú)窮的精力,研究博弈論里博弈的結(jié)構(gòu),發(fā)展納什均衡點(diǎn)的定義,并探討其實(shí)際應(yīng)用的可能性。這兩位經(jīng)濟(jì)學(xué)家分別在 20世紀(jì) 60年代和 70年代揭示了不對(duì)稱信息對(duì)交易所帶來(lái)的影響,并提出了相應(yīng)的對(duì)策。 阿克爾洛夫( Gee Akerlof)教授、斯坦福大學(xué)商學(xué)院的邁克爾 斯彭斯則在 1973年通過(guò)剖析人才市場(chǎng)盛行的造假行為,指出人才市場(chǎng)同樣存在用人單位與應(yīng)聘者之間信息不對(duì)稱的問(wèn)題,并由此造成了人才市場(chǎng)上“劣幣”驅(qū)逐“良幣”的現(xiàn)象。 謝林于 20世紀(jì) 60年代出版 《 沖突的策略 》 ,著力闡述了在雙方處于僵持時(shí),采取一些策略性手段的重要性。 ? 參與人 —— 是指在一個(gè)博弈中能夠選擇自己的行動(dòng)方案從而使自身的利益最大化的決策主體,即有決策權(quán)的參加者。 ? 支付 —— 是指在博弈論中,對(duì)應(yīng)一個(gè)確定的自然狀況,參與人各選擇一個(gè)特定的策略所形成的局勢(shì)下參與人得到的效用。 ? 合作博弈強(qiáng)調(diào)的是團(tuán)體理性,強(qiáng)調(diào)的是效率、公正、公平;非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果可能是有效率的,也可能是無(wú)效率的。他們面臨的情況是:如果兩個(gè)人都坦白罪行,那么將各被判處六年有期徒刑;如果一方坦白另一方抵賴,那么坦白者從寬,判處一年徒刑,抗拒者從嚴(yán),判處八年徒刑;如果兩個(gè)人均抵賴,則各被判處兩年徒刑。 1 雜貨鋪定位 :設(shè)想有一個(gè)小居民點(diǎn),居民住宅沿著一條公路均勻地排開(kāi)。 博弈的分類(lèi) 海灘占位 :據(jù)說(shuō)西方發(fā)達(dá)國(guó)家的不少男男女女有日光浴的愛(ài)好,因?yàn)樗欣谏眢w健康。同一城市的兩家航空公司開(kāi)辟飛往同一目的地的航班,常出現(xiàn)他們各自的起飛時(shí)刻被安排在幾乎同一時(shí)間的現(xiàn)象。如果他們各干各的,成本就會(huì)比較高,效益就沒(méi)有那么好。各自的收益如上圖所示。 V, D P, 0 0, S 0, 0 ① 圖解方法 求解 守衛(wèi)期 小偷期 望得益 望得益 (睡) S (偷) V Pt* 小偷偷 Pg* 守衛(wèi)睡 0 Pt′ 1 的概率 0 Pg′ 1 的概率
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)課件相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1