freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

博弈論的幾個(gè)經(jīng)典模型-在線瀏覽

2024-08-01 08:09本頁(yè)面
  

【正文】 抵賴 (10, 0) (1, 1) 博弈論的幾個(gè)經(jīng)典模型 對(duì)于兩個(gè)犯罪嫌疑人總體而言,他們?cè)O(shè)想的最好的策略可能是都不交代。對(duì)于 A而言 ,不管 B采取何種策略,他的最佳策略都是交代。最后兩人都會(huì)選擇交代。 這里反映了個(gè)體理性行為與集體理性行為之間的矛盾 、 沖突 。 然而 , 若博弈進(jìn)行多次 , 則結(jié)論將會(huì)發(fā)生變化 。 ?寡頭定價(jià) ?拍賣(mài)出價(jià) ?推銷(xiāo)員的努力 ?政治上的討價(jià)還價(jià) ?軍備競(jìng)賽等 ( 沖突中出現(xiàn)兩敗俱傷的情況 ,往往要考慮到囚徒困境 ) *( 純策略 ) 納什均衡 模型二、囚徒困境 /非合作博弈 博弈論的幾個(gè)經(jīng)典模型 ? 什么是博弈論 ? 試舉兩個(gè)你生活中的例子說(shuō)明 。 當(dāng)大會(huì)結(jié)束之后,有兩個(gè)學(xué)者,麥息克和路特提議大家玩一個(gè)游戲。如果到最后這信封里的錢(qián)超過(guò)250元,麥息克和路特將自己掏腰包,退還每人10元。 仔細(xì)想一想,如果你也在場(chǎng),你會(huì)奉獻(xiàn)多少錢(qián)呢? 問(wèn)題與思考 博弈論的幾個(gè)經(jīng)典模型 ? 什么是海薩尼轉(zhuǎn)換 ? 海薩尼提出了一種處理不完全信息博弈的方法 ,即引入一個(gè)虛擬的局中人 —— “ 自然 ” 。每個(gè)局中人知道自己的特征 , 但不知道別的局中人特征 。 這種轉(zhuǎn)換被稱為 “ 海薩尼轉(zhuǎn)換 ” , 這個(gè)轉(zhuǎn)換把 “ 不完全信息 ” 轉(zhuǎn)變成為完全但不完美信息 , 從而可以用分析完全信息博弈的方法進(jìn)行分析 。 借助于第一步和第二步中虛構(gòu)的參與者 “ 自然 ” 的行動(dòng) , 我們可以把一個(gè)不完全信息的博弈表述為一個(gè)不完美信息的博弈 。 一般地 ,“ 自然 ” 在博弈開(kāi)始的時(shí)候選擇參與人的類(lèi)型 , 參與人的某個(gè)類(lèi)型包括表征類(lèi)型的各個(gè)特征如策略空間 、 信息集 、 得益函數(shù)等 , 這些又稱為該類(lèi)型參與人所擁有的個(gè)人信息 。 模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣(mài) /不完全信息靜態(tài)博弈 博弈論的幾個(gè)經(jīng)典模型 通過(guò)海薩尼轉(zhuǎn)換 , 博弈開(kāi)始時(shí) , 所有參與人有關(guān) “ 自然 ” 的行動(dòng)有一致的信念 , 即都知道所有參與人類(lèi)型的概率分布函數(shù) , 此即 “ 海薩尼公理 ” 。 現(xiàn)在 B企業(yè)考慮是否進(jìn)入 。 如果阻撓的成本低 , 那么 , 正如下表后兩列所表示的 , A企業(yè)的占優(yōu)戰(zhàn)略是阻撓 , 博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡 —— A阻撓 , B不進(jìn)入 。 B企業(yè)所不知道的 , 是 A企業(yè)的阻撓成本是高是低 。 某一參與人所擁有的全部私人信息稱為他的類(lèi)型 。 高阻撓成本和低阻撓成本則是兩種不同的類(lèi)型 。 因?yàn)?B不僅不知道 A的類(lèi)型 ( 是高還是低 ) , 而且不知道不同類(lèi)型的分布概率 。 其他參與人雖然不清楚某一參與人的真實(shí)類(lèi)型 , 但知道這些可能出現(xiàn)的類(lèi)型的分布概率 , 而且這種概率是公共知識(shí) 。 模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣(mài) /不完全信息靜態(tài)博弈 博弈論的幾個(gè)經(jīng)典模型 模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣(mài) /不完全信息靜態(tài)博弈 N 低成本 高成本 A B B (50,40) (300,0) (0,10) (300,0) (100,30) (400,0) (140,10) (400,0) A B B 默許 默許 阻撓 阻撓 進(jìn)入 不進(jìn)入 進(jìn)入 進(jìn)入 進(jìn)入 不進(jìn)入 不進(jìn)入 不進(jìn)入 *貝葉斯納什均衡 博弈論的幾個(gè)經(jīng)典模型 ? 言語(yǔ)博弈中的 “ 威脅 ” 與 “ 承諾 ” 在現(xiàn)實(shí)中 , 我們經(jīng)??吹铰暦Q的策略決定 ,但是這些聲稱的策略可信嗎 ? 聲稱的策略包括 “ 威脅 ” 與 “ 承諾 ” 。 博弈論中 ,經(jīng)常用 “ 可臵信 ” 和 “ 不可臵信 ”的 “ 威脅 ” 或 “ 承諾 ” 來(lái)區(qū)分行動(dòng)者說(shuō)出來(lái)的策略 , 我們?cè)趯?duì)動(dòng)態(tài)博弈的分析中會(huì)分析什么樣的策略是可臵信的 ,什么樣的策略是不可臵信的 。 模型四、 Stackelberg雙寡頭競(jìng)爭(zhēng)模型 /完全且完美信息動(dòng)態(tài)博弈 博弈論的幾個(gè)經(jīng)典模型 倒推法 ( backward induction) 也叫逆向歸納法 。 在某個(gè)城市假定只有一家房地產(chǎn)開(kāi)發(fā)商 A,我們知道任何沒(méi)有競(jìng)爭(zhēng)下的壟斷利潤(rùn)是很高的 , 假定 A此時(shí)每年的壟斷利潤(rùn)是 10億元 。 面對(duì)著 B要進(jìn)入其壟斷的行業(yè) , A想:一旦 B進(jìn)入 , A的利潤(rùn)將受損很多 , B最好不要進(jìn)入 。 假定當(dāng) B進(jìn)入時(shí) A阻撓的話 ,A的利潤(rùn)降低到 2, B的利潤(rùn)是 1。 模型四、 Stackelberg雙寡頭競(jìng)爭(zhēng)模型 /完全且完美信息動(dòng)態(tài)博弈 博弈論的幾個(gè)經(jīng)典模型 這樣一個(gè)博弈可用下圖表示: 模型四、 Stackelberg雙寡頭競(jìng)爭(zhēng)模型 /完全且完美信息動(dòng)態(tài)博弈 B 進(jìn)入 不進(jìn)入 A A: 10; B: 0 阻撓 不阻撓 A: 2; B:- 1 A: 4; B: 4 博弈論的幾個(gè)經(jīng)典模型 上圖稱之為博弈樹(shù) 。 我們稱之為動(dòng)態(tài)博弈 ,或者兩階段的動(dòng)態(tài)博弈 。 現(xiàn)在讓我們回到房地產(chǎn)開(kāi)發(fā)商之間的博弈問(wèn)題 。 這兩個(gè)最好的結(jié)局不能構(gòu)成均衡 。 而對(duì) B來(lái)說(shuō) , 如果進(jìn)入 , A真的阻撓的話 , 它將受損失 1( 假定 1是它的機(jī)會(huì)成本 ) , 當(dāng)然此時(shí) A也有損失 。 原因是:當(dāng) B進(jìn)入的時(shí)候 , A阻撓的收益是 2, 而不阻撓的收益是 4。 也就是說(shuō) , 一旦 B進(jìn)入 , A的最好策略是合作 , 而不是阻撓 。 雙方的收益各為 4。 在這里 , 雙方必須都是理性的 。 這個(gè)例子只是簡(jiǎn)單的兩階段博弈 , 而三階段或更多階段的博弈 , 可用同樣方法加以分析 。 靜態(tài)地看 , 一博弈存在許多均衡 。 我們可以驗(yàn)證 , 在這兩點(diǎn)上誰(shuí)都不愿意改變策略 。 因?yàn)檫@是動(dòng)態(tài)博弈 , 在這個(gè)動(dòng)態(tài)博弈中 , 存在著先后策略選擇順序 。所謂完全信息是指:博弈的支付函數(shù)是“公共知識(shí)”。完美信息是針對(duì)動(dòng)態(tài)博弈而言的,指參與者知道博弈的所有歷史。然而倒推法面臨著一個(gè)困難 ,這就是 蜈蚣博弈 的悖論。 —— “ 不首先使用核武器 ” 的承諾可信嗎 ? *子博弈完美納什均衡 模型四、 Stackelberg雙寡頭競(jìng)爭(zhēng)模型 /完全且完美信息動(dòng)態(tài)博弈 博弈論的幾個(gè)經(jīng)典模型 ? 光天化日之下的違法行為為什么總能成功 ? 人類(lèi)有許多關(guān)于猴子的故事 , 比如朝三暮四 , 殺雞給猴看 。 我們這里也講一個(gè)猴子的故事 …… 。 沒(méi)有被偷的人想 , 反正被偷的待宰猴群的結(jié)局人不是我 , 我反抗了 , 我得不到任何好處 ,反而遭到傷害;而不反抗雖不得益 , 但也不受損 , 我何必要反抗呢 ? 這就是光天化日之下的偷竊行為為什么總能成功的原因 。 乘客想 , 竊賊的威脅是可信的:因?yàn)槿绻麄€(gè)別乘客反抗 , 而竊賊不毆打該乘客的話 , 就會(huì)有更多的乘客抓竊賊 ,竊賊將有可能被抓 , 因此竊賊必然歐打反抗的乘客 。 模型五、信號(hào)博弈 /不完全信息動(dòng)態(tài)博弈 博弈論的幾個(gè)經(jīng)典模型 乘客 反抗 不反抗 偷東西 竊賊 竊賊 毆打 不毆打 乘客:受傷 竊賊:可能被抓 , 可能逃脫 乘客:無(wú)所得 , 無(wú)所失 竊賊:被抓 竊賊 毆打 不毆打 乘客:受傷 竊賊:得到贓物 乘客:無(wú)所得 , 無(wú)所失 竊賊:得到贓物 博弈論的幾個(gè)經(jīng)典模型 對(duì)于乘客來(lái)說(shuō) , 竊賊的威脅是可信的 , 因而乘客的最優(yōu)策略是 “ 不反抗 ” ;而對(duì)于竊賊來(lái)說(shuō) , 乘客 “ 不反抗 ” 下的 “ 不毆打 ” 策略為最憂 。 這樣一種群體不反抗的結(jié)果將使社會(huì)風(fēng)氣惡化 , 偷竊之風(fēng)盛行 。這使得我們都如同待宰的猴子 , 我們不知道什么時(shí)候輪到我們自己 。 模型五、信號(hào)博弈 /不完全信息動(dòng)態(tài)博弈 博弈論的幾個(gè)經(jīng)典模型 如何從這種困境中擺脫出來(lái) ? 我們看到 , 使乘客采取 “ 反抗 ” 策略 , 而非“ 不反抗 ” 策略在于加大采取 “ 反抗 ” 策略的獲益 , 而減少不反抗的獲益 。 加大道德宣傳 , 培養(yǎng)人的道德感可以解決這個(gè)囚徒困境 。 博弈論對(duì)不合作的博弈結(jié)果的預(yù)測(cè)是令人悲哀的 。 *精煉貝葉斯納什均衡;混同均衡;分離均衡 模型五、信號(hào)博弈 /不完全信息動(dòng)態(tài)博弈 博弈論的幾個(gè)經(jīng)典模型 ? 哪種策略更能贏 ? 假定我們的社會(huì)已經(jīng)形成約束行動(dòng)者的道德規(guī)范 。 這表現(xiàn)在一次性的非合作的博弈中 ,行為者理性地選取對(duì)自己有利的行動(dòng) 。 對(duì)囚徒困境進(jìn)行無(wú)限次的重復(fù)博弈 , 什么樣的策略會(huì)贏 ? 模型六、有效工資率 /重復(fù)博弈 博弈論的幾個(gè)經(jīng)典模型 這里涉及參與者以什么樣的態(tài)度對(duì)待對(duì)方的不合作策略 。 如果一方采取不合作的策略另一方隨即也采取不合作策略并且永遠(yuǎn)采取不合作策略 ,在博弈論里面稱之為觸發(fā)策略 , 或稱冷酷策略 , 英文叫 trigger strategy。 因此 , 只要有人采取觸發(fā)策略 , 那么雙方均愿意采取合作策略 。 也就是說(shuō) , 這種策略不給對(duì)方一個(gè)改正錯(cuò)誤或解釋錯(cuò)誤的機(jī)會(huì) 。 這叫 “ 一報(bào)還一報(bào) ” 策略 , 或者稱之為 “ 針?shù)h相對(duì)
點(diǎn)擊復(fù)制文檔內(nèi)容
教學(xué)教案相關(guān)推薦
文庫(kù)吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1