freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

ch02混合策略(博弈論-張醒洲)-預(yù)覽頁

2024-10-24 20:15 上一頁面

下一頁面
 

【正文】 , 正 面)—?jiǎng)t參與人2偏向于改變策略。 現(xiàn)在我們介紹混合策略,2024/10/20,張醒洲,大連,7,純策略,混合策略,考慮標(biāo)準(zhǔn)式博弈G={S1, Sn。如果在試驗(yàn)中事件A中的一個(gè)結(jié)果出現(xiàn)了,就說事件A發(fā)生。 類似地, 混合 策略 (1,0) 是正面朝上的 純策略。,參與人的一個(gè)純策略只 是其混合策略的一個(gè)特 例,例如參與人2出左的 純策略可表示為混合策 略 (1,0.0)。+piK =1。,例如: 猜硬幣 假設(shè)參與人1相信參與人會(huì)以q 的概率出正面,以1 q 的概率出背面;也就是說,1 相信2的混合策略是 ( q, 1q )。你可以設(shè)想給第一枚的兩面分別標(biāo)記11與12。滿足條件“白色在上”的只有這三種。 1 + (1 q) ,圖 1.3.1,這個(gè)例子說明了在“尋找另外一個(gè)嚴(yán)格優(yōu)于 si 的策略”時(shí),混合策略所起的作 用。,2024/10/20,張醒洲,大連,23,對(duì)參與人j的混合策略,參與人i的最優(yōu) 混合策略,參與人 2: ( q, 1q ) 參與人 1: ( r, 1 r ) 求解 r*(q) 當(dāng)參與人2的混合策略為(q, 1 q)時(shí),參與人選擇 (r, 1 r) 的期望收益如下:,rq ? (1) + r(1 q) ? 1 + (1 r)q ? 1 + (1 r)(l q) ? (1) = (2q1 ) + r(24q) , (1.3.1) r*(q) =arg max 2(q1/2)+4r(1/2q),2024/10/20,張醒洲,大連,24,對(duì)參與人j的混合策略,參與人i的最優(yōu) 混合策略,參與人 2: ( q, 1q ) q∈[0,1] 參與人 1: ( r, 1 r ) r*(q) = arg max 2(q1/2)+4r(1/2q),圖 1.3.3,當(dāng)q=1/2時(shí),參與人1的期望收益2(q1/2)+4r(1/2q)與r無關(guān),且參與人1的所有混合策略 (r, 1r) 都是無差異的。,2024/10/20,張醒洲,大連,26,對(duì)參與人1的混合策略,參與人2的最優(yōu)反應(yīng),完全信息靜態(tài)博弈中,參與人同時(shí)行動(dòng), 并且參與人2和參與人1會(huì)以相同的方式考 慮此博弈。 每一個(gè)參與人確定性的選擇一個(gè)純策略. 但對(duì)方不具備關(guān)于這一策略的充分信息, 這時(shí)就要作相應(yīng)的預(yù)測, 將對(duì)方的行為理解為一個(gè)混合策略,并作出相應(yīng)的對(duì)策(chose a best response to a mixed strategy) 每一個(gè)參與人選擇一個(gè)純戰(zhàn)略, 正是利用了對(duì)手關(guān)于自已行為的不確定性。作為不動(dòng)點(diǎn)定理的一個(gè)簡單例子,假定 f(x) 是一個(gè)定義域和值域都在[0,1]之間的連續(xù)函數(shù),則Brower的不動(dòng)點(diǎn)定理保證了存在至少一個(gè)固定的點(diǎn)—即在[0,1]中存在至少一個(gè)值x*,使得 f*(x)=x*。23:38:4523:38:4523:3810/20/2024 11:38:45 PM 安全象只弓,不拉它就松,要想保安全,常把弓弦繃。2024年10月20日下午11時(shí)38分24.10.2024.10.20 追求至善憑技術(shù)開拓市場,憑管理增創(chuàng)效益,憑服務(wù)樹立形象。下午11時(shí)38分45秒下午11時(shí)38分23:38:4524.10.20 專注今天,好好努力,剩下的
點(diǎn)擊復(fù)制文檔內(nèi)容
環(huán)評(píng)公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號(hào)-1