freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內容

博奕論講稿(上海財大施錫詮)(更新版)

2025-07-03 13:12上一頁面

下一頁面
  

【正文】 A B A A A B A A 投票人 1 投票人 2 投票人 3 A N N N N N A A A A N A N A 0, 1, 1 1, 0, 0 囚徒困境 局中人 1 局中人 2 c n n c 5, 5 0, 15 n c 15, 0 1, 1 ? 博弈的展開型 ? 策略型 1 \ 2 c n c 5, 5 0, 15 n 15, 0 1, 1 總 結 1. 博弈規(guī)則必須明確說明局中人是 “ 誰 ” , 每個局中人可使用的選擇是 “ 什么 ” , 和從局中人群體所作的一組選擇中 , 每個局中人得到 “ 多少 ” 。 策略是行動的藍圖,在每一個決策結告訴局中人如何去選擇。 示理性局中人將達到的結局 。結局可能會是兩種中的某一個:要么通過 A 和 B 中的一個 , 要么議員們沒有通過任何一項議案 ( 延緩而以原來法律代替 ) 。 例題 1. 拿子游戲 (Nim和 Marienbad) 這是兩個室內游戲 , 玩法如下 。問題在于這種做法會導致代價昂貴的爭斗。(實際上,從一次拍賣到又一次拍賣,這些投標人極少發(fā)生改變。在這個例子中, “ 群體 ” 是藥物公司全體組成的集合。 “ 相互作用 ” 是兩方面的,一方面是運動員之間的相互作用 ——他們做出在訓練安排中和不管什么情況下一樣服禁藥的決策;另一方面是在運動員與 IOC之間的相互作用,后者需要維護運動的聲譽。D開支(譬如,制藥公司的研究開發(fā)費用) ? 第一次世界大戰(zhàn)的壕溝戰(zhàn)(在法德之間的邊界地區(qū),當軍隊連續(xù)數(shù)月地互相對峙時,掘進到敵方的戰(zhàn)壕里去) ? OPEC(石油卡特爾,控制著世界石油產量的一半,因此,在決定人們支付油價方面擁有重要的發(fā)言權 ? 群體項目(諸如為你們的博弈論課程準備案例研究) 博弈論 —— 分析在一群舉止行為頗具策略的理性人之間的相互作用的正規(guī)方法。博弈論 主講 施錫銓 2021年 3月 第一章 引論 應用及例題 基本理論 博弈論關注的是互相依存 ( interdependence) ? 每一個體猜測其他個體的選擇是什么 ? ? 每個人將采取什么樣的行動 ? (當最優(yōu)的行動依賴于其他人的所作所為時 , 這個問題尤其令人關注 。 ? ―毒藥 ” 條款(該條款給予管理部門一定的權限以抵制不受歡迎者試圖接管或兼并他們的公司) ? Ramp。 ? (奧林匹克運動會中)中隨機藥物檢測:“ 群體 ” 由比賽運動員和國際奧林匹克委員會( IOC)組成。公司自然關心諸如資金投入哪一條生產線,新藥定價應多高,如何縮減與新藥開發(fā)相伴的風險,等等問題。因此, “ 群體 ” 就是投資銀行組成的集合。通常野生動物不得不為了稀少資源(諸如具繁殖能力的雌性動物或者動物的尸體)而競爭;于是,為了發(fā)現(xiàn)這些資源 ——或者為了從發(fā)現(xiàn)者那兒奪取資源,它們會有所付出。 “ 策略 ” 的選取需要估計其他債權人可能有多大耐心,而“ 理性的 ” 選擇包含了在早收賬與逼迫公司不必要的破產之間的權衡。 2. 投票 假設有兩個競爭議案 , 這里表示為 A 與 B , 3個議員 ,投票人 1, 2和 3, 他們投票決定是否通過這些議案 。 但是 , 學科的主要發(fā)展是近代的 , 大約在最近 50年期間 , 使得博弈論成為經(jīng)濟學與數(shù)學范圍內最年輕的學科之一 。 ? b c s ? b c s R 1 R 2 A H E L R 1 = 路線 1 R 2 = 路線 2 H = 高架路 A = 大街 E = 特快 L = 慢車 信息集和策略 在展開型里怎樣表示 同時行動 局中人 1 局中人 2 c n c c n n 信息集 決策結的集合,局中人不能區(qū)分這些決策結 策略 局中人的策略是指在局中人需要做出選擇的信息集處可采取的行動。如果她的第二個選擇通過,則盈利為 0,如果她最不贊同的抉擇通過,此時她的盈利是 1。 第 2章 策略型博弈 ?策略型博弈 ?案例 :藝術品拍賣的策略型 ?占優(yōu)策略解 ?案例研究續(xù):拍賣中的占優(yōu)策略 策略型博弈 博弈的策略型由三項內容所確定: 1. 博弈中局中人的名單 . 2. 每個局中人可使用的策略集 . 3. 與任何策略組合 ( 每個局中人一個策略 ) 相對應的盈利 . 盈利是馮 ?諾依曼 摩根斯坦效用。 囚徒困境 ( c = 認罪, nc = 拒絕認罪) 卡爾文\克雷 c nc c 0, 0 7, 2 2, 7 5, 5 性別爭端( F = 足球, O = 歌?。? 丈夫\妻子 F O F 3, 1 0, 0 O 0, 0 1, 3 拋硬幣打賭( Matching pennies) ( h = 正面 , t = 反面 ) 局中人 1\局中人 2 正面 反面 正面 1, 1 1, 1 反面 1, 1 1, 1 鷹 鴿(或懦夫博弈) ( t = 強硬 , c = 退讓) 局中人 1\局中人 2 t c t 1, 1 10, 0 c 0, 10 5, 5 投票 對每一個投票者,在這個博弈中的策略有三個部分:在第一輪中如何投票和第二輪中如何投票,而在第二輪中的投票本身有兩個分量。 BAB。 拍賣商站在房間前面的講臺上 。 你不必坐的畢恭畢敬;抓耳撓腮不能算作為一個出價 ( 除非你與拍賣商事先就做了安排 ) 。如果 s?i弱占優(yōu)于其他任何一個策略 si,那么 s?i被稱為弱占優(yōu)策略 *。 例如,囚徒困境中(認罪,認罪)構成了一個占優(yōu)策略解。 3000美元的最高叫價比起2500美元的叫價來決不會差些 ——而有時候嚴格地更好一些。 , 真實地叫價是該博弈的占優(yōu)策略解 。 假定收益由如下盈利矩陣給出 公司 1\公司 2 高 中 低 高 6, 6 0, 10 0, 8 中 10, 0 5, 5 0, 8 低 8, 0 8, 0 4, 4 剔除 “ 高 ” 策略后 , 留給我們如下盈利矩陣 公司 1\公司 2 中 低 中 5, 5 0, 8 低 8, 0, 4, 4 例 3:投票博弈 投票博弈:采用多數(shù)規(guī)則 , 三個投票人挑選兩個議案 A或 B中的一個 。 剔除了 ( 第 Ⅱ 輪非真實的 ) 劣策略后 , 策略型如下 投票人3采用 ANN 投票人1\投票人2 AAB BAB AAN 1, 0, 0 1, 0, 0 BAN 1, 0, 0 0, 1, 1 投票人3采用 BNN 投票人1\投票人2 AAB BAB AAN 1, 0, 0 1, 1, 1 BAN 0, 1, 1 0, 1, 1 現(xiàn)在看到,對局中人1, AAN優(yōu)于 BAN,對局中人2 AAB優(yōu)于BAB,而對局中人3, BNN優(yōu)于 ANN。 進入第 Ⅱ 輪 , 局中人 i可以在留給自己的策略集 Si ? Di(I)中作進一步的決定 , 看看它們當中是否又有哪些現(xiàn)在成為劣策略了 。 iiiiiiiii sIDSssss ????? ??? 中所有的對 )(),(),( ??iiiiiiiii sIDSssss ????? ??? ?)()?,()?,( 中某些的對??假如我們最終達到這樣一個狀態(tài) , 剩給每一個局中人的只有一個策略 , 即 , 假定經(jīng)過 T輪剔除之后 , 剩下的集合 Si ? Di(T), 恰好包含了一個策略 , 并且這一事實對 i = 1, 2,… , N都成立 ??紤]下述博弈: 1\ 2 左 中心 右 頂 4, 5 1, 6 5, 6 中間 3, 5 2, 5 5, 4 底 2, 5 2, 0 7, 0 理性的層次 剔除的順序 (和非唯一的結局) 當策略是劣的但不是強劣的 , 剔除的順序就要緊了 。 2. 劣策略的剔除可以導致一系列連鎖反應 , 逐步縮小一組局中人采取行動的范圍 。 此外 , 沖突的勝利者常常從失敗者那兒 “ 以不同的方式獲得 ” 某種維持生命必需的東西 。 那么這個策略組合是納什均衡 。 而 Q = Q1 + Q2是由公司 1和公司 2生產的總量 。 古諾特 納什均衡 ? 最大化利潤的生產量 ? 公司 1最優(yōu)反應函數(shù) *121 ])([1 QcbaM a x Q ???????????????bcaQbcaQbbQcaQR22221,0,2)(如果如果 Q2 ( a c ) / 2 b 0 R1 R2 Q1 ( a c ) / 2 b ( a c )/ b ( a c )/ b 卡特爾解 作為對比,如果兩個公司如卡特爾那樣地運作,即,如果它們對于它們的生產決策進行協(xié)調,我們來計算它們將生產的產量,如果公司經(jīng)營為卡特爾,可以合理地假設它們以最大化它們的聯(lián)合利潤 ——或總利潤這樣的方式來設置生產目標。兩個局中人中的每一個可以提取一個非負量 ——c1或 c2——用于消費 , 當然 ,假設 c1 + c2 ? y。他的效用依賴于局中人 2選擇的消費量,因為后者(部分地)決定了剩下來的資源基底的大小。當 N變大時,第 2周期可使用的資源量變得微乎其微。 考慮由概率向量( p1, p2, …, pM)給出的混合策略。 第 8章 零和博弈 :最大最小 :最小最大 :既穩(wěn)妥又充分地參與 1. 零和博弈 零和博弈是這樣的一個博弈 , 不管兩個局中人采取的是什麼樣的策略向量 ,他們的盈利總是相加為零;就是說 ,對所有的策略 s1和 s2, 成立 ?1(s1, s2) + ?2(s1, s2) = 0 在(兩人) 零和博弈 中,局中人 2的盈利 正好是局中人 1的盈利的負值。因此,為了有把握(或穩(wěn)妥)地參與,局中人 1應該取策略 s1,它使局中人 1最差情況下的盈利比起她采取其它任何一個策略的最差情況盈利要好一些。她知道,如果采取一個穩(wěn)妥策略 p*,她不可能比 m1更差。局中人1的最小最大盈利至少和她的最大最小盈利一樣高,即 M1 ? m1。反之,假使最小最大和最大最小盈利相等。 重要的是 , 對于博弈如何進行下去不能模棱兩可 , 因此 , 必定不存在二個或多個枝導向同一個結 。說它是 完全的 ,因為它告訴局中人在每一個有關的決策結上選擇什么策略。 一個 完美信息的博弈 是不存在(具有多個結的)信息集的展開型博弈。 例 2:進入 Ⅱ ? 對于(稍微)復雜一些的模型,我們考慮如下變體。 注意到 “ 可口可樂 ” 的每一個策略必定有三個分量 。你也許認為這對博弈也應該是對的。 只強硬的 “ 可口可樂 ” 假如我們以下述方式修改例子:在 “ 可口可樂 ” 進入 FSU市場之后,除了強硬之外, “ 可口可樂 ”沒有其他的選擇(即,假定 “ 可口可樂 ” 少了一個選擇:它不能寬容)。 此外,現(xiàn)在假設 CSX聯(lián)合鐵路公司必須作一最初選擇,決定是否用 “ 毒藥 ” 來武裝自 己?,F(xiàn)在,雖然,盡管有 “ 毒藥 ” ,南諾??税l(fā)現(xiàn)進入仍是有利可圖的(因為它得到了利潤 )。 在 HDTV可以進入市場之前有若干必須成功地完成的階段 。D,它將花費最少可能的資金,并且一次向前進展一步。首先 RCA有 Ramp。事實上,如果 R不是一次完成博弈,它知道 S就在下一個機會中完成項目(為什么?),于是 R要么從那一刻起什么也得不到,要么蒙受損失。或者它可以通過停止 Ramp。D更昂貴, S的最好辦法是以花費最少的方式行動,一次一步,逼近專利。 事實上 , 公司 R可以一步使博弈進入它的安全區(qū)域 I——以代價 2。 命題 3 在( 3, 3)與( 5, 5)之間存在第二個觸發(fā)區(qū)域;在這個區(qū)域的最先行動者應該使博弈移入它自己的安全區(qū)域 I。)進入后的競爭階段其盈利如下: 可口可樂\百事 T A T 2, 1 0, 3 A 3, 1 1, 2 可口可樂\百事 T A ET 2, 1 0,
點擊復制文檔內容
范文總結相關推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1