【文章內(nèi)容簡介】
??? ? ? ?*2局 中 人 的 混 合 策 略 的 期 望 利 益 為 :111 2 1 2222 1 2 1i i S i iiS* * *i j 1 i j 1i S j S i S j Sj j S j jjS* * *i j 2 i j 2j S i S j S i Sp { p } p 0 , p 1 u p q u (i, j) p q u (i, j)q { q } q 0 , q 1 u p q u (i, j) p q u (i, j)??? ? ? ???? ? ? ?? ? ? ???? ? ? ????? ? ? ??? ? ? ?*1*2若 對 , 對 , ** Nas hp q G則 稱 和 為 對 局 的 混 合 均 衡 策 略 。 下面以兩人每人兩個策略的情況為例說明求 Nash混合 均衡策略的條件。設(shè) G={S1 =(1,2),S2 =(1,2),u1(i,j),u2(i,j)}, 局中人 1, 2的混合策略分別為 p1,p2和 q1,q2,則局中人 1 的期望收益為: 1 1 1 1 2 1 2 1 1 2 1u * p [ q u ( 1 , 1 ) q u ( 1 , 2 )] p [ q u ( 2 , 1 ) q u ( 2 , 2 )]? ? ? ? 為了求 p1,p2并使 u1 *為極大值,我們把它化為下列的 非線性規(guī)劃問題: 1 1 1 2 1 2 1 1 2 11 2 1 2m a x { p [q u ( 1 , 1 ) q u ( 1 , 2 )] p [q u ( 2 , 1 ) q u ( 2 , 2 )]}s . t . p p 1 , p 0 , p 0? ? ??? ? ? ? ??則它的 LagrangeKuhnTucker函數(shù)為: 1 1 1 2 1 2 1 1 2 11 2 1 1 2 2L p [q u ( 1 , 1 ) q u ( 1 , 2 )] p [q u ( 2 , 1 ) q u ( 2 , 2 )] [ p p 1 ] p p? ? ? ?? ? ? ? ? ? ? ?它的一階必要條件( KT條件 )為: 1 1 2 1 111 1 2 1 22L[ q u ( 1 , 1 ) q u ( 1 , 2 )] 0pL[ q u ( 2 , 1 ) q u ( 2 , 2 )] 0p?? ? ? ? ? ? ???? ? ? ? ? ? ??1 1 1 12 2 2 20, p 0, p 00, p 0, p 0? ? ? ? ?? ? ? ? ?1 2 1 2p 0, p 0, 0? ? ? ? 當(dāng)考慮混合對策時,即 則 = = ,因而有1 2 1 1 2 12 1 21 1 2 2 2 1 2 21 2 1 2 q u ( 1 , 1 ) q u ( 1 , 2 ) q u ( 2 , 1 ) q u ( 2 , 2 )q q u q , qm ax q [ p u ( 1 , 1 ) p u ( 2 , 1 ) ] q [ p u ( 1 , 2 ) p u ( 2 , 2 ) ]s. t . q q 1 , q 0 , q 0? ? ?? ? ???? ? ? ??11**1222由上式解出 和 。同理,對 , 對 取極大值,即 1 2 2 1 2 2p , p p u ( 1 , 1 ) p u ( 2 , 1 ) p u ( 1 , 2 ) p u ( 2 , 2 )m , p , p q , q Na sh? ? ?**1222* * * *1 2 1 2可得決定 的條件為這樣求得 和 便為 混合均衡策略。1 2 n nin G S ,S , , S u u u10 .5 ( N ash 195 0)nSN ash12 一個 方的對局 = { , , , } 中,若 為有限的, 為有限集,則該對局必存在一組均衡策略(純策略或混合定理策略)。Von . Ne u m an n10. 6 (Von .Neu m an n 19 44) 一個兩人零和對局,比存在一組均衡策略(純策略或混合策略) 這在此以前, 曾證明了一個奠基性的定理個定理在賭局中或在軍事上都有很重要 定理:的應(yīng)用。Nas h為 了 證 明 混 合 對 策 的 均 衡 的 ( 定 理 10存 在 性 定 理 .5) ,我們先證明一個引理。1 I i S , ..., S L am m a . , S 1 設(shè) 非空 為緊凸引理 ( ) 子集, i 1 I u ( ) (S , .. ., S ) ? i在 連續(xù),在S 上擬凹的,則局中人i 的i b e st r e sp on se c or r e sp on d e n c e ) b ( )?最優(yōu)策略映象 ( 是非空的凸值的上半連續(xù)映象。i 1 i 1 i b ( s ) u ( , s ) S ??-注意到 是連續(xù)映證明 象 在緊集 上取得最大值的點集,即iii i i i i i i isSb ( s ) { s S ( s , s ) m a x ( s , s )}? ? ??? ? ?ii:u u , 由 知最 大 它 是、 小 值 定 理 非 空 的 。i 1 1 u ( , s ) s??? ii定理3因 為擬凹的,由 ,b ( ) 在凸集S 中是凸集。ib ( )?最后,要證明 是上半連續(xù)的。n n n ni i i i i i is b ( s ) , ( s , s ) ( s , s )? ? ???為此只要證明:對任意 ,i i is b ( s ) ??必有 。n n , n ,i i i i i i i i i u ( s , s ) u ( s , s ) , s S , u ( ) ??? ? ? ?由 的連續(xù)性,,i i i i i i i i i i i u ( s , s ) u ( s , s ) , s S , s b ( s ) ? ? ?? ? ? ?故 因而 。 (定理8 純對策的N a s h 均衡的存在定理,P r o p . 8 . D . 3 )i i i G [ I , { S } , { u ( ) } ] , i = 1,2,...,I ??設(shè) , 為 一 個 對 局 , 其 中i1 S M() 為R 非空緊凸的子集;i 1 I 1 I i2 u ( s , ..., s ) ( S , ..., S ) S( ) 在 中連續(xù),且在 中為擬凹的,N ash則該對局必存在 均衡。1I S = S S b S S ,? ? ?設(shè) 先定義證 一個映象 : 如下:明1 2 I( s ) ( s ) ... ( s )? ? ???1 I 1 2 Ib ( s , . . . , s ) = b b bIS b ( )? ? ? ? ? ?1吉由 S 為緊子集,而洪諾夫定理, 是非空I L e m m a 8 . , b ( )1? ? ? ? ? ? ?1緊凸集S 到自身的映象,由是非空凸值和上半連續(xù)的映象。b ( ) S S ??這樣, : 完全滿足 Kakutani 定理 的條件,故iis * S , s * b ( s *) s * b ( s *) , i ,? ? ? ?存在不動點 使 ,即 1I ( s *, , s *) N ash? ? ? ? ?為 的 均衡策略。 N ash 定 理 ,作 了 以 上 的 準(zhǔn) 備 , 現(xiàn) 在 可 以 著 名 的來# 證 明均衡的存在性定理 了。N i i [ I , { S } , { u ( ) } ] , i = 1,. , ..,I ? ? ? ?證明 首先我們把對局:? i看成策略集為{ S } , 收益函數(shù)為:Ii 1 I k 1 k k isSu ( , , ) [ ( s )] u ( s ) , i =1, ...,I??? ? ? ? ? ? ? ? ?? ?* i)的對局。因收益函數(shù)是擬凹的 , S 是非空緊凸集,滿足1I*,8 , *) , ? ? ? ? ?的條件,因此存在(定理 使i i i i i i iu ( *, ) u ( , ) ??? ? ? ? ? ? ? ? ? i’ , ’ S1I*, , *)? ? ? ? ?這個( 就是混合策略的N a s h 均衡。1 1 2 2i 1 2 1 2 i 1 2s S s S*) u ( , ) u ( s , s ) ??? ? ? ? ???以 兩 維 的 情 況 為 例 。1 1 2 2i 1 1 1 2 2 2s S s Su ( s ) s , ( s ) s??????? ? ???????i 1 Iu ( , , )? ? ? ? ? ?i由于 ( ) 是V M 型及擬凹的,故u 也是擬凹的。A 1 2 B 1 2 1 2{ I ( A , B ) , S ( a , a ) , S ( b , b ) , u ( a , b ) , u ( a , b ) }??例1 0 . 1 21 1 2 1 1 2 1 1 1 1 2 2 1 1 2u ( , ) ( a ) [ ( b ) u ( a , b ) ( b ) u ( a , b ) ]? ? ? ? ? ? ?1 2 2 1 1 2 1 2 2 1 2 2( a ) [ ( b ) u ( a , b ) ( b ) u ( a , b ) ]? ? ? ? ?i A j B1 i 2 j 1 i ja S b S( a ) ( b ) u ( a , b )??? ? ???j B j B1 1 2 j 1 1 j 1 2 2 j 1 2 jb S b S( a ) ( b ) u ( a , b ) ( a ) ( b ) u ( a , b )??? ? ? ? ? ???j B j B1 1 1 1 2 j j 1 2 1 2 2 j jb S b S( a ) u ( a , ( b ) b ) ( a ) u ( a , ( b ) b )??? ? ? ? ? ? ? ???i A j B1 1 i i 2 j ja S b Su ( ( a ) a , ( b ) b )??? ? ? ? ???b2 b1 a2 a1 11(a )?12(a )?21(b )? 22(b )?u1(a2,b2) u1(a2,b1) u1(a1,b2) u1(a1,b1) A B 2 1 2 1* * * *j i 2 i j 2j S i S j S i SII u q p u ( i , j) p q u ( i , j)? ? ? ???? ? ? ?*2局 中 人 的 混 合 策 略 的 期 望 利 益 為 :111 2 1 2222 1 2 1i i S i iiS* * *i j 1 i j 1i S j S i S j Sj j S j jjS* * *i j 2 i j 2j S i S j S i Sp { p } p 0 , p 1 u p q u (i, j) p q u (i, j)q { q } q 0 , q 1 u p q u (i, j) p q u (i, j)??? ? ? ???? ? ? ?? ? ? ???? ? ? ????? ? ? ??? ? ? ?*1*2若 對 , 對 , ** Nas hp q G則 稱 和 為 對 局 的 混 合 均 衡 策 略 。2211120*22 1 1[ 2 ( a c ) t ] ( a c t )m ax W ( t , t ) m ax {18 9( a c 2 t ) t ( a c 2 t )}93??? ? ? ?? ? ?? ? ? ??11121tt邊 際 成 本 , 因 而 必 然 減 少 生 產(chǎn) , 使 其 出 清 價 格 有所 上 升 , 起 到 保 護(hù) 本 國 企 業(yè) 的 目 的 。通 過 對 第 二 階 段 兩 國 企 業(yè) 的 最 優(yōu) 行 為 的 分 析 , 回 歸( 逆 推 ) 到 第 一 階 段 , 兩 個 政 府 怎 樣 來 選 擇 各 自 的關(guān) 聯(lián) t , t 來 最 大 化 各 自 的 社 會 總 福 利 ? 2222120*21 2 211 **1222[ 2 ( a c ) t ] ( a