freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

動態(tài)規(guī)劃基本理論推廣(函數(shù)迭代與策略迭代法)(完整版)

2025-03-28 21:49上一頁面

下一頁面
  

【正文】 2023 很多事情努力了未必有結(jié)果,但是不努力卻什么改變也沒有。 下午 7時 51分 11秒 下午 7時 51分 19:51: 楊柳散和風,青山澹吾慮。 2023年 3月 下午 7時 51分 :51March 23, 2023 1業(yè)余生活要有意義,不要越軌。 19:51:1119:51:1119:51Thursday, March 23, 2023 1知人者智,自知者明。 :51:1119:51:11March 23, 2023 1意志堅強的人能把世界放在手中像泥塊一樣任意揉捏。 2023年 3月 23日星期四 下午 7時 51分 11秒 19:51: 1比不了得就不比,得不到的就不要。x(3) 階段指標 Vk與 k無關(guān),可記作 。 管理科學與系統(tǒng)工程 pP? ?( ) ( )pPV p o p t V p???()Vpp0 0 001( , ) ( , ) ( , )NNN k k k k k kkkV v x u v x u v x u??? ? ???( ) ( 39。其結(jié)果如下 : 管理科學與系統(tǒng)工程 313( ) 0 .6 1 921x ? ? ?? ? ? ?2 2 231 3 1 3 1 3( ) ( ) ( ) }2 1 8 2 1g ? ? ? ? ?? ? ? ? ?2234 1 .6 1 921 ????32( ) ( )gg??? 由于 ,可以確定該問題的最優(yōu)收益函數(shù)為 最優(yōu)決策為 管理科學與系統(tǒng)工程 434( ) 1855x ? ? ?? ? ? ?2 2 243 4 3 4 3 4( ) ( ) ( ) }5 5 2 1 5 5g ? ? ? ? ?? ? ? ? ?2289 55 ????43( ) ( )gg???2( ) ???( ) ??? ?? 例 2的求解 (策略迭代法) 解: (1)任取初始策略值,如 及 (2)進行第一次迭代,取 i=1,2,… 得 管理科學與系統(tǒng)工程 0 ()x ????,0 ( ) 0 ( 1 , 2 , 3 , )jgj? ??()( ) m in { ( , ( ) ( ( , ( ) ) }xg f x g T x?? ? ? ? ???0 ,1 0 0 , 0 0( ) ( , ( ) ) ( ( , ( ) ) )g f x g T x? ? ? ? ???2 2 2( ) 0 2? ? ?? ? ? ? ? 由于 取 再來確定第二次迭代的決策 : 管理科學與系統(tǒng)工程 20 ( ) 2g ???0 ,2 0 ,1( ) ( )gg???0 , 2 0 0 ,1 0( ) ( , ( ) ) ( ( , ( ) ) )g f x g T x? ? ? ? ???2 2 2 2( ) 2 ( ) 2? ? ? ? ?? ? ? ? ? ?1()x ?0222 2 211111( ( , ) )( ) 2( ( ) )()2 ( ) 4( ( ) ) 0x g T xxxxxxx??? ? ? ??? ? ????????????? ? ? ????? ? ? ?上式的解為 由于 ,需要進行第二次迭代: 管理科學與系統(tǒng)工程 10( ) ( )xx???12( ) 0 . 6 6 63x ? ? ?? ? ? ?1 ,1 1 1 , 0 1( ) ( , ( ) ) ( ( , ( ) ) )g f x g T x? ? ? ? ???2 2 2 22 1 3( ) 0 1 . 4 4 439? ? ? ?? ? ? ? ? ?1 , 2 1 1 ,1 1( ) ( , ( ) ) ( ( , ( ) ) )g f x g T x? ? ? ? ???2 2 2 2 22 1 3 2 1 3 0( ) ( ) 1 . 6 0 53 9 3 8 1? ? ? ? ? ?? ? ? ? ? ? ?由于 ,需要繼續(xù)進行迭代,直到 時為止,節(jié)省時間,直接給出結(jié)果 ,但由于 ,因此 需要繼續(xù)進行迭代。如取: 即 ,但必需沒有回路,每點可達靶點。求任意一點 i到點 n(靶 點 )的最短路線 (距離 )。 管理科學與系統(tǒng)工程 {( ( )}kfx{( ( )}kux( ) , ( ) , ( , ) , nU x T x v x u X策略迭代法的基本思想是:先選定一初始策略 然后按某種方式求得新策略 直至最終求出最優(yōu)策略。 5 1 4 3 2 3 2 2 5 7 5 5 6 0.5 1 管理科學與系統(tǒng)工程 例 1:段數(shù)不定的最短路線問題(不定期決策過程) n個點相互連接組成 一 個連通圖 (右圖中 n=5),各點 標號為 1,2,…,n 。 管理科學與系統(tǒng)工程 例 1:段數(shù)不定的最短路線問題(不定期決策過程) n個點相互連接組成 一 個連通圖 (右圖中 n=5),各點 標號為 1,2,…,n 。 函數(shù)方程可以用迭代法求解,通常有函數(shù)迭代法和策略迭代法兩種迭代方法。階段指標是任意兩狀態(tài) i,j間的距離 dij,指標函數(shù)V(i,u(x))是由狀態(tài) i出發(fā),在策略 u(x)下到達狀態(tài) n的路線的 管理科學與系統(tǒng)工程 距離,它是階段指標之和, 并滿足可分離性要求,有 最優(yōu)值函數(shù) ?(i)為由 i出發(fā)到達 n的最短距離,即 式中 u*(x)是最優(yōu)策略,滿足基本方程 管理科學與系統(tǒng)工程 ( , ( ) ) ( , ( ) )ijV i u x d V j u x??*()( ) m i n ( , ( ) ) ( , ( ) )uxf i V i u x V i u x??1( ) m in ( ) , 1 , 2 , , 1 .ijjnf i d f j i n????? ? ? ???該式記為 (﹡) 式,它不是一個遞推方程,而是一個 關(guān)于 ?(i)的函數(shù)方程 ,對固定的 i使 (﹡) 右端 [dij+?(j)] 達到極小的 j即為最優(yōu)決策 u*(i),對所有的 i求解 (﹡) 式得到最優(yōu)策略 u*(x)。 ③從任一點出發(fā)到靶點,走 m(m=1,2,…) 步與走m+1步的最優(yōu)距離一樣,決策函數(shù)也一樣,如果繼續(xù)計算走 m+2步、 m+3步、 …… ,其結(jié)果仍一樣 , 即 也就說明 一致收斂于 , 一致收斂于 。 管理科學與系統(tǒng)工程 例 2:無限期決策過程 模型 ,狀態(tài)變換函數(shù) 為 。 管理科學與系統(tǒng)工程 1 ( , )k k k kx T x u? ?()kkDx 00()Dx0 0 1 1{ ( ) , ( ) , }u x u x1, ( )kkk D x?0kV0k?0k?0lim kk V??注:對于定義一個無期決策過程的最優(yōu)化問題,須滿足三個條件,即對所有的 有: ①狀態(tài)轉(zhuǎn)移方程 有意義; ②允許決策集合
點擊復制文檔內(nèi)容
環(huán)評公示相關(guān)推薦
文庫吧 www.dybbs8.com
備案圖鄂ICP備17016276號-1