【正文】
過程指標(biāo)函數(shù) 由于 ??? 44, )(kikik uPV用 )(kk xf 表示從第 k個階段到結(jié)束時預(yù)期損失值, )}()(m in {)( 11 ???? kkkkkk xfuPxf( 1)先考慮 D部位 )}()(m i n {)(,4 554444 xfuPxfk ???0)( 55 ?xf 42,42) } ,(m i n {)( 444444 ?????? xuuPxf25)4(,31)3(,34)2( 444 ???? fff( 2)先考慮 C, D部位 )}()(m in {)(,3443333 xfuPxfk ???由于 84 3 ?? x ,所以 46}2521m i n {)}4()4(m i n {)8(47}3121,2522m i n {)}3()4(),4()3(m i n {)7(49}3421,2524,3122m i n {)}2()4(),4()2(),3()3(m i n {)6(55}3124,3422m i n {)}3()2(),2()3(m i n {)5(583424)}2()2(m i n {)4(43343433434343343433433?????????????????????????????????fPffPfPffPfPfPffPfPffPf( 3)先考慮 B, C, D部位 )}()(m in {)(,2332222 xfuPxfk ???由于 108 2 ?? x ,所以 80}4931,4735,4638m i n {)}6()4(),7()3(),8()2(m i n {)10(84}5531,4935,4738m i n {)}5()4(),6()3(),7()2(m i n {)9(87}5831,5535,4938m i n {)}4()4(),5()3(),6()2(m i n {)8(323232232323223232322???????????????????????????fPfPfPffPfPfPffPfPfPf( 4)先考慮 A, B, C, D部位 )}()(m in {)(,1 221111 xfuPxfk ???由于 121 ?x ,所以 97}8710,8414,8018m i n {)}8()4(),9()3(),10()2(m i n {)12( 2121211 ????????? fPfPfPf由此可見, A, B, C, D四個部位應(yīng)分別派 4人, 2人, 2人, 4人,預(yù)期損失值為 97。 )}(),(m a x ( m i n ) {)(,)}(),(m a x ( m i n ) {)(,11,11,??????????????kkkkkkknkiinkkkkkkkknkiinkxfuxVxfvVxfuxVxfvV有時若有時若 8. 2 動態(tài)規(guī)劃問題的解法 例 1.設(shè)某倉庫有 12人巡邏守衛(wèi),負(fù)責(zé) 4個要害部位,對每個部位可分別派 2到 4人巡邏,由于巡邏人數(shù)不同,各部位預(yù)期在一段時間內(nèi)可能造成的損失也不一樣,具體數(shù)字見下表。第 k 階段指標(biāo)函數(shù)記 為 ))(,(kkkk xuxV;過程指標(biāo)函數(shù) 從某階段開始到最后 過程的指標(biāo)度量。 5.狀態(tài)轉(zhuǎn)移方程: 表明后一階段和前一階段之間的 k 階段狀態(tài)和決策給定之后,第 關(guān)系。決策允許范圍記為 )(kk xD)()( kkkk xDxu ?, 4.策略( Policy) :即決策序列。第 i 個階段的狀態(tài) 變量 ix 應(yīng)該包含前各階段決策過程的全部信息,且之后 作出的決策與之前的狀態(tài)和決策無關(guān)。也就是說,當(dāng)系統(tǒng)處于第 i 個狀態(tài)時,只要最優(yōu) 規(guī)劃剩余的 in? 個過程,便可逐步求出 1?i 時的 最優(yōu)解。第八章 動態(tài)規(guī)劃問題及求解 8. 1 多階段決策問題 動態(tài)規(guī)劃是解決這樣一類最優(yōu)化問題的專門計算方法,這類問題允許把它的過程(求解)分解為一系列的單級過程(步驟)。 最優(yōu)化原理:達(dá)到系統(tǒng)某種狀態(tài)的過程無論是怎樣的,以這個狀態(tài)為初始狀態(tài)的剩余過程的求解仍是最優(yōu)的規(guī)劃。 為了方便討論動態(tài)規(guī)劃的求解過程,我們把動態(tài)規(guī)劃 問題化分為下面幾個過程: ( stage): 把問題恰當(dāng)?shù)姆譃槿舾蓚€相互聯(lián)系 的階段; 2.狀態(tài)( State) :它是表示某段的出發(fā)位置,是某支路 的起點,又是前一段某支路的終點。 3.決策( Decision) :是指某階段初從給定的狀態(tài)出發(fā) 決策者所作出的選擇,決策變量 )(kk xu表示第 i 個階段 狀態(tài)為 ix時對方案的選擇。 n 個階段動態(tài)規(guī)劃問題 的策略可記為 )}() , . . . . . ,(),({ 2211 nn xuxuxu,當(dāng) 2?k 時, )}() , . . . . . ,(),({ 11 nnkkkk xuxuxu ?? 表示從 k 階段開始到最后的決策 序列。當(dāng)?shù)? 1?k階段狀態(tài)就確定了,記為 ))(,(1 kkkk xuxTx ??: 階段指標(biāo)函數(shù) 對應(yīng)于某一階段狀態(tài)和從該 狀態(tài)出發(fā)的決策的某種指標(biāo)度量。記為 ), . . .,(11, nnkkkknk uxuxuxV ??,最優(yōu)策略值記為 nkkk Vxf ,m a x ( m in ))( ?7.動態(tài)規(guī)劃基本方程: 過程指標(biāo)函數(shù)是各階段指標(biāo)函數(shù) 的函數(shù)。問該衛(wèi)隊?wèi)?yīng)往各部位分別派多少人巡邏才能使預(yù)期損失最??? A B C D 2人 3人 4人 18 14 10 38 35 31 24 22 21 34 31 25 把 12人派往 4個部位看作 4個階段( k=1,2,3,4),每個階段初可派遣的人數(shù)是前面階段決策的結(jié)果,也是本階段決策的依據(jù)。 例 5.求從 A點到 G點的最段路線 解:從 A到 G分六個階段: AB,BC,CD,D E,EF,FG ( 1)第六階段 FG最短路 3)(,4)(2616 ?? FfFf例 2 ( 2)第五階段 EG最短路 7}35,43m i n {)}(