【正文】
③①②③構(gòu)成該問題的動態(tài)規(guī)劃模型。4 動態(tài)規(guī)劃在經(jīng)濟尤其工業(yè)中的應(yīng)用 生產(chǎn)計劃問題對于生產(chǎn)計劃一類問題,階段按計劃時間自然劃分,狀態(tài)定義為每階段開始時的儲存量,決策為每階段的產(chǎn)量,即每個階段的需求量(已知量)為,則狀態(tài)轉(zhuǎn)移方程為,設(shè)每階段開工的固定成本費為a,生產(chǎn)單位數(shù)量產(chǎn)品的成本費為b,每階段單位數(shù)量產(chǎn)品的儲存費為c,階段指標(biāo)為階段成本和儲存費之和,即 ①指標(biāo)函數(shù)為之和。具體地說,如果一個問題被劃分各個階段之后,階段 I 中的狀態(tài)只能由階段 I+1 中的狀態(tài)通過狀態(tài)轉(zhuǎn)移方程得來,與其他狀態(tài)沒有關(guān)系,特別是與未發(fā)生的狀態(tài)沒有關(guān)系,這就是無后效性[7]。 動態(tài)規(guī)劃的無后效性原則所謂無后效性原則,指的是這樣一種性質(zhì):某階段的狀態(tài)一旦確定,則此后過程的演變不再受此前各狀態(tài)及決策的影響。推論:若允許策略是最優(yōu)策略,則對任意的k,0kn1,它的子策略對于為起點的k到n1子過程來說必是最優(yōu)策略(注意:k段狀態(tài)是由和確定的)。當(dāng)V是效益函數(shù)時,opt取max。最優(yōu)性原理:設(shè)階段數(shù)為n的多階段決策過程,其階段編號為。 下面介紹動態(tài)規(guī)劃的最優(yōu)性原理和其無后效性。對一個實際問題建立動態(tài)規(guī)劃模型時,必須做到下面五點:(一)根據(jù)實際情況將問題過程化成適當(dāng)?shù)碾A段;(二)正確選擇變量,使他既能描述過程的演變,又要滿足無后效性;(三)正確確定決策變量及每階段的允許決策集合;(四)正確寫出狀態(tài)轉(zhuǎn)移方程;(五)正確寫出指標(biāo)函數(shù)的關(guān)系,它應(yīng)滿足下面三個性質(zhì):①是定義在全過程和所有后部子過程上的數(shù)量函數(shù);②要具有可分離性,并滿足遞推關(guān)系,即③函數(shù)對于變量要嚴(yán)格單調(diào)。不少實際問題在取其自然特征作為狀態(tài)變量往往不能滿足這條件,這就降低了動態(tài)規(guī)劃的通用性。還有應(yīng)用的局限性。當(dāng)然動態(tài)規(guī)劃方法也有不足之處:到目前為止,還沒有一個統(tǒng)一的標(biāo)準(zhǔn)模型可以應(yīng)用到所有問題。而每個子問題是一個比原問題簡單得多的優(yōu)化問題。 動態(tài)規(guī)劃的優(yōu)缺點動態(tài)規(guī)劃的方法有兩個明顯的優(yōu)點,與窮舉法相比:(1)計算量得到大大減少(2)計算結(jié)果得到豐富在一定條件下找到一種途徑,在對各階段的效益經(jīng)過按問題具體性質(zhì)所確定的運算以后,使得全過程的總效益達(dá)到最優(yōu),這就是動態(tài)規(guī)劃最優(yōu)化。其求解過程,根據(jù)邊界條件,從開始,由前向后順推,逐步可求得各段的最優(yōu)決策和相應(yīng)的最優(yōu)值,最后求出時,就得到整個問題的最優(yōu)解[4]。指標(biāo)函數(shù)也應(yīng)換成以和的函數(shù)表示。上述即為動態(tài)規(guī)劃逆序解法的基本方程,根據(jù)邊界條件,從開始,由后向前逆推,從而逐步可求得各段的最優(yōu)決策和相應(yīng)的最優(yōu)值,最后求出時,即得到整個問題的最優(yōu)解。即如果用表示初始狀態(tài)為的后部子過程所有子策略中的最優(yōu)子策略。當(dāng)初始狀態(tài)給定時,過程的策略就被確定,則指標(biāo)函數(shù)就被確定了。他顯然是滿足指標(biāo)函數(shù)三個性質(zhì)的。組合起來就有離散確定型、離散隨機型、連續(xù)確定型、連續(xù)隨機型四種決策過程模型。 動態(tài)規(guī)劃模型的分類及方法根據(jù)多階段決策過程的時間變量是連續(xù)性的還是離散性的變量,過程分為連續(xù)決策過程和離散決策過程。,由于初始狀態(tài)已知,而每段的決策都是該段狀態(tài)的函數(shù),故最優(yōu)策略所經(jīng)過的各段最優(yōu)狀態(tài)便可逐次變換得到,從而確定了最優(yōu)策略。,與各段的最優(yōu)選擇答案一般不同。下面我們來了解動態(tài)規(guī)劃的靈魂即它的基本思想。這個值既與的狀態(tài)值有關(guān),又與以后所選策略有關(guān),它是兩者的函數(shù)值。階段指標(biāo)函數(shù)指對應(yīng)某一階段和從該階段出發(fā)的一個階段決策的某種效益量,用 表示。此方程是確定過程由一狀態(tài)到另一狀態(tài)的演變過程。:若給定第 k 階段狀態(tài)變量的值,如果該階段的決策變量一經(jīng)確定,第 k+1 階段的狀態(tài)變量的值也就確定,即的值隨和的值變化而變化。有.:策略是一個按順序排列的決策組成的集合。在實際問題中,決策變量的取值往往限制在某一范圍之內(nèi),此范圍稱為允許決策集合。:決策是當(dāng)過程處于某階段的某個狀態(tài)時可做出的選擇或決定。用表示第k階段的狀態(tài)變量。階段的劃分一般是根據(jù)空間和時間的自然特征來劃分。 基本概念1.階段:把所給問題的過程恰當(dāng)?shù)姆殖蓭讉€相互聯(lián)系的有順序的環(huán)節(jié),這些環(huán)節(jié)即稱為階段 。這種遞推歸結(jié)的過程,稱為“不變嵌入”。各子問題與原問題具有完全相同的結(jié)構(gòu),其每一階段的最優(yōu)解問題可以遞歸地歸結(jié)為下一階段各個可能狀態(tài)的最優(yōu)解問題。其每一階段都有相應(yīng)的“狀態(tài)”與之對應(yīng),我們把描述狀態(tài)的量稱為“狀態(tài)變量”。2 動態(tài)規(guī)劃的相關(guān)概念 基本特征動態(tài)規(guī)劃問題具有下列基本特征:整個階段可以按空間劃分,也可以按時間人為劃分。所以,可以把一個問題按階段分解成為多個相互聯(lián)系的子問題,而每個子問題均是比原問題簡單得多的一個優(yōu)化問題,并且每個子問題的求解中僅僅只利用它的下一階段子問題的優(yōu)化后的結(jié)果,經(jīng)依次求解,最后可以求出原問題的最優(yōu)解[1]。利用最優(yōu)化原理可以把要處理的多階段決策問題的求解過程看做是一個連續(xù)的遞推過程,由前向后或者由后向前逐步推算。最優(yōu)化原理是由美國人貝爾曼(Bellman)最先提出來的。許多優(yōu)化問題可以利用動態(tài)規(guī)劃的方法來處理,常有其獨特的優(yōu)越性。 Updating 1 相關(guān)背景動態(tài)規(guī)劃是一種可以將復(fù)雜問題轉(zhuǎn)化成一系列比較簡單的問題的最優(yōu)方法,其簡稱DP法。 Optimal principle。關(guān)鍵詞: 動態(tài)規(guī)劃;最優(yōu)性原理;經(jīng)濟;生產(chǎn)計劃;設(shè)備更新中圖分類號:Dynamic ProgrammingAbstract: The dynamic programming is a branch that it is multistage decisionmaking process of solving a mathematical optimization method. The socalled dynamic refers to the multistage in the decisionmaking, according to a particular sequence, every step of the decisionmaking choice, the state will immediately cause th