freepeople性欧美熟妇, 色戒完整版无删减158分钟hd, 无码精品国产vα在线观看DVD, 丰满少妇伦精品无码专区在线观看,艾栗栗与纹身男宾馆3p50分钟,国产AV片在线观看,黑人与美女高潮,18岁女RAPPERDISSSUBS,国产手机在机看影片

正文內(nèi)容

優(yōu)化理論課件(變分法與最優(yōu)控制理論)(編輯修改稿)

2024-07-21 17:17 本頁面
 

【文章內(nèi)容簡介】 及最大值原理(一階必要條件). y(0)=A,y(T)自由, 假定F和f關于其變量是連續(xù)的,且具有關于t和y的一階偏導。 令漢密爾頓函數(shù)H(t, y, u, λ)=F(t, y, u)+λ(t)f(t, y, u) 其中,λ為共態(tài)變量,實際上F前面還應有一個非負系數(shù),一般都為正,所以容易標準化。優(yōu)化問題的一階條件為:(i)對所有(ii)(也就是y的運動方程)(iii)(iv)(橫截條件)例1: 其中A和T給定,而終結狀態(tài)自由。其漢密爾頓函數(shù)為: H是非線性且可微的,u要最大化H,于是一階條件為: 可得 檢驗二階條件 可見,我們要求出u必須先求出λ,由可知λ是不變常數(shù),那么根據(jù)橫截條件得λ*(t)=0。從而,u*(t)=0。又由知y也是常數(shù),且由初始點y(0)=A,可知y*(t)=A。 接下來,我們看一個碰碰解的例子:例2:. y(0)=4,y(2)自由 解:漢密爾頓函數(shù)為H=2y3u+λ(y+u)=(2+λ)y+(λ3)u因為H關于u是線性的,u要最大化H,取決于系數(shù)符號,有因為u的取值取決于λ,所以我們要分析λ的取值。由,可知,通解為,k為任意常數(shù)。根據(jù)橫截條件,得。這是一個減函數(shù),且可取值3,令λ(τ)=3,解得。于是有 于是,在第一階段,有,且y(0)=4,解之得。 在第二階段,有,且作為初始點,解得。(2)最大值原理的理論基礎及其橫截條件 為簡化問題,我們假設u*是內(nèi)部解,因此maxH這一條件就簡化為=0。在推導最大值一階條件的同時,我們還可以得到相應的橫截條件。. y(0)=y0,y(T)和T自由 因為y的運動始終服從方程,所以在[0, T]上,始終滿足。于是,有 令 因為漢密爾頓函數(shù)為H(t, y, u, λ)=F(t, y, u)+λ(t)f(t, y, u),所以有 將等式右邊第二項分部積分: 將其重新加回目標泛函中:可見,的值取決于y,u,yT,T和。但是,只要運動方程一直滿足,則的取值不應該對目標泛函有任何影響,參見最初的目標泛函。因此,我們后面考慮對最優(yōu)路徑的“擾動”時,不考慮對的“擾動”。這意味著,我們的所有推導都是基于運動方程的成立,也即。假設已知u*和y*,對u施加擾動,則根據(jù)運動方程,y也會產(chǎn)生對y*的偏離:則(想想這里當趨近零,u趨近u*,而y趨近y*,是由什么條件保證的?)接下來考慮對終結時刻和終結狀態(tài)的“擾動”:以及這意味著和 代入目標泛函,于是目標泛函可以變?yōu)榈囊粋€函數(shù): 最優(yōu)路徑意味著,于是目標泛函對求導,等式右邊積分部分的導數(shù)為:其中第二項可以寫開,其中,該項可以和下面推導部分相加而抵消。目標泛函等式右邊最后一項是常數(shù)求導為零,第二項求導為: 將以上部分加總整理,得一階條件為: 因為p,q,和是任意的,只能要求三項分別為零。由此,我們可以導出最大值原理中的和。再加上運動方程是整個推導的基礎,所以一階條件還應包含。垂直終結線問題中,所以橫截條件為。(i)固定端點問題:因為終結點固定,所以p(t)不能真正任意,因為要保證u控制y穿越固定終結點。于是,我們會擔心一階條件能否推出。(為什么?)可以證明,固定端點問題一階條件不變,只需要將橫截條件替換為y(T)=yT,T和yT給定。(ii)水平終結線問題:(iii)終結曲線問題:由,于是有,將其帶入一般性橫截條件,可得。于是,橫截條件為。(iv)截斷的垂直終結線問題:T固定,但是要求。于是有兩種情況,第一種約束條件自然滿足,即且;第二種約束條件是緊的。在這種情況下,對y的路徑擾動不能在其下方,給定q0這要求。那么,無約束極值問題變成一個帶有非負約束的極值問題。那么,根據(jù)庫恩塔克條件,將會變成,從而會產(chǎn)生一個不等式的橫截條件:。因為,所以,于是要求在時。 從而,我們可以得到以下綜合形式:,(v)截斷的水平終結線問題:yT固定,但要求T*≤Tmax。根據(jù)類似的推理,有,(3)自控問題的漢密爾頓函數(shù)不變性 自控問題指的是F和f中沒有時間t作為變量,這意味著整個系統(tǒng)是自行內(nèi)生運動而和沒有隨時間而進行的外生變化。這種系統(tǒng)有個特點,漢密爾頓函數(shù)在最優(yōu)路徑上取值時其值為不變常數(shù)。漢密爾頓函數(shù)對時間求導為: 最優(yōu)路徑的一階條件為:, 從而可得在水平終結線問題中,橫截條件為,而H*是常數(shù),這意味著H*(t)=0。(4)推廣到多變量. … 漢密爾頓函數(shù)為: 或者,寫成向量形式:,一階條件為(i),即m個u仍然是要最大化H。(ii),j=1,…,n,n個狀態(tài)變量的運動方程(iii),j=1,…,n,n個共態(tài)變量的運動方程也一樣(iv)一般性橫截條件: 如果T自由: 如果自由: 如果和,從而有和,一般性橫截條件變?yōu)? 如果是截斷的垂直終結線:, 如果是階段的水平終結線:,(三)最大值原理的經(jīng)濟學解釋及現(xiàn)值的漢密爾頓函數(shù)(1)最大值原理的經(jīng)濟學解釋 故事:企業(yè)在[0, T]上最大化利潤,狀態(tài)變量為資本存量K,控制變量u代表企業(yè)的商業(yè)決策,u影響K的變化。初始資本存量為K0,終結狀態(tài)不定。每一時刻的利潤函數(shù)為。于是,優(yōu)化問題為. K(0)=K0,K(T)不定,T給定 我們首先要說明,實際上是一個類似于拉格朗日乘子的“影子價格”。我們用之前構造的“新”目標泛函,并在最優(yōu)路徑上取值,以進行說明。 上式關于初始和終結資本存量求導得:和。可見,意味著某一時刻的資本存量對總體利潤(目標泛函)的影響。一般為了保證在過程中為正,將其寫作,而不是。 等式左邊第一項是決策u下的當前利潤,而f是u決策下的資本存量瞬時變動,這個變動乘以,即當前資本存量對總體利潤的影響,意味著第二項代表的是當前決策u對未來利潤的瞬時影響。因此,決策u的作出,要考慮到當前利潤和未來利潤的權衡。這也就是為什么最大值原理中要求u最大化H,我們把一階條件寫作:即這意味著,最優(yōu)時決策u對當前利潤的增加等于對未來利潤的減少。垂直終結線的橫截條件意味著,最優(yōu)決策要使得在規(guī)定的結束時刻,資本得到充分運用,從而沒有任何價值。而截斷的垂直終結線問題中,如果約束是緊的,則橫截條件為。這意味著,為了滿足最后剩余的資本存量要求,資本并沒有充分運用。而在水平終結線問題中,橫截條件為。這是因為,追求總體利潤最大化,但結束時間上沒有要求,從而我們要盡可能經(jīng)營到無法再產(chǎn)生利潤為止,即資本存量使得當前利潤與未來利潤的和為零時。 最大值原理還包含兩個運動方程,狀態(tài)變量的運動描述的是控制變量如何影響狀態(tài)變量,而共態(tài)變量的運動方程可以寫為 這等價于,這意味著資本影子價格下降的速度要等于資本對當前利潤和未來利潤貢獻的速度。(2)現(xiàn)值的漢密爾頓函數(shù) 經(jīng)濟學中常有被積部分包含貼現(xiàn)因子的情況,即。于是,優(yōu)化問題寫作:. 和邊界條件 漢密爾頓函數(shù)為,因為貼現(xiàn)因子會出現(xiàn)在很多一階條件中,增加了復雜性,我們想辦法簡化。重新定義“現(xiàn)值的拉格朗日乘子”為,從而有現(xiàn)值的漢密爾頓函數(shù) 因為上述形式隱含了和,所以一階條件很容易轉換。變?yōu)? 變?yōu)椋ū举|(zhì)上都是)因為和,所以變?yōu)? 橫截條件變?yōu)楹停ㄋ模┏浞謼l件(二階條件)(1)曼加薩林定理對于最優(yōu)控制問題:. y(0)=y0,y(T)和T自由 如果(i)F和f函數(shù)可微,且關于變量(y,u)是聯(lián)合凹的,(ii)并且最優(yōu)解對于t∈[0, T],若f關于y或u非線性,滿足λ(t)≥0(若f關于y和u是線性的,則不需要),那么最大值原理的必要條件對于最大化V也是充分的。證明:給定漢密爾頓函數(shù)H=在最優(yōu)控制路徑u*上(同時y在y*上,在*上),應滿足:即此外,根據(jù)共態(tài)變量運動方程,有即 進一步假設這是個垂直終結線問題,下面的推導將用到其初始條件和橫截條件:y(0)=y0以及于是,因為F和f關于(y, u)是凹的,那么對于不同的兩點(t, y, u)(t, y*, u*)有:對以上第一式進行積分,有:=(不等號右邊的被積部分中的兩項偏導代入前面的推導)其中,被積部分第一項可分部積分如下:(想想為什么乘積項等于零) 將上式重新代回,可得由于,所以當λ*≥0時。(想想為什么若f關于y和u是線性的,則不需要?) 當然,上述定理中,如果F和f是嚴格凹的,則最大值唯一。另外,必須要提的是,雖然該定理的證明是基于垂直終結線,但是實際上對于具有固定終結狀態(tài)和截斷的垂直終結線問題都是適用的。因為垂直終結線的橫截條件所起的作用僅僅是在分部積分中使得乘積項為零,固定終結狀態(tài)也會使得該結論成立,截斷的垂直終結線就更不用說了。(試一試,看看為什么?此外,如果是水平終結線問題呢?需要添加什么條件?提示:垂直終結線問題的橫截條件在分部積分中起了什么作用?)(2)阿羅條件在任意時刻,只要給定狀態(tài)變量和共態(tài)變量,總是存在一個特定的u*最大化漢密爾頓函數(shù)H。所以,有u*=u*(t, y, λ),將其帶入漢密爾頓函數(shù),得到在該條件下的最大化的漢密爾頓函數(shù)H0(t, y,
點擊復制文檔內(nèi)容
環(huán)評公示相關推薦
文庫吧 www.dybbs8.com
備案圖片鄂ICP備17016276號-1