正文內(nèi)容

進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型研究(編輯修改稿)

2025-07-07 01:45 本頁面

　

【文章內(nèi)容簡介】（4）Q學(xué)習(xí)是一種模型無關(guān)的強(qiáng)化學(xué)習(xí)算法。Q學(xué)習(xí)不估計環(huán)境模型，直接優(yōu)化一個可迭代計算的Q函數(shù)。Q值的修正公式如下式：（5）哪些量是黑斜體？都不是黑斜體，Q(s,a)是后面公式（12）矩陣的一個元素，一般斜體表示式中為當(dāng)前狀態(tài)，為狀態(tài)下可執(zhí)行的動作，為后續(xù)狀態(tài)，為狀態(tài)下可執(zhí)行的動作，為獎賞，為學(xué)習(xí)率，為折扣率。在已知有限離散狀態(tài)和行為空間Markov決策過程的狀態(tài)集S、行為集A和目標(biāo)函數(shù)的情況下，可以以表格形式存儲行為值函數(shù)估計值Q（s, a）及行為選擇策略。2 進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型由狀態(tài)、動作、Agent、環(huán)境、獎賞函數(shù)和Q學(xué)習(xí)組成。進(jìn)港航班排序強(qiáng)化模型中的狀態(tài)是各進(jìn)港航班的到達(dá)時刻，航班的預(yù)計到達(dá)時刻為初始狀態(tài)。航班所有可分配的到達(dá)時刻構(gòu)成狀態(tài)集。動作是對航班到達(dá)時間的調(diào)整。在滿足機(jī)場到達(dá)容量和進(jìn)港航班不能提前降落的限制下，動作對狀態(tài)進(jìn)行調(diào)整。在航班當(dāng)前狀態(tài)所有可行的調(diào)整構(gòu)成了動作集。 Agent和環(huán)境進(jìn)港航班排序的主體是Agent，Agent之外，與之交互的是環(huán)境。Agent與環(huán)境之間的交互是持續(xù)不斷的，Agent對航班的到達(dá)時刻進(jìn)行調(diào)整，環(huán)境對動作做出反應(yīng)，一個新的到達(dá)時間和獎賞值傳給Agent。獎賞函數(shù)進(jìn)港航班排序的目標(biāo)是使進(jìn)港航班總延誤時間最少、延誤成本最小、對后續(xù)航班影響最小，基于這3個目標(biāo)建立進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型的獎賞函數(shù)。延誤時間最少（6）式中，為航班集合，為航班分配的到達(dá)時間，為航班預(yù)計到達(dá)時間，航班延誤為1，否則為0。延誤成本最小（7）式中，為航班集合，為航班分配的到達(dá)時間，為航班預(yù)計到達(dá)時間，航班延誤為1，否則為0，為航班延誤單位成本。后續(xù)航班影響最小（8）式中，為航班集合，航班有后續(xù)航班時為1，否則為0；為航班延誤單位成本；航班延誤為1，否則為0；為航班分配的到達(dá)時間，為航班預(yù)計到達(dá)時間。約束條件：（9）航班不能提前降落，分配的到達(dá)時間不早于計劃的到達(dá)時間。（10）進(jìn)港航班流量不能超過機(jī)場的到達(dá)容量值。根據(jù)目標(biāo)函數(shù)和約束約束條件確定的獎賞函數(shù)為：（11）式中，是獎賞函數(shù)，是延誤總時間，是延誤總成本，是后續(xù)航班延誤成本，和為權(quán)重，和為1。 Q學(xué)習(xí)進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型的狀態(tài)集S、動作集A和目標(biāo)函數(shù)均已知，以矩陣表示智能體所學(xué)到的知識，當(dāng)矩陣達(dá)到收斂狀態(tài)，滿足整個學(xué)習(xí)條件，終止學(xué)習(xí)。表示狀態(tài)，表示動作，是狀態(tài)為動作為根據(jù)Q值修正公式得到的最大Q值。（12）3 模型驗證與分析選用成都雙流機(jī)場19：00至20：00之間的20架進(jìn)港航班進(jìn)行模型驗證，如表1所示。表1中列出了進(jìn)港航班的航班號、機(jī)型、尾流類型、是否有后續(xù)航班，1表示有后續(xù)航班，0表示沒有；ETA表示航班的預(yù)計到達(dá)時間。表1 進(jìn)港航班數(shù)據(jù) The data of arrival flights編號航班號機(jī)型尾流后續(xù)航班ETA13U8886A321M119:002CA1407789H119:003EU2710A320M019:054CA4506A321M119:055EU2720A320M119:1063U8964A320M019:157FM9549A330M119:158JD5136A320M119:209MF8447B737M119:2510CA408A319M019:2511MU5864B737M019:25129C8664A320M119:25133U8668A320M119:3014CA4404A319M119:3015NS3209B737M119:35163U8704A321M119:35173U8734A320M119:40183U8858A320M119:40198L9606B737M019:4520EY818A330M119:45不同尾流類型的飛機(jī)的延誤成本不同，重型機(jī)延誤成本設(shè)置為4000元/h，中型機(jī)延誤成本3000元/h，輕型機(jī)延誤成本200元/h。機(jī)場的到達(dá)容量為20架/h。先到先服務(wù)算法和強(qiáng)化學(xué)習(xí)方法的進(jìn)港航班順序如表2所示，ETA表示航班預(yù)計到達(dá)時間，CTA表示分配的到達(dá)時間。先到先服務(wù)算法和強(qiáng)化學(xué)習(xí)方法的進(jìn)港航班的延誤時間、延誤成本、后續(xù)航班延誤成本，總的延誤時間、總的延誤成本、總的后續(xù)航班延誤成本如表3所示。進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型的權(quán)重設(shè)為1/3，先到先服務(wù)算法的獎賞函數(shù)值為3164，強(qiáng)化學(xué)習(xí)算法的獎賞函數(shù)為2880。進(jìn)港航班排序強(qiáng)化算法的總延誤成本、后續(xù)總延誤成本更低，獎賞函數(shù)值更小，實際運行效率更高。表2 進(jìn)港航班排序結(jié)果 The result of arrival flights Scheduling編號航班號ETAFCFS強(qiáng)化學(xué)習(xí)CTA排序CTA排序13U888619:0019:00119:0322CA140719:0019:03219:0013EU271019:0519:06319:0944CA450619:0519:09419:06

點擊復(fù)制文檔內(nèi)容

教學(xué)教案相關(guān)推薦

化學(xué)研究性學(xué)習(xí)報告-資料下載頁

【總結(jié)】化學(xué)研究性學(xué)習(xí)報告組長：楊挺組員：鄭以孜林方周晨艷林甜甜序近年來，許多國家都在耗費巨資治理大氣污染，并已取得一定成效。但令人不安的是，現(xiàn)代人在“煤煙型”、“光化學(xué)煙霧型”污染后，正在進(jìn)入以“室內(nèi)空氣污染”為標(biāo)志的第三污染時期。大量調(diào)查資料

2025-01-13 11:01

化學(xué)研究型學(xué)習(xí)總結(jié)-資料下載頁

【總結(jié)】第一篇：化學(xué)研究型學(xué)習(xí)總結(jié) 我小組研究性學(xué)習(xí)的課題名稱為《文科生如何才能通過化學(xué)會考》，選擇該課題的初衷在于當(dāng)時正面臨著會考的壓力，而且文科生的化學(xué)成績總體不容樂觀，所以便和身邊的同學(xué)討論，是否研究...

2025-10-08 14:04

化學(xué)研究性學(xué)習(xí)報告-資料下載頁

2025-09-30 15:20

化學(xué)研究性學(xué)習(xí)報告-資料下載頁

【總結(jié)】第一篇：化學(xué)研究性學(xué)習(xí)報告大氣污染與人體健康指導(dǎo)老師：蘭東平組長：司雯組員:郝文娟，申玉培，司雯，王茹，趙陽陽，李瑤，續(xù)盼盼，吳怡宣。古往今來，地球媽媽用甘甜的乳汁哺育了無數(shù)代子孫...

2025-10-04 12:15

平潭進(jìn)港航道施工招標(biāo)定稿-資料下載頁

【總結(jié)】福州港平潭港區(qū)進(jìn)港航道（金井航道）工程施工招標(biāo)招標(biāo)文件招標(biāo)人：平潭綜合實驗區(qū)交通投資發(fā)展有限公司（蓋單位章）招標(biāo)代理人:江蘇交通工程投資咨詢有限公司(蓋單位章)2020年7月福州港平潭港區(qū)進(jìn)港航道（金

2025-09-07 08:38

插入排序交換排序選擇排序歸并排序基數(shù)排序-資料下載頁

【總結(jié)】n插入排序插入排序n交換排序交換排序n選擇排序選擇排序n歸并排序歸并排序n基數(shù)排序基數(shù)排序排序問題定義給定一組紀(jì)錄R1,R2,········,Rn其關(guān)鍵碼分別為k1,k2,······

2025-07-19 02:58

基于零件加工問題的0-1規(guī)劃排序優(yōu)化模型-資料下載頁

【總結(jié)】浙江師范大學(xué)數(shù)學(xué)建模競賽培訓(xùn)：基于零件加工問題的0-1規(guī)劃排序優(yōu)化模型基于零件加工問題的0-1規(guī)劃排序優(yōu)化模型摘要零件加工排序問題為運籌學(xué)的排序問題，有各種不同的模型和不同的目標(biāo)函數(shù)[1]。本文討論的是零件加工流水作業(yè)(Flow-shop)排序排列問題，參考已有的零件加工4參量表示法[2]，給出了添加上“限制”的5參量表示法：（—零件數(shù)；—機(jī)器數(shù)，—有無限制，—目標(biāo)函數(shù)）。

2025-08-10 15:25

航班售票管理系統(tǒng)—免費-資料下載頁

【總結(jié)】畢業(yè)論文航班售票管理系統(tǒng)院系計算機(jī)科學(xué)與技術(shù)學(xué)院專業(yè)應(yīng)用與維護(hù)班級學(xué)號　　　　　　學(xué)生姓名　　　　　聯(lián)系方式:　

2024-12-06 03:20

廉價航班能飛多遠(yuǎn)-資料下載頁

【總結(jié)】案例分析：廉價航班能飛多遠(yuǎn)國際油價逼近100美元大關(guān)，國內(nèi)各航空公司的旅客燃油附加費這兩天也開始全線上調(diào)，然而，就在不少旅客擔(dān)心，隨著原油價格上漲，機(jī)票價格會不會也跟著水漲船高的時候，市面上各種低價機(jī)票反倒卻越來越多，它們低到了什么程度，可能你想都不敢想?！　∽w機(jī)只花1塊錢？　　陳志飛：“1元錢的飛機(jī)票，沒人相信，到現(xiàn)在還沒人相信。”　　去年的一天，陳志飛在互聯(lián)網(wǎng)上閑逛的

2025-06-28 18:07

九年級化學(xué)樣學(xué)習(xí)和研究化學(xué)-資料下載頁

【總結(jié)】第三節(jié)怎樣學(xué)習(xí)和研究化學(xué)一：學(xué)習(xí)化學(xué)需要進(jìn)行化學(xué)實驗在老師的指導(dǎo)下，參照P18頁圖示，四人一組完成研究“銅綠”的兩個實驗，并填寫實驗報告。（教師作簡單介紹并巡視）實驗步驟實驗現(xiàn)象實驗結(jié)論1:“銅綠”和鹽酸的作用2:

2025-11-01 04:58

機(jī)場航班運行保障標(biāo)準(zhǔn)-資料下載頁

【總結(jié)】機(jī)場航班運行保障標(biāo)準(zhǔn)1?為了規(guī)范航班運行保障,提高運行效率,促進(jìn)航班正常,制定本標(biāo)準(zhǔn)?！　??本標(biāo)準(zhǔn)適用于機(jī)場航班運行保障工作?！　??定義　　?機(jī)型分類:　　?C類航班空器:翼展24米(含)-36米,主起落架外輪間距6米(含)-9米,如B737系列、A320系列等?！　?D類航空器:翼展36米(含)-52米,主

2025-08-09 17:02

航班延誤論word版-資料下載頁

【總結(jié)】近日，上海浦東和廣州白云機(jī)場先后發(fā)生了旅客為了維權(quán)而阻攔飛機(jī)的事件。一時間，關(guān)于航班延誤的話題吵得沸沸揚揚。筆者以“航班延誤”關(guān)鍵詞上網(wǎng)搜索，谷歌找到了714萬條相關(guān)信息，而百度找到了745萬條相關(guān)信息。據(jù)2022年航空服務(wù)消費者調(diào)查報告，中國有超過7成的消費者遭遇過航班延誤。隨著中國民用航空業(yè)的快速增長，航班延誤的次數(shù)也在快速增長。

2025-01-08 08:36

空運貨物進(jìn)港操作手冊-理貨-資料下載頁

【總結(jié)】1．理貨（w/hairsideandw/hphysicaloperation）什么是理貨？在航班進(jìn)港后，參考國外UPSGTWY或其它航空公司提供的FFM報或進(jìn)港隨機(jī)艙單，根據(jù)不同的總運單號將進(jìn)港板箱或散貨車進(jìn)行分解，然后考慮到貨物是否有特殊屬性后將貨物存放與之相對應(yīng)的存放區(qū)域的過程，我們稱之為理貨。．1FFM報（FlightForwarding

2025-08-05 10:46

黨建年終工作總結(jié)與黨建憂患強(qiáng)化學(xué)習(xí)材料匯編-資料下載頁

【總結(jié)】黨建年終工作總結(jié)與黨建憂患強(qiáng)化學(xué)習(xí)材料匯編第4頁共4頁黨建年終工作總結(jié),黨建年終工作總結(jié)范文黨支部在鎮(zhèn)黨委、政府的領(lǐng)導(dǎo)下，在村支兩委一班人的共同努力下，帶領(lǐng)全村廣大黨員干部認(rèn)真...

2024-11-22 02:09

高強(qiáng)化學(xué)螺栓施工技術(shù)-資料下載頁

【總結(jié)】高強(qiáng)化學(xué)螺栓施工技術(shù)一、特點1、施工溫度范圍較寬，可在-5℃～40℃溫度之間施工。2、無膨脹力錨固，對基材不產(chǎn)生擠壓力，適用于各種基材。3、螺栓間距、邊距小，適用于空間狹小處。4、安裝操作便利，安裝后能迅速固結(jié)。有較高的承載力。5、錨固厚度較大。二、適用范圍1、適用于普通混凝土強(qiáng)度等級大于或等于C15（未開裂混凝土）。致密的天然石材。2、用于固定

2025-08-09 17:05