【正文】
另一個(gè)系統(tǒng)被安裝在北 威斯特法倫州 的高速公路上, 它使用了 的感應(yīng)線圈來預(yù)測(cè) 6000 千米的道路交通。 通過舉例說明這種信息的速度要快于實(shí)時(shí)模擬系統(tǒng), 預(yù)測(cè)實(shí)際的交通就能被做到。 從這些裝置中,這段路進(jìn)入和離開的車輛數(shù)量的信息能被獲得。 每個(gè)代理都有兩層控制:一個(gè)是(簡(jiǎn)單的)駕駛決定,另一個(gè)是類似于路徑選擇的決定戰(zhàn)術(shù)策略。 應(yīng)用于真實(shí)生活情況的交通預(yù)測(cè)模型被描述在 [Wahle and Schreckenberg, 2021]。一個(gè)多感知層 [Rumelhart et al., 1986]被訓(xùn)練來預(yù)測(cè)下一個(gè)時(shí)間 步長(zhǎng)的排隊(duì)長(zhǎng)度,長(zhǎng)期預(yù)測(cè)可以由迭代法一步預(yù)測(cè)制成。 另外,如果我們能準(zhǔn)確的預(yù)測(cè)不同駕駛策略的后果,一個(gè)優(yōu)化決定(或者至少對(duì)這個(gè)區(qū)間路段的優(yōu)化預(yù)測(cè))就能通過預(yù) 測(cè)結(jié)果進(jìn)行比較。 預(yù)測(cè)交通 對(duì)于優(yōu)化控制來說,預(yù)測(cè)交通條件的能力是重要的 。利用這一數(shù)量,在研究的區(qū)域內(nèi),不同信息系統(tǒng)的影響能被仿真出來。在調(diào)查中,采取了一個(gè)擁擠的走廊,選擇了有影響因素的路線和 起飛時(shí)間來 研究。此外,不同的代理有不同的傳感器、目標(biāo)、行為和學(xué)習(xí)能力, 利用異構(gòu)多代理系統(tǒng), 從而使我們利用一個(gè)非常廣泛的(微觀)交通模型去實(shí)驗(yàn) 。他利用自己的傳感器接收來自環(huán)境的信息,對(duì)這些來自環(huán)境的信息產(chǎn)生信任,利用這些信任,輸入信號(hào)來選擇一個(gè)行動(dòng)。一個(gè)更先進(jìn)的交通仿真和優(yōu)化方法是認(rèn)知多代理系統(tǒng)方式( CMAS),這些代理互相作用并且與其他代理和基礎(chǔ)設(shè)施相溝通。 實(shí)驗(yàn)表明,在單一路段上,當(dāng)交通密度增加時(shí),元胞自動(dòng)機(jī)模型的現(xiàn)實(shí)行為會(huì)以起始波浪那樣的形式出現(xiàn)。 萬(wàn)一如果車速較慢的車行駛在前面,那么車輛的速度將會(huì)降低,避免沖撞。Nagel and Schreckenberg (1992)描述了這種用于交通仿真的元胞自動(dòng)機(jī)模型。例如,一個(gè)道路細(xì)胞可以包含一輛汽車或者也可以是空的。一個(gè)在基礎(chǔ)設(shè)施上的具體設(shè)計(jì)和仿真(簡(jiǎn)單的)汽車駕駛規(guī)則,利用了元胞自動(dòng) 機(jī) ( CA) 。 根據(jù)這些規(guī)則,當(dāng)很多車輛互相作用時(shí),不同種類的行為就會(huì)出現(xiàn) 。一個(gè)微觀模型由一組車輛占據(jù)的基礎(chǔ)設(shè)施組成。 盡管宏觀模型可以來模擬一些特定的可調(diào)驅(qū)動(dòng)行為,但是他們不能提供一個(gè)直接的、靈活的建立和優(yōu)化交通的方法,這使他們不太適合我們的研究。 這些方程式可以延長(zhǎng)積累和放松壓力 , 歸因于類似 的 停停走走的交通和 自發(fā)的擁堵 的 現(xiàn)象 。有兩種普遍的方法去建立交通:宏觀和微觀模型。 建立交通 與交通動(dòng)力學(xué)僅有的相似之處是,例如,流體力學(xué)和管內(nèi)的沙子 。后來 ,我們描述 信息是如何作為一種控制交通的手段來進(jìn)行溝通的 ,在這樣的交通條件下,溝通產(chǎn)生了什么樣的影響 。在這部分中 ,我們將首先描述兩種 常用于交通 模型的技術(shù) 。 在本文中 ,我們主要 對(duì)車流的優(yōu)化感興趣 ,從而有效減少平均運(yùn)行 (或者等待 )的車輛次數(shù)。其主要目標(biāo)是 : 提高安全 性、 減少 運(yùn)行時(shí)間、增加基礎(chǔ)設(shè)施的能力 。 [TenT expert group on ITS, 2021, 白皮書 , 2021, EPA98, 1998]。 2 建立和控制交通 在這一部分,我們專注于在交通運(yùn)輸方面所使用的信息技術(shù)。第五部分描述了我們實(shí)驗(yàn)中所使用的仿真器,以及第六部分給出我們的實(shí)驗(yàn)和實(shí)驗(yàn)結(jié)果。在第三部分解釋了什么是強(qiáng)化學(xué)習(xí)和一些它的應(yīng)用。 本文寫作安排如下。 在其余路程,它的所有等待時(shí)間里,如果信號(hào)燈現(xiàn)在是紅色的或者綠色的,那么增益的值是不同的。 我們的方法,強(qiáng)化學(xué)習(xí) [Sutton and Barto, 1998, Kaelbling, 1996]和基于道路使用者的價(jià)值功能 [威寧, 2021]被用來決定每個(gè)交通燈的優(yōu)化選擇。 交通燈控制是一個(gè)復(fù)雜的優(yōu)化問題和幾個(gè)智能算法,例如模糊邏輯、遺傳算 法和強(qiáng)化學(xué)習(xí)( RL)已被應(yīng)用去試圖解決問題。因此,使用成熟傳感器和智能優(yōu)化算法的交通燈優(yōu)化控制可能是有益的。 研究表明, 這種模型的出 現(xiàn)具有現(xiàn)實(shí)意義 [Nagel and Schreckenberg, 1992, Wahle and Schreckenberg, 2021]。 這有幾個(gè) 交通仿真 模型。避免交通堵塞,例如,被認(rèn)為是對(duì)環(huán)境和經(jīng)濟(jì)有益的,但是增加的交通流也可能導(dǎo)致資源需求的增加。隨著道路使用者的數(shù)量不斷上漲,當(dāng)前基礎(chǔ)設(shè)施所提供的資源受到限制,在未來,交通智能控制將會(huì)成為一個(gè)非常重要的問題。實(shí)驗(yàn)結(jié)果表明,在所有基礎(chǔ)設(shè)施的研究領(lǐng)域內(nèi),我們的自適應(yīng)交通燈控制器優(yōu)于其他固定的控制器。 在文中,我們學(xué)習(xí)了在城市中的模擬與優(yōu)化的交通燈控制器,以及目前基于強(qiáng)化學(xué)習(xí)的自適應(yīng)優(yōu)化算法。 one for the (simple) driving decision, and one for tactical decisions like route choice. The real world situation was modelled by using detection devices already installed. From these devices, information about the number of cars entering and leaving a stretch of road are obtained. Using this information, the number of vehicles that take a certain turn at each junction can be inferred. By instantiating this information in a faster than realtime simulator, predictions on actual traffic can be made. A system installed in Duisburg uses information from the existing traffic control center and produces realtime information on the Inter. Another system was installed on the freeway system of North RhineWestphalia, using data from about inductive loops to predict traffic on 6000 km of roads. 中文譯 文 智能交通燈控制 馬克 威寧,簡(jiǎn)麗 范 威 ,吉爾 威瑞肯,安瑞 庫(kù)普曼 智能系統(tǒng)小組 烏得勒支大學(xué) 信息與計(jì)算科學(xué)研究所 荷蘭烏得勒支 Padualaan14 號(hào) 郵箱: 2021 年 7 月 9 日 摘要 世界各地的車輛運(yùn)行逐漸增多,尤其是在一個(gè)大的本地區(qū)域。 本科生畢業(yè)設(shè)計(jì) (論文) 外 文文獻(xiàn)翻譯