基于多維時(shí)空層遞的交通信號(hào)分布式強(qiáng)化學(xué)習(xí)方法
中國(guó)公路學(xué)報(bào)
頁(yè)數(shù): 14 2024-03-07
摘要: 信號(hào)控制是智能交通系統(tǒng)的重要組成部分,融合人工智能等新技術(shù)的信號(hào)優(yōu)化逐漸成為研究熱點(diǎn),具體策略可分為集中式和分布式2類(lèi)。分布式控制的輕量化狀態(tài)空間可以有效避免深度強(qiáng)化學(xué)習(xí)中的維度災(zāi)難問(wèn)題,近年來(lái)愈發(fā)受到研究者關(guān)注?,F(xiàn)有的分布式協(xié)同控制策略多以圖卷積網(wǎng)絡(luò)或圖注意力網(wǎng)絡(luò)為基礎(chǔ)挖掘路口的耦合關(guān)系,但對(duì)路口狀態(tài)之間的時(shí)空關(guān)聯(lián)性隨時(shí)變交通流的動(dòng)態(tài)變化特征考慮不足。為此,首先基于門(mén)控循環(huán)神... (共14頁(yè))