多智能體協(xié)同決策仿真平臺研究與開發(fā)
系統(tǒng)仿真學報
頁數(shù): 11 2023-11-22
摘要: 強化學習仿真平臺為強化學習提供交互和訓練的環(huán)境。為了使仿真平臺兼容多智能體強化學習算法,滿足軍事領域仿真的需求,提煉多智能體強化學習算法中的相似流程,設計統(tǒng)一接口,將多種不同類型深度強化學習算法在仿真平臺進行嵌入驗證;優(yōu)化仿真平臺后端服務框架以加速算法模型的訓練過程。實驗結果表明:在仿真平臺中統(tǒng)一接口規(guī)范,能夠兼容多種不同類型的多智能體強化學習算法,顯著提升了后端服務框架重構和... (共11頁)