基于深度強(qiáng)化學(xué)習(xí)的立體投送策略?xún)?yōu)化方法研究
系統(tǒng)仿真學(xué)報(bào)
頁(yè)數(shù): 11 2022-10-21
摘要: 基于深度強(qiáng)化學(xué)習(xí)算法在策略?xún)?yōu)化問(wèn)題中的良好表現(xiàn),以立體投送作戰(zhàn)行動(dòng)為主要研究對(duì)象,提出了一種深度強(qiáng)化學(xué)習(xí)框架與仿真推演實(shí)驗(yàn)協(xié)同的作戰(zhàn)行動(dòng)策略?xún)?yōu)化方法。在分析策略?xún)?yōu)化研究現(xiàn)狀的基礎(chǔ)上,根據(jù)研究問(wèn)題對(duì)深度學(xué)習(xí)框架進(jìn)行了分析比較,構(gòu)建了基于A3C算法的深度強(qiáng)化學(xué)習(xí)立體投送策略模型,并通過(guò)仿真推演和分布式計(jì)算,實(shí)現(xiàn)深度強(qiáng)化學(xué)習(xí)模型與“人不在回路”仿真推演的交互學(xué)習(xí),獲得優(yōu)化后的立體投送... (共11頁(yè))