基于深度強(qiáng)化學(xué)習(xí)的智能兵棋推演決策方法
計(jì)算機(jī)工程
頁(yè)數(shù): 10 2023-07-19
摘要: 兵棋推演是培養(yǎng)現(xiàn)代軍事指揮員的重要方法,將人工智能技術(shù)引入到兵棋推演中可簡(jiǎn)化組織流程,提升推演效益?;跈C(jī)器學(xué)習(xí)的智能兵棋常因態(tài)勢(shì)信息過(guò)于復(fù)雜以及推演本身信息不完整,導(dǎo)致自主決策模型的樣本決策效率降低。提出一種基于深度強(qiáng)化學(xué)習(xí)的智能兵棋推演決策方法。針對(duì)智能兵棋推演作戰(zhàn)決策的效率問(wèn)題,在策略網(wǎng)絡(luò)中引入基準(zhǔn)線,并加快策略網(wǎng)絡(luò)訓(xùn)練,隨后進(jìn)行推導(dǎo)證明,提出加入基準(zhǔn)線后策略網(wǎng)絡(luò)參數(shù)的更...