融合三支多屬性決策與SAC的兵棋推演智能決策技術(shù)
系統(tǒng)工程與電子技術(shù)
頁數(shù): 13 2024-02-05
摘要: 近年來,將深度強化學(xué)習(xí)技術(shù)用于兵棋推演的智能對抗策略生成受到廣泛關(guān)注。針對強化學(xué)習(xí)決策模型采樣率低、訓(xùn)練收斂慢以及智能體博弈勝率低的問題,提出一種融合三支多屬性決策(three-way multiple attribute decision making, TWMADM)與強化學(xué)習(xí)的智能決策技術(shù)?;诮?jīng)典軟表演者-批評家(soft actor-critic, SAC)算法開發(fā)兵... (共13頁)