基于對手動作預(yù)測的智能博弈對抗算法
計算機工程與應(yīng)用
頁數(shù): 8 2022-03-24
摘要: 智能博弈對抗場景中,多智能體強化學(xué)習(xí)算法存在“非平穩(wěn)性”問題,智能體的策略不僅取決于環(huán)境,還受到環(huán)境中對手(其他智能體)的影響。根據(jù)對手與環(huán)境的交互信息,預(yù)測其策略和意圖,并以此調(diào)整智能體自身策略是緩解上述問題的有效方式。提出一種基于對手動作預(yù)測的智能博弈對抗算法,對環(huán)境中的對手進行隱式建模。該算法通過監(jiān)督學(xué)習(xí)獲得對手的策略特征,并將其與智能體的強化學(xué)習(xí)模型融合,緩解對手對學(xué)習(xí)...