當(dāng)前位置:首頁 > 實用文檔 > 數(shù)學(xué) > 正文

基于對手動作預(yù)測的智能博弈對抗算法

計算機工程與應(yīng)用 頁數(shù): 8 2022-03-24
摘要: 智能博弈對抗場景中,多智能體強化學(xué)習(xí)算法存在“非平穩(wěn)性”問題,智能體的策略不僅取決于環(huán)境,還受到環(huán)境中對手(其他智能體)的影響。根據(jù)對手與環(huán)境的交互信息,預(yù)測其策略和意圖,并以此調(diào)整智能體自身策略是緩解上述問題的有效方式。提出一種基于對手動作預(yù)測的智能博弈對抗算法,對環(huán)境中的對手進行隱式建模。該算法通過監(jiān)督學(xué)習(xí)獲得對手的策略特征,并將其與智能體的強化學(xué)習(xí)模型融合,緩解對手對學(xué)習(xí)...

開通會員,享受整站包年服務(wù)立即開通 >