異策略深度強化學習中的經驗回放研究綜述
自動化學報
頁數: 20 2023-11-15
摘要: 作為一種不需要事先獲得訓練數據的機器學習方法,強化學習(Reinforcement learning, RL)在智能體與環(huán)境的不斷交互過程中尋找最優(yōu)策略,是解決序貫決策問題的一種重要方法.通過與深度學習(Deep learning, DL)結合,深度強化學習(Deep reinforcement learning, DRL)同時具備了強大的感知和決策能力,被廣泛應用于多個領域來...