當(dāng)前位置:首頁 > 科技文檔 > 自動化 > 正文

逆強化學(xué)習(xí)算法、理論與應(yīng)用研究綜述

自動化學(xué)報 頁數(shù): 20 2024-03-21
摘要: 隨著高維特征表示與逼近能力的提高,強化學(xué)習(xí)(Reinforcement learning, RL)在博弈與優(yōu)化決策、智能駕駛等現(xiàn)實問題中的應(yīng)用也取得顯著進展.然而強化學(xué)習(xí)在智能體與環(huán)境的交互中存在人工設(shè)計獎勵函數(shù)難的問題,因此研究者提出了逆強化學(xué)習(xí)(Inverse reinforcement learning, IRL)這一研究方向.如何從專家演示中學(xué)習(xí)獎勵函數(shù)和進行策略優(yōu)化是... (共20頁)

開通會員,享受整站包年服務(wù)立即開通 >