基于深度強化學(xué)習(xí)的四足機器人跟隨策略研究及系統(tǒng)實現(xiàn)
機械工程學(xué)報
頁數(shù): 10 2023-02-24
摘要: 目標(biāo)跟隨策略是四足機器人目標(biāo)跟隨系統(tǒng)的重要組成部分。針對跟隨過程中目標(biāo)運動隨機因素多、系統(tǒng)決策復(fù)雜以及現(xiàn)實部署魯棒性不足的問題,首先,提出一種基于深度強化學(xué)習(xí)的目標(biāo)跟隨策略,該策略根據(jù)輸入的目標(biāo)相對于機器人的空間位置信息,輸出跟隨動作指令,實現(xiàn)機器人對隨機運動目標(biāo)的跟隨決策。然后,使用基于Actor-Critic框架的深度強化學(xué)習(xí)算法對機器人進(jìn)行訓(xùn)練,并添加觀測值噪聲以獲得更魯... (共10頁)