強(qiáng)化學(xué)習(xí)及其在機(jī)器人任務(wù)規(guī)劃中的進(jìn)展與分析
模式識(shí)別與人工智能
頁(yè)數(shù): 16 2023-10-15
摘要: 強(qiáng)化學(xué)習(xí)可以讓機(jī)器人通過(guò)與環(huán)境的交互,學(xué)習(xí)最優(yōu)的行動(dòng)策略,是目前機(jī)器人領(lǐng)域關(guān)注的重要前沿方向之一.文中簡(jiǎn)述機(jī)器人任務(wù)規(guī)劃問(wèn)題的形式化建模,分析強(qiáng)化學(xué)習(xí)的主要方法,分別介紹無(wú)模型強(qiáng)化學(xué)習(xí)、基于模型的強(qiáng)化學(xué)習(xí)和分層強(qiáng)化學(xué)習(xí)的研究進(jìn)展,著重探討基于強(qiáng)化學(xué)習(xí)的機(jī)器人任務(wù)規(guī)劃的研究進(jìn)展,并討論各種強(qiáng)化學(xué)習(xí)及其應(yīng)用情況.最后總結(jié)強(qiáng)化學(xué)習(xí)在機(jī)器人應(yīng)用中面臨的問(wèn)題與挑戰(zhàn),展望未來(lái)的研究方向.