基于改進(jìn)優(yōu)先經(jīng)驗回放的SAC算法路徑規(guī)劃
空間控制技術(shù)與應(yīng)用
頁數(shù): 10 2023-10-15
摘要: 為解決智能體在復(fù)雜環(huán)境下的路徑規(guī)劃問題,提出一種基于改進(jìn)優(yōu)先經(jīng)驗回放方法的在線異策略深度強化學(xué)習(xí)算法模型.該模型采用柔性動作評價算法,通過設(shè)計智能體的狀態(tài)空間、動作空間及獎勵函數(shù)等實現(xiàn)智能體無碰撞路徑規(guī)劃;利用樣本狀態(tài)優(yōu)先度與TD誤差構(gòu)建的樣本混合優(yōu)先度的離散度計算樣本采樣概率,進(jìn)一步提出基于改進(jìn)優(yōu)先經(jīng)驗回放方法的柔性動作評價算法,提高模型學(xué)習(xí)效率.仿真實驗結(jié)果驗證了提出的改進(jìn)... (共10頁)