基于改進(jìn)優(yōu)先經(jīng)驗(yàn)回放的SAC算法路徑規(guī)劃
空間控制技術(shù)與應(yīng)用
頁數(shù): 10 2023-10-15
摘要: 為解決智能體在復(fù)雜環(huán)境下的路徑規(guī)劃問題,提出一種基于改進(jìn)優(yōu)先經(jīng)驗(yàn)回放方法的在線異策略深度強(qiáng)化學(xué)習(xí)算法模型.該模型采用柔性動(dòng)作評(píng)價(jià)算法,通過設(shè)計(jì)智能體的狀態(tài)空間、動(dòng)作空間及獎(jiǎng)勵(lì)函數(shù)等實(shí)現(xiàn)智能體無碰撞路徑規(guī)劃;利用樣本狀態(tài)優(yōu)先度與TD誤差構(gòu)建的樣本混合優(yōu)先度的離散度計(jì)算樣本采樣概率,進(jìn)一步提出基于改進(jìn)優(yōu)先經(jīng)驗(yàn)回放方法的柔性動(dòng)作評(píng)價(jià)算法,提高模型學(xué)習(xí)效率.仿真實(shí)驗(yàn)結(jié)果驗(yàn)證了提出的改進(jìn)...