當前位置:首頁 > 實用文檔 > 自動化技術(shù) > 正文

融合引力搜索的雙延遲深度確定策略梯度方法

軟件學(xué)報 頁數(shù): 14 2023-06-19
摘要: 近年來,深度強化學(xué)習(xí)在復(fù)雜控制任務(wù)中取得了令人矚目的效果,然而由于超參數(shù)的高敏感性和收斂性難以保證等原因,嚴重影響了其對現(xiàn)實問題的適用性.元啟發(fā)式算法作為一類模擬自然界客觀規(guī)律的黑盒優(yōu)化方法,雖然能夠有效避免超參數(shù)的敏感性,但仍存在無法適應(yīng)待優(yōu)化參數(shù)量規(guī)模巨大和樣本使用效率低等問題.針對以上問題,提出融合引力搜索的雙延遲深度確定策略梯度方法 (twin delayed deep...

開通會員,享受整站包年服務(wù)立即開通 >