基于深度確定性策略梯度算法的綜合能源系統(tǒng)自動(dòng)發(fā)電控制
摘要: “雙碳”目標(biāo)推動(dòng)大規(guī)模新能源并網(wǎng)并引入強(qiáng)隨機(jī)擾動(dòng),使傳統(tǒng)控制方法難以獲得多區(qū)域協(xié)同的最優(yōu)解;盡管強(qiáng)化學(xué)習(xí)可應(yīng)對(duì)該問(wèn)題,但其在智能體與環(huán)境交互中產(chǎn)生的過(guò)度估計(jì)偏差及獎(jiǎng)勵(lì)噪聲仍會(huì)影響控制性能。為此,提出一種面向綜合能源系統(tǒng)的多智能體協(xié)同自動(dòng)發(fā)電控制算法,即基于行為克隆的綜合價(jià)值估計(jì)雙延遲深度確定性策略梯度算法來(lái)獲取多區(qū)域協(xié)同最優(yōu)解,其通過(guò)行為克隆引入策略約束,以緩解在與環(huán)境交互時(shí)所... (共13頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)