基于單網(wǎng)絡(luò)評判學(xué)習(xí)的非線性系統(tǒng)魯棒跟蹤控制
控制與決策
頁數(shù): 9 2022-06-29
摘要: 針對一類具有不確定性的連續(xù)時間非線性系統(tǒng),提出一種基于單網(wǎng)絡(luò)評判學(xué)習(xí)的魯棒跟蹤控制方法.首先建立由跟蹤誤差與參考軌跡構(gòu)成的增廣系統(tǒng),將魯棒跟蹤控制問題轉(zhuǎn)換為鎮(zhèn)定設(shè)計問題.通過采用帶有折扣因子和特殊效用項的代價函數(shù),將魯棒鎮(zhèn)定問題轉(zhuǎn)換為最優(yōu)控制問題.然后,通過構(gòu)建評判神經(jīng)網(wǎng)絡(luò)對最優(yōu)代價函數(shù)進行估計,進而得到最優(yōu)跟蹤控制算法.為了放松該算法的初始容許控制條件,在評判神經(jīng)網(wǎng)絡(luò)權(quán)值更新...