基于Bandit反饋的自適應(yīng)量化分布式在線鏡像下降算法
控制理論與應(yīng)用
頁數(shù): 9 2023-01-10
摘要: 多智能體系統(tǒng)的在線分布式優(yōu)化常用于處理動(dòng)態(tài)環(huán)境下的優(yōu)化問題,節(jié)點(diǎn)間需要實(shí)時(shí)傳輸數(shù)據(jù)流.在很多情況下,各節(jié)點(diǎn)無法獲取個(gè)體目標(biāo)函數(shù)的全部信息(包括梯度信息),并且節(jié)點(diǎn)間信息傳輸存在一定的通信約束.考慮到非歐投影意義下的鏡像下降算法在處理高維數(shù)據(jù)和大規(guī)模在線學(xué)習(xí)上的優(yōu)勢(shì),本文使用個(gè)體目標(biāo)函數(shù)在兩點(diǎn)處的函數(shù)值信息對(duì)缺失的梯度信息進(jìn)行估計(jì),并且根據(jù)鏡像下降算法的性質(zhì)設(shè)計(jì)自適應(yīng)量化器,提出...