基于相似性樣本生成的深度強化學(xué)習(xí)快速抗干擾算法
通信學(xué)報
頁數(shù): 10 2024-07-24
摘要: 為提高基于深度強化學(xué)習(xí)的通信抗干擾算法的學(xué)習(xí)效率,以更快適應(yīng)未知干擾環(huán)境,提出一種基于相似性樣本生成的深度強化學(xué)習(xí)快速抗干擾算法。該算法將基于互模擬關(guān)系的狀態(tài)-動作對相似性度量與基于深度Q網(wǎng)絡(luò)的抗干擾算法相結(jié)合,能在未知動態(tài)干擾環(huán)境下快速學(xué)習(xí)有效的多域抗干擾策略。算法在完成每步傳輸動作時,首先利用深度Q網(wǎng)絡(luò)抗干擾算法與環(huán)境交互,獲得實際的狀態(tài)-動作對。然后,基于互模擬關(guān)系生成與... (共10頁)