當(dāng)前位置:首頁 > 科技文檔 > 數(shù)學(xué) > 正文

基于主從博弈的分層聯(lián)邦學(xué)習(xí)激勵機制研究

電子與信息學(xué)報 頁數(shù): 8 2023-04-15
摘要: 為了優(yōu)化分層聯(lián)邦學(xué)習(xí)(FL)全局模型的訓(xùn)練時延,針對實際場景中終端設(shè)備存在自私性的問題,該文提出一種基于博弈論的激勵機制。在激勵預(yù)算有限的條件下,得到了終端設(shè)備和邊緣服務(wù)器之間的均衡解和最小的邊緣模型訓(xùn)練時延??紤]終端設(shè)備數(shù)量不同,設(shè)計了基于主從博弈的可變激勵訓(xùn)練加速算法,使得一次全局模型訓(xùn)練時延達到最小。仿真結(jié)果顯示,所提出的算法能夠有效降低終端設(shè)備自私性帶來的影響,提高分層... (共8頁)

分層聯(lián)邦學(xué)習(xí)博弈論激勵機制

開通會員,享受整站包年服務(wù)立即開通 >