基于主從博弈的分層聯(lián)邦學(xué)習(xí)激勵機制研究
電子與信息學(xué)報
頁數(shù): 8 2023-04-15
摘要: 為了優(yōu)化分層聯(lián)邦學(xué)習(xí)(FL)全局模型的訓(xùn)練時延,針對實際場景中終端設(shè)備存在自私性的問題,該文提出一種基于博弈論的激勵機制。在激勵預(yù)算有限的條件下,得到了終端設(shè)備和邊緣服務(wù)器之間的均衡解和最小的邊緣模型訓(xùn)練時延??紤]終端設(shè)備數(shù)量不同,設(shè)計了基于主從博弈的可變激勵訓(xùn)練加速算法,使得一次全局模型訓(xùn)練時延達到最小。仿真結(jié)果顯示,所提出的算法能夠有效降低終端設(shè)備自私性帶來的影響,提高分層... (共8頁)
分層聯(lián)邦學(xué)習(xí)博弈論激勵機制