基于知識指導(dǎo)的安全強化學習路由算法
中國工程機械學報
頁數(shù): 6 2022-08-15
摘要: 在大流量傳輸場景中,傳統(tǒng)啟發(fā)式路由選擇協(xié)議無法根據(jù)網(wǎng)絡(luò)狀態(tài)動態(tài)調(diào)整路由策略,而基于數(shù)據(jù)驅(qū)動的路由協(xié)議在訓練初期無法保證網(wǎng)絡(luò)吞吐量。針對此問題,提出基于先驗知識指導(dǎo)的安全強化學習路由算法,把先驗知識引入深度強化學習模型的動作選擇,結(jié)合ε-greedy策略,根據(jù)網(wǎng)絡(luò)狀態(tài)對下一跳進行評估和約束,必要時提供更優(yōu)動作,避免無效動作?;贙eras與Networkx的仿真實驗表明:該算法可...