基于強(qiáng)化學(xué)習(xí)的邊緣計(jì)算網(wǎng)絡(luò)資源在線分配方法
控制與決策
頁數(shù): 7 2021-08-03
摘要: 針對邊緣計(jì)算應(yīng)用對實(shí)時(shí)性的要求,引入軟件定義網(wǎng)絡(luò)和網(wǎng)絡(luò)功能虛擬化技術(shù)對邊緣計(jì)算網(wǎng)絡(luò)進(jìn)行重構(gòu).基于此,考慮以最大化長期平均實(shí)時(shí)任務(wù)處理成功率為目標(biāo)的計(jì)算和通信資源在線分配問題.通過建立馬爾可夫決策過程模型,提出基于Q學(xué)習(xí)的資源在線分配方法. Q學(xué)習(xí)在狀態(tài)動(dòng)作空間較大時(shí)內(nèi)存占用大且會(huì)發(fā)生維度災(zāi)難,鑒于此,進(jìn)一步提出基于DQN的資源在線分配方法.實(shí)驗(yàn)結(jié)果表明,所提出算法能夠較快收斂,... (共7頁)