基于深度強(qiáng)化學(xué)習(xí)的多目標(biāo)邊緣任務(wù)調(diào)度研究
電子測(cè)量技術(shù)
頁(yè)數(shù): 8 2023-04-23
摘要: 針對(duì)深度強(qiáng)化學(xué)習(xí)在邊緣計(jì)算環(huán)境下的多目標(biāo)任務(wù)調(diào)度時(shí)存在優(yōu)化效果差等問(wèn)題,提出了一種新的基于改進(jìn)的競(jìng)爭(zhēng)深度雙Q網(wǎng)絡(luò)的多目標(biāo)任務(wù)調(diào)度算法(IMTS-D3QN)。首先將深度雙Q網(wǎng)絡(luò)對(duì)目標(biāo)中的最大操作分解為動(dòng)作選擇和動(dòng)作評(píng)估,以消除過(guò)高估計(jì);采用立即獎(jiǎng)勵(lì)經(jīng)驗(yàn)樣本分類方法,對(duì)經(jīng)驗(yàn)樣本按照重要性程度分類存儲(chǔ),訓(xùn)練時(shí)選取更多重要性程度高的經(jīng)驗(yàn)樣本,提高了實(shí)際樣本的利用率,加快了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練...