面向多智能體協(xié)作的注意力意圖與交流學(xué)習(xí)方法
自動(dòng)化學(xué)報(bào)
頁(yè)數(shù): 15 2021-12-02
摘要: 對(duì)于部分可觀測(cè)環(huán)境下的多智能體交流協(xié)作任務(wù),現(xiàn)有研究大多只利用了當(dāng)前時(shí)刻的網(wǎng)絡(luò)隱藏層信息,限制了信息的來(lái)源.研究如何使用團(tuán)隊(duì)獎(jiǎng)勵(lì)訓(xùn)練一組獨(dú)立的策略以及如何提升獨(dú)立策略的協(xié)同表現(xiàn),提出多智能體注意力意圖交流算法(Multi-agent attentional intention and communication, MAAIC),增加了意圖信息模塊來(lái)擴(kuò)大交流信息的來(lái)源,并且改善了...