不確定性下的博弈強化學習
計算機工程與設計
頁數(shù): 12 2023-11-16
摘要: 針對博弈強化學習中環(huán)境、信息、和激勵函數(shù)的不確定性問題,通過對現(xiàn)有博弈強化學習算法的仔細研究和橫向比較,以確定性方案、即時方案和適度推理方案3個角度對算法和模型進行系統(tǒng)歸納梳理,剖析多學科領域知識是如何相互融合并解決博弈強化學習的各類不確定性問題,指出博弈強化學習研究的重難點和今后的重點發(fā)展方向。結(jié)合模糊推理系統(tǒng)和分形與分數(shù)階微積分理論給出一些新型解決思路。