基于強(qiáng)化監(jiān)督協(xié)同學(xué)習(xí)的斗地主博弈策略研究
摘要: 斗地主是中國民間最流行的紙牌玩法之一,具有不完全信息博弈和隨機(jī)博弈的特征。在斗地主博弈過程中,既有攻守雙方的對(duì)抗又有同伴之間的合作,是目前最復(fù)雜的博弈類型之一。分析了斗地主的博弈過程,從參與者、歷史集合、參與者函數(shù)、信息空間、自然概率分布函數(shù)和參與者的偏好等6個(gè)方面描述了斗地主的博弈模型。模型為研究斗地主計(jì)算機(jī)博弈的理論或程序算法提供了理論依據(jù)和參考。研究將強(qiáng)化學(xué)習(xí)的DDQN(... (共6頁)
開通會(huì)員,享受整站包年服務(wù)