一種自學習的智能五子棋算法的設計與實現(xiàn)
小型微型計算機系統(tǒng)
頁數(shù): 7 2020-05-29
摘要: 強化學習長期以來的一個目標是創(chuàng)造一個能夠在具有挑戰(zhàn)性的領域,以超越人類的精通程度學習的算法.基于蒙特卡洛樹搜索與深度神經(jīng)網(wǎng)絡設計一種自學習智能五子棋算法,無需人類知識,從零開始學習.其中深度神經(jīng)網(wǎng)絡是由32個卷積層組成的深度殘差網(wǎng)絡;蒙特卡洛樹搜索可根據(jù)多次模擬博弈的結(jié)果預測最優(yōu)的移動方案.將五子棋規(guī)則與蒙特卡洛樹搜索和深度神經(jīng)網(wǎng)絡相結(jié)合,蒙特卡洛樹搜索使用深度神經(jīng)網(wǎng)絡評估落子... (共7頁)