• 基于值函数和策略梯度的深度强化学习综述

    基于值函数和策略梯度的深度强化学习综述

    论文摘要作为人工智能领域的热门研究问题,深度强化学习自提出以来,就受到人们越来越多的关注.目前,深度强化学习能够解决很多以前难以解决的问题,比如直接从原始像素中学习如何玩视频游...