通过深度强化学习实现人的水平控制

本文发表于自然2015年2月26日,介绍了一种深度神经网络与大规模强化学习相结合的DEEPRL系统。并且能够掌握各种各样的雅达利2600游戏到超人级,只有原始像素和分数作为输入。

对于被认为是真正智能的人工智能,它们应该擅长于被认为对人类具有挑战性的各种任务。直到现在,它只可能创建能够掌握单个特定领域的单独算法。用我们的算法,我们利用最近在训练深度神经网络方面的突破,证明了一种新型的端到端强化学习剂,称为深Q网络(DQN)能够在49种不同的游戏场景中超越专业的人类参考玩家和所有前代理的整体表现。

这项工作首次证明了一种通用代理能够在无需任何人为干预的情况下不断地适应其行为,在寻求人工智能的过程中向前迈出了一大步。

内心深处亚搏体育投注

外部链接

我们的开源实现可在github.