了解更多关于AlphaGo的信息

到目前为止阿尔法戈的故事

AlphaGo是第一个击败职业玩家的电脑程序,第一个击败围棋世界冠军的项目,可以说是历史上最强大的围棋手。

阿尔法戈的第一场正式比赛是对阵3次卫冕的欧洲冠军,许芬先生,2015年10月。它5-0的胜利是有史以来第一次对抗职业选手,结果在国际期刊上发表了完整的技术细节,自然.然后,阿尔法戈继续与传奇球员李·塞多尔竞争,获得18个世界冠军,被广泛认为是过去十年中最伟大的球员。

阿尔法戈在汉城4比1获胜,韩国2016年3月,全世界有2亿多人观看。专家们一致认为这是一项里程碑式的成就,比它的时代提前了十年,并为AlphaGo赢得了9 dan的专业排名(最高认证)——这是电脑围棋玩家第一次获得此殊荣。

在比赛期间,阿尔法戈玩了一把极具创造性的获胜动作,其中有几项——包括第二场比赛中的第37步——令人惊讶的是,他们推翻了数百年来获得的智慧,并得到了各级球员的广泛检查。在获胜的过程中,阿尔法戈不知何故地向世界传授了关于历史上研究和思考最多的游戏的全新知识。

从那时起,阿尔法戈继续感到惊讶和惊奇。2017年1月,一个改进的AlphaGo版本作为在线玩家“大师”出现,实现了在线快速时间控制游戏60连胜对抗顶级国际围棋选手。

2017年5月,阿尔法·戈在戈的出生地参加了未来的戈峰会,中国深入探究围棋的奥秘,本着与国家顶级玩家共同合作的精神。你可以阅读更多关于五天首脑会议的信息在这里.

五个月后,我们收到了另一个自然纸对于阿尔法戈零度.与早期版本的AlphaGo不同,它使用数千种人类业余和专业游戏学习如何玩游戏,AlphaGo Zero学会了玩围棋,只需和自己玩游戏,从完全随机播放开始。

这样做,它超越了以前所有版本的性能,包括那些击败世界冠军李赛多和克杰的选手,成为有史以来最强大的围棋手。

我们相信这一新的突破有可能促进重大的科学突破,从而彻底改变世界。

了解更多关于AlphaGo的信息,并与阿尔法戈电影.现在可以观看网飞公司谷歌电影亚马逊即时视频iTunes.

怎么回事?

游戏起源于3000年前的中国。游戏规则很简单:玩家轮流在棋盘上放置黑白石,试图捕捉对手的石头或包围空旷的空间来制造地盘。尽管规则很简单,围棋是一个复杂的游戏。170种可能的电路板结构的功率达到惊人的10倍——超过了已知宇宙中原子的数量——使之成为古戈比国际象棋复杂的多。

围棋主要是通过直觉和感觉进行的,因为它的美丽,它的精妙和智慧深度已经吸引了几个世纪的人类想象力。

有兴趣发现自己的围棋游戏,但不确定从哪里开始?头上到这个互动的在线培训游戏!

如果你在寻找新的、有创意的玩法,退房阿法戈教学,于2017年12月推出。该工具提供了对Go最近历史上数千个最流行的开放序列的分析,演示AlphaGo如何分析不同的动作并判断它们是否有可能获胜。

掌握围棋游戏

围棋的复杂性意味着它长期以来被视为人工智能经典游戏中最具挑战性的游戏。尽管工作了几十年,最强的电脑围棋程序只能在人类业余水平上玩。

传统人工智能方法,它构造了一个搜索树在所有可能的位置上,没有机会去。这是因为可能的移动次数太多,难以评估每个可能的董事会位置的强度。

为了捕捉游戏的直观方面,我们知道我们需要采取一种新颖的方法。因此,AlphaGo结合了高级树搜索具有深层神经网络.这些神经网络将go板的描述作为输入,并通过包含数百万个神经元样连接的不同网络层对其进行处理。一个神经网络,“策略网络”,选择下一个要播放的移动。另一个神经网络,“价值网络”,预测比赛的胜利者。

我们向AlphaGo展示了大量强大的业余游戏,以帮助它发展自己对合理人类游戏的理解。然后我们让它与不同版本的它自己对决了上千次,每次从错误中吸取教训,不断改进,直到变得非常强大,通过一个被称为强化学习.

我们的自然纸,2016年1月28日出版,更详细地描述了这种原始方法背后的技术细节。

多读关于AlphaGo如何使用机器学习来掌握Go游戏,请访问我们的博客。

AlphaGo零:从头开始

2017年10月,我们的阿尔法戈零度 发表在《自然》杂志上。与早期版本的AlphaGo不同的是,它训练了数千种人类业余和专业游戏来学习如何玩游戏。AlphaGo Zero绕过了这个过程,学会了在没有人类数据的情况下玩围棋。只需和自己玩游戏。

专家们把这篇论文描述为“向复杂领域的纯强化学习迈出的重要一步”。我们通过精简零后面的架构来取得这一进展;我们将政策和价值网络统一为一个单一的神经网络,并结合一个更简单的树搜索,该树搜索依赖于这个单一的神经网络来评估位置和样本移动,不进行游戏的推广。这可以被认为是使用一个顶级专业人员来建议系统下一步行动,而不是从成百上千的业余玩家那里获得众包答案。AlphaGoZero的架构的简单性也极大地加快了系统的速度,同时也降低了它所需要的计算能力。

我们认为,这种方法可能适用于一系列结构问题,这些问题具有与围棋类似的性质,例如,计划任务或必须按正确顺序采取一系列行动的问题。例如蛋白质折叠,降低能耗或寻找革命性的新材料。

了解更多关于阿尔法戈和我们的自然论文

在DeepMind工作亚搏体育投注

我们正在寻找优秀的人才。