关注

打败中韩“棋神”的阿法狗被它小弟100-0完爆

作者:红豆 2017-10-20 13:13 瞭望智库

原标题:打败中韩棋神的阿法狗被它小弟100-0完爆,人工智能要翻天了? 去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1打败世界冠军李世石...

原标题:打败中韩“棋神”的阿法狗被它小弟100-0完爆,人工智能要翻天了?

去年,有个小孩读遍人世所有的棋谱,辛勤打谱,苦思冥想,棋艺精进,4-1打败世界冠军李世石,从此人间无敌手。他的名字叫阿法狗。

今年,他的弟弟只靠一副棋盘和黑白两子,没看过一个棋谱,也没有一个人指点,从零开始,自娱自乐,自己参悟,100-0打败哥哥阿法狗。他的名字叫阿法元。

本文转载自微信公众号“知社学术圈”(ID:zhishexueshuquan),不代表瞭望智库观点。

DeepMind这项伟大的突破,10月19日以Mastering the game of Go without human knowledge为题,发表于Nature,引起轰动。我们特邀国内外几位人工智能专家,给予深度解析和点评。文末有DeepMind David Silver博士专访视频。特别致谢Nature和DeepMind提供讯息和资料授权。

Nature上线的这篇重磅论文,详细介绍了谷歌DeepMind团队最新的研究成果。人工智能的一项重要目标,是在没有任何先验知识的前提下,通过完全的自学,在极具挑战的领域,达到超人的境地。去年,阿法狗(AlphaGo)代表人工智能在围棋领域首次战胜了人类的世界冠军,但其棋艺的精进,是建立在计算机通过海量的历史棋谱学习参悟人类棋艺的基础之上,进而自我训练,实现超越。

阿法狗元棋力的增长与积分比较

我们发现,人类其实把阿法狗教坏了! 新一代的阿法元(AlphaGo Zero), 完全从零开始,不需要任何历史棋谱的指引,更不需要参考人类任何的先验知识,完全靠自己一个人强化学习(reinforcement learning)和参悟,  棋艺增长远超阿法狗,百战百胜,击溃阿法狗100-0。

达到这样一个水准,阿法元只需要在4个TPU上,花三天时间,自己左右互搏490万棋局。而它的哥哥阿法狗,需要在48个TPU上,花几个月的时间,学习三千万棋局,才打败人类。

这篇论文的第一和通讯作者是DeepMind的David Silver博士,  阿法狗项目负责人。他介绍说阿法元远比阿法狗强大,因为它不再被人类认知所局限,而能够发现新知识,发展新策略:

This technique is more powerful than previous versions of AlphaGo because it is no longer constrained by the limits of human knowledge. Instead, it is able to learn tabula rasa  from the strongest player in the world: AlphaGo itself. AlphaGo Zero also discovered new knowledge, developing unconventional strategies and creative new moves that echoed and surpassed the novel techniques it played in the games against Lee Sedol and Ke Jie.

DeepMind联合创始人和CEO则说这一新技术能够用于解决诸如蛋白质折叠和新材料开发这样的重要问题:

AlphaGo Zero is now the strongest version of our program and shows how much progress we can make even with less computing power and zero use of human data. Ultimately we want to harness algorithmic breakthroughs like this to help solve all sorts of pressing real world problems like protein folding or designing new materials.

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 一组令人隐隐作痛的图

    一组令人隐隐作痛的图

  • 一组令人隐隐作痛的图

    一组令人隐隐作痛的图

  • 盘点中日印自主开发全球定位系统:开启

    盘点中日印自主开发全球定位系统:开启

  • 研究表明狗狗的表情是有目的卖萌 只为

    研究表明狗狗的表情是有目的卖萌 只为