谷歌人工智能第一次秒杀欧洲围棋冠军,是人类打败了人类
2016-01-29 14:15:14 | 来源:玩转帮会 | 投稿:佚名 | 编辑:dations

原标题:谷歌人工智能第一次秒杀欧洲围棋冠军,是人类打败了人类

他们确实做得很好,能让 4 子胜 Zen 和 CrazyStone,把职业二段打成五比零,实力不容质疑。就期待着今年三月他们和李世石的比赛了。

从算法上来说,这篇文章并没有太多新意,主要是通过大量的训练数据,包括以往的棋谱和自我对局,把性能堆出来。他们训练了一个走子的神经网络(这个和我们的办法是一样的,但我们的文章主要在这上面作了改进),又训练了一个可以评估局面的网络(这个我们还没有),然后在蒙特卡罗树搜索中同时使用这两个网络。后者用了两千万局的自我对局 (self-play) 的结果训练。为了避免过拟合,每局只随机选了其中一个局面,然后让网络预测对局结果(胜或负)。两千万局不是个小数字,大家可以算一下一刻不停地下,15 分钟一局需要多久才能下完(大约是 570 年)。这个规模我说实在没有想到过,谷歌在这方面是很有优势的。最后,他们的 default policy 也是经过处理的,能够两微秒走一步而且准确率也不错。还有一些小细节就不一一赘述了。总之,谷歌的做法充分利用了大数据 + 深度学习的优势,而几乎完全没有用到围棋的领域知识,所以若是以后棋力能再往上走,我也不会惊讶。

其实这篇文章在去年 11 月份就已经投稿,但是因为《自然》杂志严格的审查制度,现在才出来。我们在 11 月的时候还只有 3d 的水平,蒙特卡罗树搜索还有各种问题,12 月初的时候已经听到了谣言,当时我惊得话都说不出来了,然而就算这样,还是决定一点一点做,抓紧圣诞和新年的时间,把性能提高到 5d 的水平。我们还差一点拿了一月 KGS 锦标赛的冠军(Zen 和 DolBaram 都参加了),可惜最后因为程序错误而超时,输了一局赢棋给 Zen,得了第三名。谷歌的文章有 20 个作者,明显是下了血本,前两位都是计算机围棋界的大牛,一作 David Silver 是计算机围棋和强化学习的顶级专家,整个博士论文就是做的围棋; 二作 Aja Huang 以前写过多年围棋软件,自己又是 AGA 6D 的水平。相比之下我们只有两个人( @朱岩 ),只做了半年,中间还要穿插 VQA 等其他项目,而且都没有做过围棋的经验,想想有些差距也是不冤了。

现在回想起来,要是他们决定去年 10 月份战胜了樊麾后马上公开,或者我们再拖一会儿,决定不投 ICLR 而等到今年的 ICML,那我们就被灭得连渣都不剩了(笑)。这回虎口拔牙,能从中拿到一些贡献,为公司增加一些影响力,算是比较成功的。至于单挑全军的感觉如何——我的回答是很爽

Facebook 高层也给了我们很大的支持,昨天我们组的老大 Yann LeCun 发了文章介绍我们的工作,扎克伯格还特地发了一篇文章点到了我的名字,赞扬我们的努力,对此我非常感动。

最后,我们的 arXiv 更新了[文章见http://arxiv.org/abs/1511.06410],欢迎大家有空看看。谢谢~

“珍珠港遭到空袭!这不是演习!这不是演习!这不是演习!”

——2016 年 1 月 28 日凌晨

从昨晚开始,一条声称某 AI 在 19 路棋盘上分先战胜樊麾二段,并且论文已登上 Nature 的消息刷爆了朋友圈。

一开始,就像以往的那些“大新闻”一样,大家都认为是标题党,甚至某业余 7 段还查验到其论文尚未被 Nature 审核通过。

然而随着时间的推移,越来越多的近距离详细消息传来,开始有人相信消息的真实性。

围棋圈内的各种微信群、朋友圈都在不断的争论,相信的人越来越多,不信的人也坚持己见。

终于,在接近凌晨两点,又一条最新报道来了,这次还附带着棋谱:

面对谷歌围棋 AI,人类最后的智力骄傲即将崩塌……(虽是真消息,但稍有标题党之嫌)

至此,看到棋谱的所有人几乎都相信了:人工智能 AlphaGo,实现了里程碑式的一步。

首先,在客观上要肯定 AlphaGo 实现的水平进步。

从昨晚开始,一条声称某 AI 在 19 路棋盘上分先战胜范麾二段,并且论文已登上 Nature 的消息刷爆了朋友圈。

一开始,就像以往的那些“大新闻”一样,大家都认为是标题党,甚至某业余 7 段还查验到其论文尚未被 Nature 审核通过。

然而随着时间的推移,越来越多的近距离详细消息传来,开始有人相信消息的真实性。

围棋圈内的各种微信群、朋友圈都在不断的争论,相信的人越来越多,不信的人也坚持己见。

终于,在接近凌晨两点,又一条最新报道来了,这次还附带着棋谱:

以往最强的围棋 AI,大致是 CrazyStone、Zen 和银星围棋这几个。

而 AlphaGo 在让以上几个程序(无银星围棋)4 子的情况下,取得了 80% 左右的胜率。我们据此基本可以判断,人工智能将自己的水平上限一下子提高了5 个子。

樊麾二段,虽然以欧洲冠军闻名于世,但其实圈内谁都知道他是一名中国旅欧教学的职业棋手。

虽然远离东亚职业一线,但樊老师的水平仍然是不容置疑的,他依然有着职业的水平(虽然是较弱的职业),一般的业 6 仍然是比他不上的。

AlphaGo 在正式比赛中对樊老师 5:0(棋谱已可见),据说加上非正式比赛的总分为 8:2(已确认),再加上棋谱里 AlphaGo 显示出的惊人的表现,我们可以认为,人工智能在围棋上的水平已经迈入了职业的大门。

(最新:据多位顶尖棋手对棋谱的鉴定,认为 AlphaGo 的水平应该在业余强 6 段到弱职业之间,离人类顶尖大概还有一先到两先的差距)

(对于西方围棋包括樊老师的相关介绍,可见西方人的围棋水平如何? – 高飞龙的回答)

说的更明白点,之前的 AI 在蒙特卡洛算法的帮助下虽然取得了革命性的进步,战胜了绝大多数的人类,但人类中能战胜那些 AI 的人数可能仍然在近百万的级别。

而自今日(其实已经是三个月前了)的 AlphaGo 起,能在围棋盘上战胜 AI 的人类人数可能已经不到千人了。

按照 @田渊栋 老师的说法,这个消息在相关研究圈内应该早就不是新闻了。

甚至回想一下昨天扎克伯格在 Facebook 上突然发声支持自己的研究团队,也因为是知道了 Google 团队的成果即将在一日内公示,所以想要抢占一个在舆论的位置。

(田老师参与的 Facebook 的研究团队,是 Google 现在最大的竞争对手,田老师他们使用的方法应该不太一样,虽然他们暂时落后,但我同样也很期待他们的下一步进展)

总之,这真的不是演习。

接下来谈点个人对人工智能的粗浅理解。

近些年来,尽管在蒙特卡洛算法的帮助下,AI 实现了革命性的进步,达到了能战胜大部分人类的水平(中等业余 5 段),但随着摩尔定律的走向终点,计算机硬件的发展速度在旧有的道路上暂时无法按以前的速度爆炸发展下去,大家都认为仅凭蒙特卡洛算法是无法帮助 AI 战胜人类的。

依据个人的理解,我曾在围棋棋力业余低段位,如何继续学习提高?有什么推荐的参考书目和学习方法?中将围棋的思维过程分解为四步的演进:常识→棋感→计算→判断。

大约一年前,我曾和李喆七段就此问题进行过简单讨论,当时我认为蒙特卡洛算法的成功主要在于为人工智能建立了“棋感”,而以往的人工智能只能在“常识”和“计算”具有天然优势。

在蒙特卡洛算法之前,虽然计算机凭借强大的计算力可以积累大量“常识”,但由于“棋感”的缺失,人工智能无法对计算方向进行有效的筛选,最终就不免沦于蛮力搜索。

而蛮力搜索虽然可以在一定程度上实现高水平的“计算”,甚至很多其他棋类都在这一环节上被人工智能打败,而由于围棋的过度复杂和摩尔定律结束对计算机发展前景的限制,走到这一步仍然无法让人工智能战胜人类。

(注:上图为计算机眼中的国际象棋落子思路,而下图为计算机眼中的围棋落子思路,来自谷歌 deepmind 官网AlphaGo | Google DeepMind)

而蒙特卡洛算法出现后,凭借大量储备的棋局,通过胜负概率来判断下一步着点以作为计算方向,极大的提高的计算的效率,所以 AI 的水平才实现了革命性的进步。

而这次的 AlphaGo,使用了深度神经网络与蒙特卡洛树状搜索相结合的方法。

依据已经能看到的 Nature 上的论文,研究者们在 AlphaGo 中加入了两个深度神经网络,以 value networks 来评估大量的选点,而以 policy networks 来选择落子,并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。

(注:上图为 AlphaGo 使用的神经网络结构示意图,来自原论文)

在这种结合下,研究者们结合参考人类职业对局的监督式学习,和 AI 大量积累自对弈实现的深度学习,来训练和提高 AI 的围棋实力。

在蒙特卡洛算法之后,我看到了新的天地。

这种结合以及新式的思路,让人感到前景无限。

最后谈一谈,我认为我们应该保有的态度。

这里,我首先想引用李喆七段在今天早上说的话:

“我们已来到两个时代的连接处,无论你是否愿意,这都是一个需要接受的事实。工具无善恶,善恶在人心。未来的路通往何方,将由我们自己决定。”

从凌晨到早上,朋友圈里的评论区一直争论不休,甚至某世界冠军一直在说“不信”,毕竟大家在没有看到板上的钉子之前,从情感上都是不愿意相信的。

直到另外两位一线棋手告诉他,已经可以看到棋谱了……

面对这个事件,接下来将会有很多的爆炸性新闻报道,以及各种各样姿势的讨论。

我们要知道:

一.人工智能的确实现了很大的进步。

这次的进步可能是革命性的,这次新闻宣称的 AI 取得的成绩并不是“标题党”。

二.人工智能还没有战胜人类(什么所谓“人类最后的骄傲陷落”都属于“标题党”)。

但朝着这个方向迈出了一大步,而且是在很多人在蒙特卡洛之后不看好 AI 下一步发展的情况下,来了一个突然袭击(谷歌从开始研究到出成果再到发布,一直憋一个大新闻憋这么久也真是能忍)。

三.人工智能战胜人类的时点,可能比很多人想象的要来的更早了。

不是之前设想的生物计算机或者量子计算机出现后,甚至都不是新材料取代硅晶片之后,在这个时代就有可能出现了。也许是五十年后,也许是二十年后,甚至可能是十年后。

从小学时开始,我就痴迷于许峰雄教授对于计算机国际象棋项目的研究和成就,一直追踪到 97 年“深蓝”战胜卡斯帕罗夫。(就是在那之后不久,我才从国际象棋转投了围棋……)

(注:上图为第一个打败人类的计算机国际象棋程序“深蓝”之父——许峰雄)

从中学时代到大学时代,我一直追寻着许教授的动态和他撰写的各种文章、书籍,他写的《“深蓝”揭秘》(“深蓝”揭秘 (豆瓣))被我翻得都烂了,我甚至在中学时代一直想以此作为未来的求学从研的方向。

许教授离开 IBM、前往亚研院并声称准备致力于作为最终问题的计算机围棋难题之后,我仍然一年年心心念念的期待着许教授的后续动作。

然而十多年过去,等来的却是无数的后来者。

这也挺好,人类就是不缺后来者。

看许教授对当年研究过程的讲述,最大的感受就是:

其实并不是计算机打败了人类,而是人类打败了人类。

大量的计算机专家,配合大量的国际象棋职业棋手,在算法上不断革新,再搭乘上摩尔定律的东风,不断的失败再重来、输了再修正,最终才解决了计算机国际象棋难题。

卡斯帕罗夫,是败给了数以百计的人类专家的智慧的合力。

围棋也会是一样,计算机——今天说人工智能更合适,战胜人类的那一天迟早会来,大部分人都从来不否认这一点。

争论,始终在于这一天的早晚。

而棋手和围棋从业者们,出于可以理解的感情,总是希望并认为这一天不会来的那么快,但他们绝对不会拒绝甚至仇视这种进步。

其实我看到的很多人,都一直期待并赞许着人工智能的进步,甚至很多职业高手还亲身参与和帮助着计算机围棋项目的研究。

我们努力打造着一个“大玩具”,一个能战胜自己的“大玩具”。

所以最终的成功,是我们人类自己的成功,而不应该对计算机感到恐惧。

同时,这“大玩具”也不只是好玩而已,人工智能对于现代乃至未来科技的发展有着极大的意义,这意义甚至会超出当年原子弹研究的后续红利。

所以不要害怕,不要烦恼,让我们期待着人工智能在围棋上战胜人类的那一天的到来吧。

我之前一直认为在我有生之年是看不到这一天的,然而现在看来,我错了。

我一点也不失望,反而感到很兴奋,很激动,并且期待着以 Google 和 Facebook 为首的前沿研究团队们的进一步的表现。

最后的最后,恭喜谷歌,恭喜围棋,恭喜人类。

客官,这篇文章有意思吗?

好玩!预告 App 接着看 (????) ?

再逛逛吧 ˊ_>ˋ

tags:

上一篇  下一篇

相关:

复兴航愿改善飞安 请来专家指导

对于飞安会发布的澎湖GE222最终调查报告,复兴航空今天表示,尊重调查结果,并已邀世界飞安基金会现任执行长

微信朋友圈的这五种人必须删除


  微信朋友圈哪几种人必须要删掉呢?微信已经成为我们生活中,不可缺少

李博雅资料微信私房照曝光 因颜值逆天走红

冬运会的冰壶赛场上,白山队对阵上海队。值得一提的是,在央视直播本场比赛的过程中,白山队三垒李

Facebook社团月活跃用户超过10亿

科技中心/台北报导Facebook今日在台宣布,社团功能的活跃用户每月已超过10亿,意味单单在2015年12月中,Fa

兹卡来势洶洶 专家吁世卫勿忘伊波拉

兹卡病毒在拉丁美洲与加勒比海地区迅速传播,美国研究人员今天呼吁世界卫生组织立即采取行动。路透社报导,

《中时亲子》六月赶进度迎老二 自夸胎梦准

六月常在脸书上分享与儿子“Star”的互动。(翻摄自脸书) 39岁的六月成功赶在40岁前怀上第2胎!她2011年和

Janet做人尚未成功 周年纪念日仅靠视讯庆祝

Janet穿着性感白礼服出席婚纱时尚秀。(陈俊吉摄) Janet谈到与老公拍过的婚纱,不禁笑开怀。(陈俊吉摄)

支付宝的 “关系” 谋略,微信的 “红包照片” 阻击

本文由三节课官方出品,作者黄有璨,三节课发起人,微信公号“黄的世界” 作者。三节课是首家互联网产品主题

有一种菜做起来真是简单,上桌时却很适合表演一番

有这么一个菜,做起来真是简单无难度,上桌时却很适合表演一番,只听得嘶啦一声,香气随之而来,演得好你就

“激扬8年·筑梦远航”都市女人心2016新春联欢晚会圆满成功


激扬8年,齐心同谱辉煌乐章;筑梦远航,携手共进耀眼未来!光阴荏苒,我们依依惜别已成过往的2015;

站长推荐: