一剑西来天外飞仙:AlphaGo与围棋变革
2017-06-07 08:28:00 来源:中关村在线(北京)

(原标题:一剑西来天外飞仙:AlphaGo与围棋变革)


第1页:AlphaGo的计算力与配置

【中关村在线原创】前不久在浙江,围棋目前ELO等级分第一、多次世界冠军柯洁与Deepmind的人工智能围棋程序AlphaGo的三番棋落下了帷幕。第三盘上我们看到了柯洁的泪水。第二次人机大战让全人类见识到了今天的AI在卓越算法和深度神经网络的双重合力之下,如何征服了人类几千年来积累的围棋的理解与经验。最遗憾的是,DeepMind宣布AlphaGo收山了,世间只留下一段传奇。


一剑西来天外飞仙:AlphaGo与围棋变革
中国棋院授予AlphaGo第43个正式九段证书

AlphaGo的计算力与配置

这次人机大战,第二天的AI论坛爆料很多,可惜后面记者的提问都没有问DeepmindAlphaGo的首席DavidSilver更多关于AlphaGo的技术细节。但就已知的来说,李世石版本的需要1300多个处理器加上280个GPU,这个版本改进了,所以只要4个TPU就可以,所以后来公布的棋谱,应该是部署了很多对AlphaGo一起下的,这样可以几天就收集到数以百计的狗的慢棋棋谱。

一剑西来天外飞仙:AlphaGo与围棋变革
TPU2代的配置可以看出TPU:CPU大约就是2:1的比例

AlphaGo的硬件架构大幅度的缩减但是棋力却大幅度提升,作为科技领域的记者,我在想的问题是,抛开软件是算法,到底需要多少计算能力就能达到Master的棋力?神经网络拼的是“神经元”节点的数量,并非CPU有多快,一般来说就是TPU:CPU=2:1。也就是说配合一个双处理器的至强E52699插满内存,加上4个TPU二代(满打满算,实际用的一代)就可以实现碾压所有人类的棋力。

一剑西来天外飞仙:AlphaGo与围棋变革
能买到的最强机器学习加速卡:nVidia的TESLAP100

再换算一下,因为我们买不到TPU,那是谷歌内部使用的。在性能测试上,TPU2的计算能力是45TFLOPS,四个就是180T,而NV刚刚公布的新DGX-1是8个TeslaP100,有170T的能力,大体上二者相当。也就是日本的DeepZenGo的配置,双至强2699V4+4GTX1080其实也差不多够了,只是“地震狗”的算法比真狗差太多。

一剑西来天外飞仙:AlphaGo与围棋变革
TPU在AI领域被寄予了无限的希望

换言之,实际上的AlphaGo是一代TPU4个,因此可能只要4个TeslaP100可能就已经具备了相对应的计算力。Google自己搞TPU除了为自己的TensorFlow优化,还有避免花太多钱买GPU的意思,而定制的TPU还可以让学习的效率更高。


第2页:AlphaGo的棋力极限在哪里

AlphaGo的棋力极限在哪里

很遗憾的是,我们没有看到以后也极可能没有机会看到AlphaGo下对顶尖棋手的让子棋,只有内部测试的对历史上版本的让三个子,鉴于DeepMind一直一来的谦虚传统,真觉得真相未必这样。


一剑西来天外飞仙:AlphaGo与围棋变革
DeepMind内部的测试与柯洁对战的版本比对李世石的版本棋力要强3个子


一剑西来天外飞仙:AlphaGo与围棋变革
AlphaGoMaster版本对战的棋谱第二盘震惊了整个围棋界

其实结合公布的50盘自战谱,可以发现我们认为AlphaGo不行的什么大混战什么打劫,都是井底之蛙。之前对人的60盘快棋里面,基本都是50手左右人已经不行了,人太菜,连见识疯狂对杀的机会也没有。

一剑西来天外飞仙:AlphaGo与围棋变革
人机配对赛出现了AlphaGo投降、但是古力觉得还能下的有趣一幕

再结合古力和Master配对的传说,古力两三手棋,就让胜率从75%掉到了45%,AlphaGo就是下让子棋,哪怕让你2-3个子,你下出了立二后拆三之类的棋,它后台胜率就能提升一截,多下几步你觉得“正确的应对”、“必然的一手”“本手”可能就丧失了让三个子的大优势拉回到同一起跑线,再然后进入它的步调,当然让子的存在可以有特殊的应对策略。

柯洁在后来的Blog里面也说,以后如果Master再出来下棋,人应该恭恭敬敬的摆上两个子,以表示对棋力的尊重。


第3页:千年的理论就此打破?

千年的理论就此打破?

我们从小知道3平方+4平方=5平方,这是基本的数学。平方推广到n的时候有没有整数解?这是费马定理,用到的办法叫代数数论,在数学的层次上就高的不知道哪里去了。最近有张流行的图片,数学的海洋,我觉得用来比喻人与Master的差距还是很合适的。


一剑西来天外飞仙:AlphaGo与围棋变革
数学的深渊来比喻人和AlphaGo对围棋理解上的差距还是很合适的

所以当我们去欣赏它的着法的时候,有种深深的无力感。当时Master的60盘的时候,很多棋手就是下着下着就不行了,现在大家共同的理解是,在狗看来,它自己每一步都走到了全局看最优的地方,而我们还在拘泥于过去的传统结构当中。

一剑西来天外飞仙:AlphaGo与围棋变革
点星位33是围棋初学的定式,但是AlphaGo的处理带给我们的思考是革命性的

一剑西来天外飞仙:AlphaGo与围棋变革
人工智能AlphaGo教授告诉我们应该这么下,局面是两分的

比如讨论的非常多的星位点33,我觉得应该这么看,下在星位肯定是不坏的,33点了之后取实地,哪怕只几目,在AlphaGo的评估里面也不算差,以后点三三的定式应该大家都按照AlphaGo的下法飞了之后顶,守角的扳了走别的地方。当然我们觉得总体来说点三三不便宜,因为人家走在外面厚,点的人里面目不是太多。但什么是薄什么是厚?可能你15子的配置不如人家12个子的效率高,那就别聊薄厚了,AlphaGo早就教育我们不是面向某个方向有一些棋子就叫厚。

一剑西来天外飞仙:AlphaGo与围棋变革
人机大战第一局AlphaGo下到数字标号5的时候,人普遍认为是后手不好(图:新浪棋牌新闻)

所以过去我们概念里面的俗手、先后手、无理手这些概念真的还成立吗?柯洁的第一盘,AlphaGo的一断是后手,但是人家一个子关系到后面很远的发展,所以来了个“后中先”,但说实话我觉得这就是人不如AlphaGo的地方,AlphaGo眼中那就是急所应该先走的地方。棋力远高于所有人的Master起码不这么认为,步步下在全盘看来价值最大的地方,那么它的每一步就都是先手,都有道理,没有俗手。当然那得是它下出来的,人学个皮毛下出来的应该还是臭棋,因为你这个应对没有算到AlphaGo那么远,效率低。前几天的LG杯上就出现了不少AlphaGo自我对战的新的着法。


第4页:什么叫技术领先?

什么叫技术领先?

围棋AI,可以分为两种。正式比赛过的V18和Master,其它的都是仿品。


一剑西来天外飞仙:AlphaGo与围棋变革
Nature的论文告诉了全世界AlphaGo实现的原理

其它的围棋软件研发团队翘首以盼的无疑是新论文。怎么去定义科技领先?第一篇论文发表之后,棋界表示樊麾太臭,根本不是我的对手……事实教育了李世石,也让人感受到了它的强大之后,Master的60盘应该是让棋界彻底服了。

一剑西来天外飞仙:AlphaGo与围棋变革
DeepMind的哈萨比斯表示6月将发布新论文来解释Master为何比李世石的版本更强

但是这期间受到公开的论文启发,诞生的模仿AlphaGo的软件不少,投入的资源也颇多,但是都达不到正品的棋力,并且找不到改进的办法,这就是技术落后,单无论如何,论文已经把围棋软件的能力带上了一个前所未有的高度不是吗?前年我们还都一致的认为计算机围棋战胜人类还得几年呢。

一剑西来天外飞仙:AlphaGo与围棋变革
AlphaGo只是验证AI有效性的工具,其目标远大

新论文很可能会告诉我们从12层深度神经网络到40层,这28层的差异是什么,层与层之间如何去相互影响,用什么办法可以提升整个软件的效率,DeepMind说提升10倍,笔者个人觉得觉得少了,因为它的硬件配置上少了太多但是棋力更强,效率应该不止10倍。当然DeepMind那个层面考虑的是这么做对于机器学习来说意义在于哪里,更高效率的深度神经网络对于整个科技界甚至谋求人类福祉的意义在哪里,如何更好的利用而不仅仅是下围棋。

对于其它的围棋AI这些来说,新论文及模仿实现一定会让这些软件有了大幅度的棋力,Deepmind的意思也在这里,这些软件提升了(而且我的论文展示的技术和理论保证你也能学用),就足够指导现在的人类顶尖高手去提升围棋水平了。Master收山以及不玩机器对机器的对抗也就意义在于此。

本文属于原创文章,如若转载,请注明来源:一剑西来天外飞仙:AlphaGo与围棋变革http://oa.zol.com.cn/642/6422051.html

  • 为你推荐
  • 公益播报
  • 公益汇
  • 进社区

热点推荐

即时新闻

武汉