当前位置: 首页 » 行业资讯 » 机器人»经过一年的修炼，AlphaGo的哪些能力突飞猛进了？

经过一年的修炼，AlphaGo的哪些能力突飞猛进了？

[点击复制]

发布日期：2017-05-24 来源：雷锋网浏览次数：579

核心提示：　　乌镇围棋峰会第一局曾经停止了，用时4个半小时，以柯洁九段执黑负于 AlphaGo，AlphaGo 赢四分之一子了结，如许河清海晏的成果想必许多人都猜测到了，不外年夜家从一开端就晓得存眷的重点，不在于柯洁怎样输的，

　　乌镇围棋峰会第一局曾经停止了，用时4个半小时，以柯洁九段执黑负于 AlphaGo，AlphaGo 赢四分之一子了结，如许河清海晏的成果想必许多人都猜测到了，不外年夜家从一开端就晓得存眷的重点，不在于柯洁怎样输的，而是AlphaGo曾经退化到甚么水平了，间隔Deep Mind团队出论文来详解AlphaGo有多强还有一段时光，So我们其实可以从现场不雅战中来看出一些眉目。

　　棋速

　　第一局棋下到一半的时刻，很多棋友群里的人沸腾了，发明AlphaGo落子速度异常快，每步棋落子速度在30S－40S之间动摇，对此围棋专业5段赵先生表现：“（这局棋）像安泰逝世，不知不觉就输了，（比拟客岁）机械落子飞快但毛病根本没有”。

　　综合整局，AlphaGo落子表示沉着、武断，而柯洁的落子状态较多变。终究在竞赛停止了四个多小时以后，AlphaGo赢四分之一子。

　　棋风

　　AlphaGo1.0的时刻（客岁3月跟李世石对战的时刻），它的棋风归纳综合起来就是善于记住棋谱+加强进修+盘算才能，身上还能看到人类棋风的影子，等AlphaGo乔装成Master60连胜的时刻，很多围棋年夜师包含聂卫平在内开端评价其棋风“很难忖度Master的作风……它永久都没有脸色，永久不受情感影响，永久一个节拍，就是要赢你。”而明天，第一局棋还没停止的时刻，搜狗王小川已在知乎上发文分析AlphaGo2.0 棋风“完整离开人类经历”——“而AlphaGo2.0离开了机械对人模拟，走棋作风也将完整离开人的定式。在与柯洁的竞赛中，会赓续涌现我们意想不到的走棋，并且这些走棋在教科书中会被以为是初级毛病或许完整弗成理喻，凡是一个正常的棋手都不会这么玩，凡是一个老手这么玩都邑被点拨如许纰谬。而AlphaGo2.0会赓续制作如许的局势，症结他照样对的。”

　　不外最初照样柯洁说了算，他在会后的采访顶用了一个很好的例子解释了AlphaGo的棋风莫测：（在回想竞赛时也对第54手的断）时，他表现了确定：“很震动，这在人类的下法中是不克不及有的。在断以后，它把本身的脚步实地化，变得更厚，一举两得。”。

　　算法

　　AlphaGo1.0的时刻（客岁3月跟李世石对战的时刻）应用的算法精华，依据FB田渊栋看完Nature论文的解读，由估值收集评价棋局，战略收集选择落子，疾速走子（Fast rollout）恰当加快，再用蒙特卡罗树搜刮把以上这三个部门连起来，构成一个完全的体系。

　　这一次固然知乎服装论坛t.vhao.net等活泼地皮曾经开端纷纭推想此次的AlphaGo2.0用了甚么牛叉的算法，有了硬件的猜测掉误，本相照样等Deep Mind前面来亲身颁布，目测算法猜测这个要依据它的单机版10个GPU＋TPU助力猜测比拟靠谱。

　　硬件需求下降

　　依据DeepMind员工揭橥在2016年1月Nature期刊的论文，散布式版本（AlphaGo Distributed）应用了1202个CPU和176个GPU。

　　不外此次竞赛AlphaGo用的何种硬件设置装备摆设，DeepMind在会后的消息宣布会中表现，此次竞赛的AlphaGo是新版本，它改良了新的算法，重要提高是盘算量少了十倍，自我棋战更强。Hassabis称，在竞赛中法式是在一个单一的机械上运作的，这与客岁纷歧样，其时是散布式的。此次有更壮大的算法，运作起来更简略也更好，取得的速度更快。别的Hassabis表现，盘算力可以“在Google云中取得，用的是TPU，十个处置单元，少了十倍的盘算量”。简略点说，此次的AlphaGo是单机版。

　　迭代速度

　　哈萨比在此链接中的剑桥年夜学的一次演讲中提到，之前从零练习一个AlphaGo要三个月，如今只须要一个礼拜（“We also optimized the performance. It used to take 3 month to train a new version of AlphaGo from scratch. Now we can do it in one week.”）。

　　假如称对战李世石时代的版本为V18迭代版本，乔装成Master60连胜并宣告进级完成的时辰为V25版本，如今的AlphaGo又是V若干版本，练习的时刻会不会一周都不要了？这是我们今天要亲身问DeepMind团队的。

　　从单人对战到团队对战

　　心细的同伙确定留意到了，柯洁和AlphaGo棋战以外，5月26号上午还有一场配对赛，配对赛两边－－－古力＋AlphaGoV连笑＋AlphaGo，即棋战两边分离由一名棋手与AlphaGo构成，棋手与AlphaGo协作停止竞赛。5月26号上午下昼则是陈耀华，周睿羊，芈昱延，时越，唐韦星和AlphaGo的5对1团队赛。

　　Google之所以敢如许设置赛制，独一的说明就是，AlphaGo如今既懂人类下围棋的那部门，又懂AI下围棋的那部门，并可以做到融合贯穿，所以它才敢挑衅配对赛这类跟另外一个错误高度合营的赛制，又敢挑衅测试本身“战役力”极限的集团赛。AI最恐怖的部门不是它单个力气有多强，而是它开端理解和方圆“互动”，如许的融汇是否是比客岁3月的人机年夜战恐怖多了呢？

　　小结：

　　前次AlphaGo乔装成Master测试的时刻，柯洁曾经落败给Master过一次，他不是没见识过AI围棋的凶猛，但联合柯洁明天在现场的沉着表示，和他昨晚莫明其妙地深夜感叹，我们有来由信任，这不是一场比AI围棋选手和人类围棋选手哪一个更凶猛的选手，DeepMind团队必定有些悬而未决的谜底须要这场竞赛给一个确定的验证，然后再往谁人偏向完成更深一步的摸索。

下一篇：大数据产业前景广阔未来三年年均复合增长率将达30%左右
上一篇：《中华人民共和国卫星导航条例》已被列入立法工作计划

[ 行业资讯搜索 ] [ 加入收藏 ] [ 告诉好友 ] [ 打印本文 ] [ 关闭窗口 ]

• 7年投资44.2亿元！广东持续推进AI与机器人关键	• 人形机器人商业化落地可期
• 在成都，机器人批量造机器人	• 持续构建创新生态，浦东加速人形机器人多元场景
• 人形机器人生产节奏渐趋明确多家公司布局丝杠	• 从实验室到赛场我国人形机器人迎来迅猛发展
• 机器人产业前景广阔汽车零部件企业入局抢抓先	• 外媒：人形机器人首次在中国汽车工厂协作应用
• 马斯克：今年目标生产5000台人形机器人	• 广东推出12项硬核举措力促AI与机器人产业跃升

第26届上海国际清	2025数控机床与金
2025中国(上海)机	2025武汉国际工业

中舟智能固守科技	玉沣科技：精研滑
新松机器人自动化	罗克韦尔自动化（

我的供应

我的求购

商铺管理

工业机器人及行业应用

智能机器人

工业自动化

智能装备

经过一年的修炼，AlphaGo的哪些能力突飞猛进了？