当前位置: 首页 » 行业资讯 » 机器人»AlphaGo Zero下棋赢了它“哥”,AI自主学习的时代到了吗?
   

AlphaGo Zero下棋赢了它“哥”,AI自主学习的时代到了吗?

 46.1K
     [点击复制]
放大字体  缩小字体 发布日期:2017-10-25   浏览次数:811
核心提示:  以往,我们提起AI,有一个共鸣,即它在某些方面曾经碾压人类,好比下围棋;它在另外一些方面远不及人类,好比熟悉一只植物、熟悉许多只植物。缘由之一是AI自立进修才能远不及人。  头几天,AlphaGo Zero横空降

  以往,我们提起AI,有一个共鸣,即它在某些方面曾经碾压人类,好比下围棋;它在另外一些方面远不及人类,好比熟悉一只植物、熟悉许多只植物。缘由之一是AI自立进修才能远不及人。

  头几天,AlphaGo Zero横空降生,从零开端,闭关72小时自我棋战围棋,即100:0完胜之前用了几个月时光生长、胜了李世乭的AlphaGo。这仿佛注解,开辟某个专项智能时,AI算法不再像曩昔那样动辄须要百万、万万量级的有监视年夜数据,算法乃至可以从0数据开端自立进修,顶多只需年夜范围无监视数据。

  因而,许多人惊呼AI自立进修的时期到来了。仿佛很快就会有一个叫做AI Zero的学神小瑰宝横空降生,自立狂学一个月,立时长年夜成人,酿成一个智商、情商超出人类的AI 100。

  但现实生怕并不是如斯。

AlphaGo Zero下棋赢了它“哥”,AI自主学习的时代到了吗?

  我自己是做盘算机视觉研讨任务的,尤以人脸辨认方面的研讨比拟多。便借AlphaGo Zero之春风,我也做了个Face Zero的梦,想了想人脸辨认从0自立进修的能够性。

  AlphaGo Zero自造数据的思惟很难扩大到Face Zero

  先看看AlphaGo Zero学神怎样做的:从0开端自造数据。对人脸来讲,这个第一步就有点悬了,若何造人脸呢?围棋有明白的落子规矩和胜负断定原则,按规矩模仿棋战便可造出年夜量有监视的数据。可儿脸若何从0造?假如没有任何的人脸样例或常识,除非天主他白叟家在,不然怕只能造一堆“鬼脸”出来——横竖谁也没见过鬼,怎样造都行。

  假如如许,怕是这梦只能醒了。

  那,至多给一张人脸,让算法本身“触类旁通”,发明千万万万张人脸可行吗?好比给算法一张年夜奥黛丽赫本的人脸图象,让算法把赫本这张人脸照片变啊变,变出1000幅赫本女神的人脸图出来,再变出不计其数不是赫本女神、但长相公道的人脸。

  且不说怎样变形的困难,这外面有两个成绩须要处理:若何包管算法“触类旁通”变出来的人脸照样女神的脸而不是孙悟空、猪八戒的面部照?和,若何包管算法可以“触类旁通”变出奥巴马、猫王等各类人的面部照?要处理这两个成绩,我们须要年夜量人脸的样例或其他常识,好比人脸的3D构造、成像的物理模子、老化模子、脸色模子、眼镜模子等等。

  这就和最后“给一张人脸”的假定抵触了,这梦便只能是南柯梦了。

  再退一步,即便我们有赫本女神人脸的3D构造和成像模子等,这两个成绩依然须要处理:甚么幅度的3D形变,好比变胖或变瘦或变老,可以确保照样赫本自己而不会酿成其别人? 甚么样的形变可以确保变出一个公道的人脸,而不会变出一个史瑞克或猪八戒?

  人脸辨认在这里表现出一个和围棋棋战的较年夜差异:围棋有明白的输赢剖断规矩,而人脸辨认并没有一个如许的“剖断”规矩。所以,人脸辨认算法假如也应用对AlphaGo相当主要的加强进修办法,借“试错”完成自立进修,不太实际。这就像先生做模仿题,假如做完题不给他谜底,不给他失言在哪,甚么是对。他生怕难以提高。

  应用年夜量无监视数据的思绪也很难扩大到Face Zero

  退一步,看看AlphaGo Zero其他处所有无值得自创的。据AlphaGo Zero的论文所说,其焦点的地方是用加强进修来主动进修用于启示式搜刮的评分函数(价值收集)。对人脸辨认来讲,其焦点现实上也是进修一种评分函数,即盘算两张人脸照片的类似水平:统一人图象类似度尽可能高,分歧人类似度尽可能低。

  看起来有点机遇。既然从0或从1开端不可,那末,能否可以给算法1亿张无监视(即没有标签)的人脸照片数据,然后让Face Zero自创AlphaGo Zero的思绪进修评分函数呢?

  遗憾的是这也不可。由于我们应用的是无监视人脸图象,我们不晓得这1亿幅人脸图象是若干人的图象,个中哪些是统一人的,人脸辨认算法又不克不及像围棋算法一样本身断定对错亲睦坏,固然就没方法自我加强起来。

  所以进修这个类似度评分函数掉去了根据。

  又是黄粱一梦。

  看到这里,懂生成式反抗收集(GAN)的读者能够会辩驳:有了年夜量人脸图象,即便是无监视的,我们也能够用GAN如许的类“加强进修”战略来生成各类看起来相符真实人脸“散布”的人脸图象。

  如许一来,给定一张赫本女神的人脸图象,Face Zero便可以生成她的各类美图了吗?可是,成绩在于,没有了那些主要的监视信息,只能包管GAN生成的人脸图象看起来是张脸,但没法包管她不会变猫王或奥巴马。

  这触类旁通的设法主意,生怕照样不可。

  AlphaGo Zero的思惟对削减人脸辨认有监视数据需求量的价值较小

  再退一步,AlphaGo Zero的思惟能否可用于削减有监视数据的需求量呢?例如,依照今朝的办法论,用深度进修做人脸辨认,起首须要搜集整顿尽可能多的人脸图象,好比100万人的1亿张有标注的照片,然后让深度进修算法用这些图象进修若何提取可以辨别分歧人脸的好特点或许若何盘算类似度评分函数。

  好比,先给人脸辨认算法供给1万人的有标注人脸图象,让它学会辨别1万人的人脸,然后让它“举一反百”、“举一反千”、“举一反万”,即从这1万天然出100万人、1000万人、1亿人,乃至全球一切人的图象。

  这个设法主意假如可行,那我们对数据的需求量就削减了100倍,这意味着在搜集和标注数据方面,年夜幅下降了本钱,从而使得深度进修算法的易费用“蹭蹭”的进步。

  为此,一种能够的方法是用GAN如许的类加强反抗算法“发明”分歧的人脸。在“发明”第10001小我的脸部图象时,请求其既与之前的10000人都分歧,又要确保第10001小我的脸部图象看起来是真实的照片,而不是卡通人像或鬼脸。

  遗憾的是,依照今朝GAN的思惟,是有局限的。GAN可以“内插式发明”,要“内涵式发明”是有极年夜风险的,假想:假如算法能从10000个白人主动内涵出从没见过的某个黄种人,怎样包管不过延出绿伟人?假如算法能从10000个鹅蛋脸主动内涵发明出从没见过的国字脸,怎样包管不发明出被压扁的长条脸?

  那末,我们把GAN的才能限制在内插式发明。这请求我们在下面提到的10000小我具有足够的代表性。“代表人”经由精心遴选,平均笼罩各类脸部属性,如肤色、男女、脸型、眉形、眼型、嘴型、高下鼻梁、高下颧骨、粗细肌肤……如许一来,便可之内插发明出各类能够的人脸了。

  然则,10000人能否足够代表全部人类的特点?这里触及几十乃至上百种脸部属性的组合。每多一个脸部属性,组合成果的数目便多几倍,呈指数爆炸式增加。就算每一个属性只要2个能够的取值,好比男女,即便只要14种脸部属性就有跨越10000种组合。更况且,许多属性有许多取值,好比脸型、肤色、眼型,组合数就更多了。

  假如每种组合我们须要至多一个“代表人”(现实能够有些组合1个代表还不敷,也有能够某种组归并不存在),这意味着我们须要的“代表人”数生怕远远不止10000人…

  Face Zero的梦真要醒了吗?

  削减有监视数据需求量的其他能够

  别急着废弃做梦,下面的推演中并没有斟酌人类对面貌的熟悉。以人脸辨认为例,剖解学专家也许可以制订出一些“规矩”,告知我们甚么样的面部改革可以“发明”出分歧但又现实存在的人脸。如斯,即可应用大批有监视数据“发明”出或许说“虚拟”出年夜量数据,从而使得深度进修的易用性更高。

  举个例子,假如我们有10000个“代表人”的3D头部模子,和响应的可以修正这些头部模子的办法,加上上述的“剖解学专家经历”,便可以像天主一样发明出千万万万的人脸,且照样现实存在的、公道的人脸,而非绿伟人的人脸。

  如许一想,仿佛最开端的设法主意在必定水平上成真了。但遗憾的是,这类设法主意离我们最后盼望的从0自立进修差了十万八千里了:既须要浩瀚的准确监视3D人脸数据,又引入了年夜量的不轻易用法式完成的“专家常识”。

  总之,仅仅以人脸辨认Face Zero为例,AlphaGo Zero的启示是微弱的。谨严悲观的说有一些,但这类启示并不是AlphaGo Zero带来的,而是谁人下围棋胜过李世乭的AlphaGo,乃至之前就曾经有的“反抗加强”思惟带来的。

  这使人遗憾。现实上不只仅对人脸辨认,对天然图象辨认义务,对语音辨认义务,对医疗诊断义务,对主动驾驶义务等浩瀚成绩,AlphaGo Zero的算法都难以发生直接的感化。面前的基本缘由在于:与围棋终究可以自判胜负纷歧样,对这些义务不具有AI算法自判对错的才能,也就难以构成以自我赏罚为目的的自立进修。

  注:本文的推演其实不解释AlphaGo Zero的算法对一切AI成绩都没有价值,现实上,它对一年夜类AI成绩的处理,特殊是棋类、游戏类、模仿练习等义务,将带来办法论上的伟大变迁。

只要你关注机器人,你就无法错过睿慕课

 
 
 
[ 行业资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]
 
 
展会更多+
视频更多+
点击排行
 
网站首页 | 网站地图 | 排名推广 | 广告服务 | 积分换礼 | 网站留言 | RSS订阅