当前位置: 首页 » 行业资讯 » 机器人»汤晓鸥:人工智能的中国式文艺复兴
   

汤晓鸥:人工智能的中国式文艺复兴

 46.1K
     [点击复制]
放大字体  缩小字体 发布日期:2018-01-30   浏览次数:528
核心提示:  1月28日,喷鼻港中文年夜学信息工程系传授、商汤科技开创人汤晓鸥在新兴科技峰会EmTech China上揭橥了题为《人工智能的中国式文艺中兴》的演讲。  商汤科技开创人汤晓鸥  下文为演讲内容整顿:  明天,我

  1月28日,喷鼻港中文年夜学信息工程系传授、商汤科技开创人汤晓鸥在新兴科技峰会EmTech China上揭橥了题为《人工智能的中国式文艺中兴》的演讲。

汤晓鸥:人工智能的中国式文艺复兴

  商汤科技开创人汤晓鸥

  下文为演讲内容整顿:

  明天,我讲的标题是《人工智能的中国式文艺中兴》,这个标题我在上海讲过一次,我这小我不太爱好反复本身,因而我又想了一个新的标题——《人工智能的中国式十月反动》。

  言归正传,我想年夜部门中国人都应当晓得《战狼》,一会儿赚了56亿。这在15、20年前是弗成能的;那时刻许多人会去买盗版的VCD,或许去网高低载一个盗版。假如如许,导演和演员也就没有动力再持续保持下去了。明天,中国片子的结果最主要的推进力就是我们对原创和版权的尊敬。

  我们如今不是只要一部片子如许胜利,好比《羞羞的铁拳》赚了22亿,《青春》到达14亿的票房,《后任3》是18亿,《无问西东》做到了5亿票房。所以,对原创的尊敬使得中国的原创片子赓续往前成长。在三四十年月,全球片子成长起来时,中国片子其实不落伍,像《马路天使》、《一江春水向东流》一点也不输给好莱坞片子。

  再往前,说一下文艺中兴的时刻,假如米爽朗基罗的这些作品或许任何一个艺术品很快有人停止复制,那末他能够也赚不到钱活不下去,所以,关于原创的尊敬也是文艺中兴能真正鼓起的一个缘由。

  说到原创,上面我们来说讲人工智能。假如我讲人工智能,年夜家第一能想到甚么公司?是谷歌。但总有一天,人工智能高潮会曩昔的,到那天年夜家必定能想到商汤科技。

  为何是谷歌?由于谷歌真的把资金投入人工智能成长,2015年的研发经费达120亿美金。2014年有一家公司叫DeepMind,只要12个员工,没有赚钱,只是在用深度进修玩游戏和下棋,然则谷歌消费6.6亿美金收买了这家公司。假如是在中国,年夜家就会花几百万美金把人一个个挖过去,那要廉价很多。然则假如那样做的话,就不会有后来的AlphaGo了。 AlphaGo以后,谷歌又做了AlphaGo 2和AlphaGo Zero,有些公司开端学着AlphaGo下围棋,还有的公司选择打扑克牌,但从某种意义上讲,这都是跟在他人的前面干事情。

  真正成心义的工作是在AlphaGo之前你做了甚么?有无做甚么工作让机械在某项义务上克服人类。在AlphaGo之前我们做了一件工作,2014年,我们团队从事人脸辨认,在全球第一次让机械的人脸辨认才能跨越了人的眼睛,像AlphaGo一样,在某一小我类界说的单项义务上,机械超出了人类。

  超出了人类就过了一条红线,而过了这条红线便可以在工业长进行运用。然则在真正运用的时刻,发明过了红线照样不敷用,从试验室到年夜范围家当化还有很长的路要走。2014年,我们用20万人脸来对机械停止练习做到了98.5%的精确率,而人是97.5%;2015年我们用30万人脸停止练习,到达了99.55%的精确率;2016年,我们用6000万人脸练习可以到达了百万分之一的误识率;2017年,我们用20亿人脸练习可以到达一亿分之一的误识率,而如许的误识率才可以真正地运用到各行各业,包含监控、金融、安防、手机等行业。所以,我们和高通签订了全球AI计谋协作协定。

  那末除人脸辨认,我们如今还做甚么?这个技巧是行动检测,我们用盘算机视觉剖析的办法,可以从很长的一段视频里把重点内容检测出来,你便可以直接跳过没成心义的部门,直接看这些风趣的、真实的镜头。还有基于内容的视频搜刮,在片子中我们可以把各类各样的片断搜刮出来,好比说你想搜刮武感动作片断,或许悲剧片断,我们可以直接把它搜刮出来,或许你想搜刮科幻的,我们可以把科幻的片断搜刮出来。

  和用天然说话描写来停止场景搜刮,我们用天然说话来描写一个片子中的场景,然后它便可以主动依据你的描写把这个片子片断搜刮出来,好比,我们要搜House of Cards中的一个片断,“Claire和Frank坐在蓝色沙发上”,年夜家看到上面这段场景就出来了。别的,我们不只能把视频剖析出来,还能懂得这个视频,然后用天然说话描写出来。好比上面这些活动视频,机械便可以像讲解员一样来描写活动场上产生的工作。

  IJCV是我们这个范畴的两年夜顶级杂志之一,作为IJCV的主编,我会在每一年的ICCV和CVPR两个盘算机视觉顶级会议上,主办IJCV Night晚会,约请几百位顶级学者加入。上面这个演示里我们把片子场景里的一切物体都检测出来,演员是哪个演员,他穿的是甚么衣服,这个场景是在餐厅里,一切的桌子、花、椅子全体可以或许及时的主动检测出来,如许的技巧在之前长短常难的,然则如今我们都可以做到了。

  再回头来看我们若何用这些技巧来剖析后面提到的片子《战狼》和《羞羞的铁拳》,我们经由过程剖析这些演员的举措和他们之间的关系,可以剖析出来在分歧的场景之下,这两个演员是谁,在做甚么,这个片断是甚么类的情节。

  同时,我们可以辨认每帧情节分类,每个镜头是斗殴场景照样爱情场景。我们也能够把一个片子最出色的镜头提掏出来,年夜家可以遴选好比举措的出色镜头、情感戏的出色镜头、喜剧的出色镜优等等。

  那末总结起来,我们在做甚么呢?我们是在教机械看片子,一开端我们是教机械来辨认人脸,Google是在教机械来下围棋,而如今我们来教机械取代人看片子。这个感到有点怪,我们让机械来做下棋,看片子,玩游戏这些风趣的工作,然后我们人类只担任给机械充充电,维修和颐养。

  我认为年夜家听了这个必定认为很好笑。现实上一切的义务,都是我们人支配给机械做的,机械是依照我们的指令在干事情,不存在机械掌握人类如许的工作,AI的真正目标是赞助人类,赞助我们进步临盆效力。

  最初给年青人留下两句话:第一句,片子必定要本身亲身去看。第二句,AI这个词在中国拼音翻译过去就是“爱”,所以谈爱情也要本身亲身去谈,不然你就不止“后任3”了,很有能够“后任4”、“后任5”了。

只要你关注机器人,你就无法错过睿慕课

 
 
 
[ 行业资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]