近日,机器之心对杨强教授进行了专访,他对迁移学习、人工智能行业与技术进行了深入讲解,并对人工智能从业者提供了众多有价值的建议。
杨强教授
关于迁移学习
机器之心:您目前主要从事哪方面的研究工作?
杨强:我现在做的一项研究是把深度学习、强化学习和迁移学习结合起来,让深度学习有目标。基于有目标的延迟反馈的机器学习在现有的深度学习中做的不是太好,比如RNN能够解决序列到序列的学习(Sequenceto Sequence Learning),但它比较短视,没有最终目标和最终反馈。这就会出现很多问题,比如说推荐系统就没有办法在对话中有效地,自然地使用。同时,在自然语言对话中,只会出现毫无目的的闲聊,使得用户体验会不太好。要改变这些问题,就一定要引入强化学习,这样才可以进行推理并具有长期的目标。同时在这些算法之上再加一个迁移学习的算法层。这样,可以把一个通用的学习模型「个性化」到每个人不同的需求和兴趣上。这是我们目前所聚焦的研究领域。
机器之心:提到不同学习方法的结合,ACM8月份CACM(communication of the ACM)刊文《强化学习的复兴(Reinforcement Renaissance)》,深度学习和强化学习结合的深度强化学习带来了更好的表现,您之前也在演讲中提过两者的结合,能具体解释一下吗?
杨强:强化学习原来特别地难以有效的扩展,这是因为它的状态空间太大;另外,这些状态,都是凭某个专家的经验来人为地定义的,而并不是学习出来的。但是,现在通过和深度学习的结合,我们可以把强化学习的目标和反馈拿出来,把规划的目标转化成一个学习的目标,即lost function,而用来训练一个「端到端的」深度学习系统。DeepMind在这方面就做的比较成功。这样,深度学习就有目的性了,因为可以得到有效的反馈机制来帮助学习。
但是,我们也要看到,这样做了以后,缺点也随之出现——比如说DeepMind那个模型,它是不可解释的,因此很难把人的经验放进去,也很难在这个强化学习模型上面做任何的「知识短路」,即个性化。我们看到,迁移学习是在状态空间上的一种知识短路,这是我们的一个新发现:即迁移学习更容易在知识结构上从小数据中学习。这样,在应用中,可以先训练一个深度学习和强化学习的合并模型,然后用近似的方法把状态显现化,最后,再在这个近似空间的转移中做一个迁移学习模型。这就是我们现在所做的研究。
机器之心:能否介绍一下迁移学习这几年发展的亮点以及现阶段的研究难点,比如您之前提到过的「两个领域衡量标准」问题。
杨强:迁移学习在这几年有挺大突破,比如它和深度学习的结合。迁移学习的一个发现就是用特征做迁移效果非常好,关键是怎么找到这些好的特征将两个领域给结合起来,换句话说,就是要找到合适的迁移机制。我们可以通过什么把知识从一个领域迁移到另外一个领域呢?我们发现最好就是找到一些比较通用的特征,比如说在大陆这边,汽车的驾驶员坐在左边,而在香港驾驶员坐在右边。那么,你怎么让一个大陆的驾驶员一来到香港就马上就适应,而回到大陆又可以迅速调整回来,做到左右逢源呢?那就需要找到一个知识的表达方式——即驾驶员和马路的关系的表达——司机的位置如果是靠路中间,那不管在大陆还是在香港都肯定没错。而这种通用的表达方式就是深度学习可以帮你找到的。当你把两个不同领域都作为输入给深度学习系统,它会帮你找到一个共同的不变的表达,然后就可以通过这个不变量来做迁移。
所以,迁移学习在最近的一个进展就是,通过深度学习发现不同隐含层有不同的迁移能力,比如说,在音频上偏高层就比较容易迁移;视频上偏低层比较容易迁移,但每一层能迁移的知识和量不一样。这样我们对迁移能力就能有了定量认识,又往前走了一步。这只是一个很好的研究方向。但是迁移学习目前比较难的一点,是衡量两个领域之间的距离。过去的研究,学者们只是靠纯统计的方法。而现在,有了深度学习以后,就可以把在不同层次的特征拿过来,发现不同层次的距离是不一样的,而利用这些不同的「知识点」来理解迁移学习的能力。这一点是一个新的突破口。
机器之心:最近有一项关于用迁移学习研究非洲贫困的案例,斯坦福研究者回避了其他收集成本过高的指标,而是使用卫星图像获取的灯光信息来判断贫困程度,您如何看待里面的技术,以及此项研究本身涉及的意义呢?
杨强:是的,这是个很有趣的案例。在这个案例里,灯光就变成了一个不变量。它能反映贫富,又能反映路段,只要预训练灯光,就可以把这段知识迁移到那段去,这是一个很好的例子。但有特别需要说明的一点是,这是其中一种迁移学习的手段,叫传递式迁移,是说从a到b到c三个领域的传递,这个链条可以任意的长,从1到N。其实我们日常中都在用这种方式,比如学生第一学期上的课和最后一个学期上的课就可以看成一个迁移链条,上完这门课再上下一门,很多知识就可以被迁移和应用,新东西学起来就觉得容易,课程一个个过来就可以毕业了。我们人类已经在使用这种方式——把一个难的问题分解成一系列问题。
机器之心:目前迁移学习的研究成果在哪些领域应用的比较好?
杨强:迁移学习在好几个领域都能发挥作用,比如说电商上面的推荐,你做了一个领域的推荐模型,当出现一个新的领域时,就可以迁移过去,这两个领域有区别,但有些是共通的。
第一个应用的例子是推荐系统里的一个非常棘手的问题,就是「冷启动」。就是说,在没有任何用户数据的情况下,我们如何能够让系统推荐的结果还不错?一个做法是,可以从一个类似的领域迁移过来。第二个是「个性化」:每个人都希望在手机上了解我们的智能助手,「懂我」的意思就是已经基于你的需求进行个性化了。使用迁移学习就可以利用你的数据从一个通用模型迁移到你的个人模型。第三应用领域是小数据,大家都知道大数据可以用深度学习做,但大数据的获取只有少数大公司才能做到,而大部分公司是没有这个资源的,他们只有小数据,有个办法就是从大数据获得的模型往小数据迁移。第四个是可以用在隐私方面,我们如果能把一个大数据的模型实现本地化。这样,就没有必要去把本地隐私的数据上传到云端,而个人隐私就可以获得保护,我觉得这是解决隐私问题最有效的一个方式,如果迁移学习能解决的话,那加密、利用随机扰乱等技术来保护隐私的办法都不用做了,因为这些方法对模型的效果影响很大。
机器之心:关于隐私,您在2015年发了一篇关于差分隐私(Differential Privacy)的文章。随着您刚才提到的「个性化人工智能」的推进,敏感数据的隐私问题日渐受到更多关注。您能基于当时那篇文章讲解一下吗?
杨强:这是当时在华为诺亚方舟实验室和上海联通合作的一个项目。我们在电信数据的挖掘上,发现数据挖掘中一个很受追捧的概念就是「差分隐私」技术。这个概念在学术界很流行,但我们发现在工业上,它的应用却很少。这个算法在实际问题中用不了的原因,是它没有考虑一个重要因素:一方面要保护隐私,另一方面要保证模型的表现不下降。如果保护的多,那模型的效果就会下降的就特别多,而这种效果的下降是可以用钱来衡量的。而隐私如果也能换成钱,那么,就可以在这两者间做一个权衡。但是,从来没有人这么做过。所以我们当时写了一篇论文来指出了这一点。也就是,过去大家一味的去关心隐私其实是一种偏颇,而隐私的问题应该把效果和价值来综合来考虑。差分隐私在学术界是一种很优秀的做法,但可能不适合工业界,因为在工业界需要从效果总体上进行权衡。
机器之心:迁移学习可以实现「举一反三」(和人类智能类似),这好像与我们要实现的人工智能终极目标最为相似,那如果接下来人工智能要取得突破,迁移学习会成为其中最关键的路径吗?
杨强:迁移学习只是路径之一,应该说,更重要的是表达学习,即学习知识的表达。迁移是知识表达的一个试金石:如果表达找的好,那就迁移的好,深度学习是表达的一个路径,但不是唯一路径。如果要把知识表达进行分解的话,其中的迁移能力是特别重要的,比如能做比喻学习(learning by analogy)等。
关于人工智能行业
机器之心:您在大企业研究院(华为诺亚方舟、微信联合实验室)、高校(HKUST)和创业公司(第四范式)进行研究,这些机构在研发方法和目标上有何异同?
杨强:在工业界应该是应用研究,更多着眼把一个技术实用化以产生价值,而这个技术最好今天就解决问题;大学是长远的,更理论化的研究,目标比较高远,大学的研究所应该做明天要做的事情。现在我看到一个现象是,公司有实验室在做大学的事情,大学有实验室做公司的事情,我预计这些很难成功。因为他们都在做别人应该做的事情。如果公司做纯高校的事情一定长久不了,他们要产生价值,公司无法去养这么多学者。
机器之心:您提到过人工智能的五个条件:清晰的商业目标、高品质的大数据资源、清晰的问题定义和领域边界、了解人工智能跨界人才、强大的硬件计算能力。「第四范式」这个公司目前在做的金融行业对此非常符合,能否透露一下,公司下一个重点拓展的行业是什么?
杨强:金融可能是我们的第一个点,但第四范式的重要目标是做一个平台,这个平台能够让大众变成人工智能应用者,大家只要自己有数据和应用问题,想利用这个平台,都可以来用。为什么先选择金融领域,传统金融领域需求比较大,门槛比较高,如果在这个领域成为一个领先者就很容易保持优势,有了这个优势之后可以铺开做。
机器之心:科技巨头对人工智能创业公司的收购越来越频繁,这是否会加剧您提到的「人工智能是富人的游戏」这种现象?对于第四范式来说,考虑过被巨头收购的可能吗?
杨强:这肯定会加剧,相信一些创业公司聚集了一批优秀人才,但是也存在有些创业公司的目的就是被巨头收购,最后逐渐就变成巨头一统天下了,小的诸侯国被吞并,秦朝统一六国,这并不有利于百花齐放。
那对于第四范式来说,我们汇聚了机器学习领域的优秀科学家、工程师和咨询专家,从实战中不断优化研发与服务水平。目前第四范式在工业界发展非常好,我们也希望它在科学上不负众望,能够规避人工智能被个别的集团所垄断的风险、从而引导人工智能走向大众,为社会所用,这也是我作为一个科学家的使命。
机器之心:现在看到有种趋势,比如说从论文发表来看,公司在人工智能的某些前沿研究上已经超过了高校。
杨强:因为公司现在有资本有数据,所以吸引了很多人,这些人是冲着资源去的,比如说数据和机器,这是现在的一个阶段。但是比如说理论研究问题,目前我们对深度学习本身的理解还不够深,如果要解决这个问题,就不应该在公司做。但是你要去实现大规模的深度学习系统,利用大数据去做一件前人没有做的事情,那一定要在公司做,在大学做不了。
但特别要指出的是,我经历了很多公司,发现它们并不是像外界所想的那样就一定有数据,很多数据其实是大学来找更加方便,因为大学是中立的、非盈利机构,大家更乐意把数据给出来。