当前位置: 首页 » 行业资讯 » 机器人»人工智能:读书“破万卷”,难答“小儿科”
   

人工智能:读书“破万卷”,难答“小儿科”

 46.1K
     [点击复制]
放大字体  缩小字体 发布日期:2018-04-08   浏览次数:755
核心提示:(从左至右)崔磊、韦福如、周明、杨南。微软亚洲研讨院天然说话盘算研讨组供图  浏览来自维基百科的536篇文章,答复10万个基于文章内容的成绩,除题量年夜一点,这场竞赛挺像年夜学英语六级测验的浏览懂得测试。

人工智能:读书“破万卷”,难答“小儿科”
(从左至右)崔磊、韦福如、周明、杨南。微软亚洲研讨院天然说话盘算研讨组供图

  浏览来自维基百科的536篇文章,答复10万个基于文章内容的成绩,除题量年夜一点,这场竞赛挺像年夜学英语六级测验的浏览懂得测试。

  但你弗成能听到科场里奋笔疾书的“唰唰”声,由于“参赛者”只是一段代码。输出文章和成绩后,盘算机的中心处置器(CPU)和图形处置器(GPU)开端高速盘算,最初交出答卷,由出题者批阅。

  对来自世界列国的研讨者来讲,这是一场没有止境的比赛——任何人可以在随意率性时光参加,排行榜及时更新;即便是第一位,不坚持“进修”和“更新”,随时有能够被新参加者超出。它能够产生在你吃饭和睡觉的时刻,而“敌手”不外是“啪啪啪”地敲击了一串代码。

  这场比赛全称SQuAD(Stanford Question Answering Dataset)文本懂得挑衅赛,由斯坦福年夜学在2016年9月提议,是业内公认的机械浏览懂得尺度程度测试,也是这个范畴的顶级赛事。

  在2018年1月3日之前,人类一直坚持着抢先的优势——历来没有任何一个团队可以或许设计出一种答题准确率跨越人类的算法。这一天,微软亚洲研讨院天然说话盘算组提交的新模子取得了82.650的准确婚配分数,跨越了人类得分82.304。仅过了两天,阿里巴巴iDST-NLP团队也拿到了82.440的准确婚配分数。

  微软亚洲研讨院院长洪小文告知中国青年报·中青在线记者:“这对微软和天然说话处置(NLP)研讨范畴来讲,都是一个主要的里程碑。盘算机文本懂得才能初次超出人类,预示着该范畴的研讨将会有更年夜冲破。”

  在盘算机看来,人间万物都是一串数字

  微软亚洲研讨院副院长、天然说话盘算组担任人周明博士坐在盘算机前,重要地期待测试成果。经由1个多月对模子和算法的更新,他们提交了最新代码。

  这支团队在SQuAD挑衅赛早期,一度以稳固的成就历久位居排行榜榜首,但周明晓得,这场比赛的排名瞬息万变。2017年最初两个月里,科年夜讯飞与哈工年夜结合试验室、腾讯DPDAC NLP团队前后跨越了他们。

  新选手参赛年夜约两三分钟后,体系就完成了约50篇数百词的文章浏览和约1万个成绩的答复。即便母语是英语的成年人,这个时光也才委曲读完5篇文章。

  “对人类来讲,读完一篇文章就会在脑海中构成必定的印象,好比这篇文章讲的甚么人,产生了甚么故事。人们可以或许易如反掌地归结出文章里的重点内容,但对盘算机来讲不是如许。”周明告知中国青年报·中青在线记者。

  在SQuAD测试中,盘算机须要浏览一段资料,然后答复诸如人名、地舆地位等成绩。分歧于相似测试,SQuAD测试的答复能够是一段短语,而非某个单词或单个内容。它能够遭受同义词调换、句子构造变换等情形,乃至须要综合多个句子停止逻辑推理。

  为懂得决这个成绩,研讨组模仿人类做浏览懂得进程的方法,他们将全部进程分红了四步。拿到测试题后,盘算机起首会进修文本和成绩,就像我们做浏览题时,起首会通读文章,然后审题,取得一个全体印象。

  下一步,盘算机遇将成绩和文章停止比对,找出相干段落,就像人类定位症结信息的环节。接上去,盘算机遇把初步成果放到高低文里比对,相似人会综合全文对待成绩。最初,它会推敲并选出最像谜底的内容。

  在这场比赛中,分歧团队设计的答题形式能够完整分歧。周明引见说,他们的设计中,最奇特的就是第3步,是经由过程“留意力机制”到达的。这让症结信息像被画上了重点一样,成为盘算机眼中高亮的部门。

  “除天然说话处置,留意力机制在图象辨认范畴也是症结的概念。”美国哥伦比亚年夜学盘算机系硕士生何钦尧告知中国青年报·中青在线记者。

  人类视觉可以或许经由过程疾速扫描全体图象后,找到须要重点存眷的区域,并投入更多留意力,以取得更多细节,克制其他无用信息。研讨者也测验考试让盘算机进修并应用这类机制。分歧于人类具有动植物、山水河道的概念,一切单词和图象在盘算机看来都是一串数字。它必需从数字面前奥妙的接洽中,洞悉它们的意义。

  真谛隐蔽在数据和几率里

  周明地点团队应用的盘算机其实不是平空学会做题。加入SQuAD比赛前,它就像“学霸”考前刷题一样,先看过了约500篇文章和与之对应的10万道标题、谜底。

  但周明表现,“今朝基于深度进修的机械浏览懂得模子都是黑盒的状况,很难直不雅地表现机械停止浏览懂得的进程和成果。将来,可说明性的深度进修模子值得进一步探讨。”

  经由过程年夜量进修,盘算机明确了甚么数字意味着与文章内容相干,如何的接洽意味着这就是成绩的谜底。

  “真谛就隐蔽在数据和几率里,我们这个范畴的研讨者年夜多都这么看。”何钦尧说。一个1岁人类孩童看过狗今后,就可以辨认各类体型、种类和分歧拍摄角度的狗,构成概念,但盘算机须要看过许多照片后,能力断定某个物体是否是狗。“我们不晓得人类是怎样构成这个概念的,但对盘算机来讲,概念是靠积聚数据、靠盘算几率得来的。”

  直到20世纪90年月之前,人们还在试图让盘算机学会人类说话的规矩,从而懂得面前的寄义。但说话在应用时常常不标准,机械没法处置偏离规矩的内容。后来,人们开端让机械本身停止进修,获得说话常识。

  成长到明天,天然说话处置范畴的研讨曾经根本可以敷衍单个句子,懂得句子成份。各年夜手机厂商也推出了本身的人工智能语音体系,可以辨认并完成用户的指令,还能停止简略的交换和对话。

  “长文本的懂得一向是难点,这触及句子之间的连接性、高低文连接和逻辑推理等更高难度的内容。”周明说。

  当我们告知盘算机,“莱茵河上最年夜的城市是德国科隆,它是中欧和西欧区域的第二长河道,位于多瑙河以后”,并问它“甚么河比莱茵河长”时,许多盘算机遇答复“科隆”。

  若何懂得代词“它”、懂得“位于……以后”表现比拟而非物理上的前后,成为这些“选手”很年夜的妨碍。人类具有“科隆是城市而非河道”这类知识,简直不会在这个成绩上出错,但盘算机没法懂得这个概念。

  SQuAD比赛不是第一个盘算机“超出”人类的范畴

  盘算机很早就在盘算、记忆的范畴碾轧人类,后来又击败了人类最优良的国际象棋、围棋棋手。

  “其实,盘算、下棋、机械翻译等只聚焦单一义务自己的人工智能都属于弱人工智能,”周明说,“不外弱人工智能其实不弱,它可以具有超出人类的某些才能,有很年夜的价值,然则弱人工智能还没法真正懂得它吸收到的信息,而这就使得通往能人工智能的途径非常艰苦。”

  60多年前,曾有人测验考试让盘算机用6条规矩和200个辞汇做俄英翻译,这被以为是最早的人工智能测验考试。那时的研讨人员信念满满,传播鼓吹能在5年内完整处理一种说话到另外一种说话的主动翻译成绩。

  这个目的至今没有完成,人工智能也由于研讨停顿迟缓阅历过两次高潮。一向到近10年,盘算机机能的年夜幅度晋升和机械进修实际的鼓起让人工智能再次热了起来。人们发明,盘算性能够写诗词、与人对话,它变得愈来愈像人。

  据统计,21世纪以来新开办的人工智能企业中,有近三分之二是在5年内开办的。比来3年,人工智能范畴的失业岗亭数目飙升近8倍。在亚洲,曩昔17年内投向人工智能范畴的51亿美元中,有95%是在曩昔5年内投入的。

  翻看SQuAD比赛排行榜,前3名都是来自中国的团队。“这在曩昔是不敢想象的。”周明说。放在20年前,中国乃至还没有在这个范畴的顶级会议上揭橥过文章。而如今,中国揭橥的文章数曾经稳居世界第二,2017年还有5篇文章当选该会议的22篇出色论文。

  在SQuAD比赛中,盘算机得分比人类高0.346分,可以懂得为异样做1万道题时,盘算机多做对35道。“这远不代表盘算机超出了人类的浏览懂得程度。”周明告知中国青年报·中青在线记者。也有人质疑,这里代表“人类”的,不外是众包平台上一小时挣9美元、受教导程度良莠不齐的人。

  一个公认的人工智能的尺度是可以或许经由过程“图灵测试”——假如一台机械可以或许与人停止交换,而且被人误认为是人,那它就具有智能。

  “ ‘能懂得、会思虑’,这个中,懂得天然说话是最焦点的成绩。”周明说。今朝,盘算机照样很难在平常交换中懂得双关和讥讽。在中文语境下,盘算机还须要面临若何将一个句子拆分为数个辞汇的成绩。许多对人类而言无需进修的工作,例如坚持均衡、用手拿起一个杯子,对机械而言也是非常艰苦的工作。

  机械没有经由几亿年的演变,也没有人类年夜脑里由神经元数百万次电脉冲转化成的触觉、听觉或是视觉。在人类法式员的驯导下,它把一切转化为数字。

  懂得辨认特征的工程师可以经由过程肉眼没法辨认的微调,让盘算机把小狗图片当做鸵鸟,或是将一片马赛克认成猎豹。有时,把中文翻译成英文再翻译回来,整句话都变得面貌全非。

  在人工智能威逼论不停于耳的明天,周明简直没有担忧,他向中国青年报·中青在线记者举了SQuAD比赛中的一个例子。

  机械浏览了“按质量算,氧气是宇宙中第三多的元素,排在氢和氦以后”,面临“甚么是第二多的元素”的成绩,它的答复倒是“氧”。不论是微软照样阿里巴巴团队设计的算法,都不克不及处理这个再简略不外的成绩。

  这不只是人工智能之间的比赛,也是人类和本身的比赛。

只要你关注机器人,你就无法错过睿慕课

 
 
 
[ 行业资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]