Vincent Vanhoucke是Google的首席迷信家,斯坦福年夜学电子工程学博士,今朝在Google Brain主导机械人相干的项目。Vanhoucke重要的研讨范畴是语音辨认、盘算机视觉和机械人等范畴,他还行将掌管机械人范畴的嘉会CoRL 2017(Conference on Robot Learning)。
Vanhoucke以为,机械智能如今曾经成长到一个相当的水准,在某些特定情境下的表示可以媲美(乃至超出)人类,好比机械视觉、机械翻译、语音辨认,如今是时刻让这些才能在物理世界中施展效应了。他在明天的演讲中提到,robotics的研讨如今也正面对着一场深度进修的改革,完成这一点,须要如今的机械进修从业者跳出监视进修的温馨区,面对一些辣手的成绩:数据稀缺,若何使机械完成技巧转换和连续性的进修等等。Vanhoucke也提到,这也是人工智能从实际到理论的必经之路。
Vanhoucke说,2011年,语音辨认研讨者采取神经收集技巧下降语音辨认,毛病率年夜幅下降,是语音辨认范畴十多年来最年夜的提高;2016年,简直就曾经到达人类水准了。
而机械翻译,2014年机械进修的引入也让机械翻译有了质的提高,但要说到达人类水准,照样比拟委曲……
(看keynote上的名单,为Google的机械翻译做出进献的,华人数目很多。)
这个柱状图是人类翻译、神经收集翻译和PBMT翻译的质量差异,顺次递加。
Vanhoucke以为,机械进修研讨比曩昔更轻易了,有更多的开源对象和模子,更多的收集教程(他本身就在Udacity上开了收集课程),GPU和高机能盘算硬件门坎也变低了,研讨者也比之前更多。
图片辨认范畴,除底层技巧的完美,Google曾经将图片辨认技巧运用在医疗范畴,赞助大夫诊断病情,而且取得了一些成效。
但他也说,图象辨认如今远远没有到“succes”的田地,有40%基于图象监测做的决议计划,成果是很蹩脚的。
接上去是机械人的部门。Vanhoucke是电子工程专业出生,在Google Brain重要的任务是机械人项目。他先强调了一个和许多人认知有收支的不雅点:今朝的机械人研讨其实跟深度进修没有多年夜关系。
他做了个示范,让手里的笔失落在地上,说,假如机械人的义务是抓取笔的话,那末捉住了和抓不住,从内部不雅察不到机械人的举措有甚么差异(按:是以不克不及从中获得甚么纪律)。
机械抓取特定的物体是有迹可循的,抓取未知的物体还没有法处理。(Vanhoucke播了一段机械人摔交集锦视频,说曩昔他认为这些机械人摔交很可笑,然则后来本身开端做机械人项目以后,看到这类画面就再也笑不出来了。研讨机械抓取真的很难,但他很enjoy。)
越是少的图象辨认技巧参与,机械的鲁棒性就越好,能应对更庞杂的物体。后续有听众问及抓取对象的数据库时,Vanhoucke说他们(Google)其实不愿望树立一个如许的常识图谱。
强化进修的引入关于机械人的研讨能够有赞助,条件是先有一个能发生海量样本的参照模子。
最初的结论:
1、robotics和机械进修正在产生成心思的融会;
2、关于惯例的robotics成绩,要有做出分歧谜底的觉醒;
3、It hits all the right difficult problems on the road to practical AI。