当前位置: 首页 » 行业资讯 » 机器人»如何让无人机灵活穿越满是障碍的房间?训练一个循环神经网络试试看
   

如何让无人机灵活穿越满是障碍的房间?训练一个循环神经网络试试看

 46.1K
     [点击复制]
放大字体  缩小字体 发布日期:2017-03-21   来源:雷锋网   浏览次数:1020
核心提示:  现在,深度进修曾经在语音辨认、盘算机视觉等多个运用范畴获得了严重冲破。但是,要说到它在机械人范畴的成长,那就要另当别论了深度进修在机械人范畴,不只成长速度慢,乃至还遭到许多人的质疑。为何呢?  究

  现在,深度进修曾经在语音辨认、盘算机视觉等多个运用范畴获得了严重冲破。但是,要说到它在机械人范畴的成长,那就要另当别论了——深度进修在机械人范畴,不只成长速度慢,乃至还遭到许多人的质疑。为何呢?

  究其缘由,最主要的一点在于所需数据难以同享——将深度进修运用到机械人范畴,触及到很多详细物理体系的表达。这意味着,所需数据常常是机械人范畴的特定命据集。是以,研讨人员在搜集数据时,就要消耗较多时光;而在处置和情况订交互的自动体系时,则会加倍费时。

  近日,来自鲁汶年夜学的两位研讨人员Klaas Kelchtermans和Tinne Tuytelaars就为处理这一成绩睁开了研讨,并将研讨结果撰写成论文《How hard is it to cross the room ? - Training (Recurrent) Neural Networks to steer a UAV》,宣布在了arXiv上。

  摘要

  我们研讨了在无人机导航掌握中采取轮回神经收集(RNN)取代前馈神经收集(FNN),能否能增长其运动的灵巧性。试验前提是:无人机在履行高等导航义务时,须要用前视摄像头搜集信息。

  为了让无人机经由过程模拟进修学会履行导航义务,我们树立了一个用来练习神经收集、可运用于空中和海洋两种交通对象的通用框架。试验中,我们把框架运用于在模仿情况中飞翔的无人机中,让它进修若何穿越有多妨碍物的房间。

  到今朝为止,无人机掌握的练习进程中平日只应用前馈神经收集。为了处置更多高难度的义务,我们提出,引入轮回神经收集取代前馈神经收集,而且练习一个长短时间存储器( LSTM)来掌握无人机。

  经由过程视觉信息停止掌握属于序列猜测成绩,而且须要高相干性的输出数据。这一高相干性就使得练习神经收集,特别是轮回神经收集,变得不轻易停止。

  为了战胜这一成绩,我们在练习收集时采取了WW-TBPTT法(window-wise truncated backpropagation through time)。别的,斟酌到端对端练习所需的数据平日没法取得,我们将“只对全衔接(FC)停止再练习的掌握层”和“只对长短时间存储器掌握层(所需收集为端到真个练习)停止再练习的掌握层”的表示停止了比较。

  最初,经由过程让无人机穿越有妨碍物房间这一绝对简略的试验,我们曾经能看出练习神经掌握收集所具有的主要指点意义和其优越的理论后果。可视化的差别性有助于说明无人机进修到的行动。

  若何让无人机警活穿越全是妨碍的房间?练习一个轮回神经收集尝尝看

  试验变量:已知和未知的房间、无人机用分歧构架的神经收集和分歧练习办法停止掌握、能否有摄像头;

  S-LSTM 用S-TBPTT练习、WW-LSTM用WW-TBPTT。

  商量和结论

  此研讨中,我们测试了在导航掌握中,存储器(图12)能若何赞助深度神经收集更高效地运作。

  成果注解,用WW-TBPTT去除练习数据的相干性,在练习如长短时间存储器如许的轮回神经收集时,极端有赞助。虽然应用WW-TBPTT 法会使试验方差增年夜,盘算存储值的进程也使练习变慢(如图12最左边一组条形图),但它能经由过程时光长度有用防止滑动截断反向流传的次序误差(the sequential bias of sliding truncated back propagation)。

  别的,试验成果注解,事后练习收集也异常成心义。在导航掌握实验中,仅仅重练习最初一层卷积收集全衔接层(如Inception),比练习端对端练习收集表示更好。练习端对端收集不只须要更多半据,并且时光也更长。也恰是上述这个缘由,机械人(雷锋网("号:雷锋网)注:这里指无人机)在现实运用中才不敷灵巧。

  我们将地下“穿过房间一”和“穿过房间二”两次试验的数据集(它们代表了试验所需数据的庞杂水平),让其他研讨人员能以此为参考尺度,进修导航掌握。

  最初,我们还想强调,想要翻开深度进修这个黑箱子,差别化评价法和可视化长短常有需要的。

 
 
 
[ 行业资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]