当前位置: 首页 » 行业资讯 » 机器人»想让机器人更快更好的掌握抓取技术?给它们找个喜欢不停捣乱的陪练吧
   

想让机器人更快更好的掌握抓取技术?给它们找个喜欢不停捣乱的陪练吧

 46.1K
     [点击复制]
放大字体  缩小字体 发布日期:2017-06-10   浏览次数:1130
核心提示:  为了晋升机械人完成操作义务(如抓取)的才能,卡耐基梅隆年夜学(CMU)和谷歌的研讨人员让机械人经由过程反抗练习来赓续提高。在练习中,敌方机械人会试图障碍另外一台机械人抓取物品(就像工夫熊猫中阿宝和徒

  为了晋升机械人完成操作义务(如抓取)的才能,卡耐基梅隆年夜学(CMU)和谷歌的研讨人员让机械人经由过程反抗练习来赓续提高。在练习中,“敌方”机械人会试图障碍另外一台机械人抓取物品(就像工夫熊猫中阿宝和徒弟用筷子抢包子)。固然,研讨人员还预备了更高难度的练习项目,他们有时会让统一个机械人的两只机械臂直接玩“阁下互搏”,让一只机械臂阻拦另外一只抓取物品。

  你晓得在机械人研讨中甚么最无聊和有趣吗?固然是练习它们抓取分歧的物品。如今有了 AI,研讨人员不再用看着这些“傻孩子”进修了,在自监视进修形式下,机械人会经由过程分歧的方法赓续测验考试抓取物品。不外,这一进程能够要消费数千小时,并且即便机械人年夜致控制了抓取的技能,它也很难懂得甚么才是最棒的抓取方法。

  这类练习方法的成绩在于,年夜多半时光这些技巧都在应用最根本的传感器来对待抓取的举措,如许的视角过于二元化,它们只在意机械人能否拿起了目的物体,只需拿起来就算胜利。不外,在实际世界中抓取能否胜利可不是这个尺度,由于不稳固的抓取会让物体坠落的能够性增年夜。另外,假如让机械人抓起一个盛了汤的碗,现有的粗鲁抓取法确定弗成取,究竟实际世界不是试验室。

  出于这一斟酌,CMU 和谷歌的研讨人员决议将博弈论和深度进修用在机械人的练习中,而他们用到的办法就是开首提到的“扰乱法”,一台机械人会千方百计让敌手没法抓起目的物体。

  上周,该项目介入者 Lerrel Pinto、James Davidson 和 Abhinav Gupta 在 ICRA 展现了他们的研讨结果,研讨人员将这类反抗的办法描写为“双人零和反复博弈法”(零和博弈来自有名的博弈论)。在相互“拆台”的战役中,两边都用到了卷积神经收集,一方会专注于抓取物品,另外一方则要阻拦对方抓取物品。

  在练习中,同心专心要抓取物品的机械人不只要躲过对方赓续袭来的“黑手”,还要处置重力、惯性和磨擦力等身分带来的影响。假如想进一步晋升机械人的抓取才能,还可设定抓到物品机械臂就会摇摆几下的坏招(愿望抓娃娃机老板不要学会这一招)。如许一来,加上另外一只一直扰乱想要掠夺物品的机械臂,机械人的抓取才能就可以晋升到新的境地。

  假如扰乱的机械臂胜利打失落或抢走担任抓取机械臂手中的物品,那末此次抓取义务就算掉败,在练习进程中抓取法式会赓续从掉败中汲取经验。与此同时,担任扰乱的法式则会从胜利中找到新的秘诀,二者会在“游玩打闹”中配合提高。这也是该项目具有严重实际意义的缘由,机械人要想走出试验室,必需包管能在挑衅赓续的情况中不出错。

  一台机械人试图从敌手那边夺下抓取的物品

  研讨人员表现,他们的反抗战略确切能加速机械人的练习过程,这类办法造就的体系加倍壮大。经由测试,三次迭代后,其抓取胜利率从 43% 升到了 58%,而没有采取反抗战略练习的机械人,抓取胜利率仅为 47%。

  该成果可以清晰的注解,有个给机械人“拆台”的同伴监视和陪练,感化可比傻乎乎的汇集抓取数据年夜多了。雷锋网留意到,研讨人员颁布的测试数据显示,6 千次的陪练后,机械人的抓取胜利率比机械人本身单练 1.6 万次都要高。是以,反抗战略在机械人练习中显著更有优势。

  经由一段时光的练习后,有陪练的机械人抓取胜利率晋升到了 82%,而没有这个待遇的机械人胜利率仅为 68%。更使人惊奇的是,即便下降抓取机械人的力气和抓手的磨擦力,其胜利率仍然有 65%,而采取单练战略的机械人则下滑至 47%。

  在这一进程中,研讨人员也使尽了本身“一肚子坏水”,他们专门不雅摩了单练机械人轻易掉误的处所,并将这些马脚编入了扰乱机械人的法式中。同时,在练习中扰乱机械人赓续的掠夺也是物品失落落的主要身分。固然,只要阅历了如许的魔鬼练习,抓取机械人才网job.vhao.net能练出一身身手。

 
 
 
[ 行业资讯搜索 ]  [ 加入收藏 ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]