MIT突破:自我监督系统DON,机器人可在检查随机物体后理解它们并拾取
2018年09月10日 由 浅浅 发表
944618
0
几十年来,装配线等受控环境中的机器人能够一次又一次地拾取同一物体。最近,计算机视觉的突破使机器人能够在物体之间进行基本区分。尽管如此,系统并没有真正理解物体的形状,因此机器人在快速拾取后几乎没什么用了。
麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员在一篇新论文中说,他们已经在这个工作领域做了一个重要的发展:一个允许机器人检查随机物体,并在视觉上理解它们,以完成具体的系统,而不需要以前见过任务物体。
[video width="1280" height="720" mp4="http://imgcdn.atyun.com/2018/09/Robots-Teaching-Themselves-to-See.mp4"][/video]
该系统称为Dense Object Nets(DON),它将对象视为点集合,用作视觉路线图。这种方法可以让机器人更好地理解和操纵物品,最重要的是,它们甚至可以让他们甚至在类似的混乱中拾取特定物品,这是亚马逊和沃尔玛等公司在其仓库中使用的各种机器的宝贵技能。
例如,有人可能会使用DON让机器人抓住物体上的特定位置,比如鞋舌头。从那以后,它可以看到它以前从未见过的鞋子,并成功抓住它的舌头。
“许多操纵方法无法识别物体可能遇到的多个方向的物体的特定部分,”博士生Lucas Manuelli说道,他与主要作者和博士生Pete Florence,Russ Tedrake教授一起撰写了一篇关于该系统的新论文,“例如,现有的算法无法通过手柄抓住一个杯子,特别是杯子是多个方向的,如直立,或侧面。”
该团队不仅在制造环境中,而且在家庭中都看到了该系统潜在的应用。想象一下,给系统一个整洁的房子的图像,让你在工作时清洁,或使用菜肴的图像,以便系统在你度假时把你的盘子放好。
还值得注意的是,没有一个数据实际上被人类标记过。相反,该系统是团队所谓的“自我监督”,不需要任何人类注释。
机器人抓取的两种常见方法涉及任务特定学习或创建一般抓取算法。这些技术都有障碍:特定于任务的方法难以推广到其他任务,并且一般的掌握不足以处理特定任务的细微差别,例如将对象放在特定位置。
然而,DON系统基本上在给定物体上创建一系列坐标,作为一种视觉路线图,使机器人更好地理解它需要掌握的内容,以及在哪里。
该团队训练系统将对象视为构成较大坐标系的一系列点。然后,它可以将不同的点映射到一起,以显示对象的3D形状,类似于从多张照片拼接全景照片的方式。在训练之后,如果一个人指定一个物体上的一个点,机器人可以拍摄该物体的照片,并识别和匹配点,然后能够在该指定点拾取物体。
这与UC-Berkeley的DexNet系统不同,后者可以掌握许多不同的项目,但不能满足特定的要求。想象一个18个月大的孩子,他不明白你想要它玩哪个玩具但仍然可以抓住很多物品,而一个4岁的孩子可以回应“抓住你的卡车红色的尾部”。
在软毛虫玩具上进行的一组测试中,由DON驱动的Kuka机器人手臂可以从一系列不同的配置中抓住玩具的右耳。这表明,除其他外,系统具有在对称物体上区分左右的能力。
当在不同棒球帽的箱子上进行测试时,DON可以选择特定的目标帽子,尽管所有的帽子都具有非常相似的设计,并且之前从未在训练数据中看过帽子的照片。
Florence表示,“在工厂中,机器人通常需要复杂的零件供料器才能可靠地工作,但是像这样能够理解物体方向的系统可以拍摄照片,并能够相应地掌握和调整物体。”
在未来,团队希望将系统改进到能够执行特定任务的地方,更深入地了解相应的对象,例如学习如何抓住对象并将其移动到最终目标,即清理桌面。
该团队将于下个月在瑞士苏黎世举行的机器人学习会议上发表论文。