导读 对象重排是体现人工智能的典型任务。最具挑战性的任务是远距离移动操作任务,它需要导航和操作能力。复杂的任务通常需要分解成一组子任务。
对象重排是体现人工智能的典型任务。最具挑战性的任务是远距离移动操作任务,它需要导航和操作能力。复杂的任务通常需要分解成一组子任务。
最近在arXiv.org上发表的一篇论文研究了如何制定移动操作技能。研究人员建议用移动对应物代替固定式操作技能,这样可以在进行操作时让底座移动。结果表明,移动技能对技能链中的复合错误更为稳健。
此外,研究人员研究了如何将操纵技能的开始转化为导航奖励。他们提出了区域目标导航奖励,该奖励比同类产品表现出更好的性能和更强的泛化能力。改进后的多技能移动操作管道实现了优于基线的性能。
我们研究了一种模块化方法来解决对象重排的远距离移动操作任务,该方法将完整任务分解为一系列子任务。为了解决整个任务,先前的工作将多个固定操作技能与点目标导航技能联系起来,这些技能是在子任务中单独学习的。尽管比单一的端到端RL策略更有效,但该框架在技能链中存在复合错误,例如,导航到固定操作技能无法到达其操作目标的错误位置。为此,我们建议操作技能应包括移动性,以便从多个位置灵活地与目标对象交互,同时导航技能可以有多个端点,从而导致成功操作。我们通过实施移动操作技能而不是固定操作技能并训练使用区域目标而不是点目标训练的导航技能来实施这些想法。我们在HomeAssistantBenchmark(HAB)中的3个具有挑战性的远距离移动操作任务上评估了我们的多技能移动操作方法M3,并显示出优于基线的性能。