文章概要:
1. 加州大学伯克利分校的研究人员开发了一种新的方法,教机器人进行基于视觉的追踪,以实现像捉人等动态任务。
2. 该方法使用“特权学习”,机器人教师利用逃避者的未来轨迹推断其意图,从而引导学生机器人逐步行动。
3. 该方法已在四足机器人上测试成功,它能展现出复杂的追捕行为,如预测逃避者去向并拦截。
近日,加州大学伯克利分校的研究人员开发出一种新的方法,教机器人进行“基于视觉的追踪”,实现像捉人游戏等需要动态决策的任务。
这种方法不同于简单地跟踪一个人或机器人,机器人可以主动推断目标的去路并进行搜捕目标。由于现实世界的种种限制,如对环境和其他代理有限的感知,直接通过强化学习的方式很难学会这类行为。
因此,研究人员使用了“特权学习”的方式。这是一种监督学习形式,其中拥有附加信息的教师帮助没有附加信息的学生。
对机器人来说,这意味着机器人老师利用逃避者的未来轨迹来推断逃避者的意图。有了这些特权信息,机器人老师就可以逐步指导学生机器人采取哪些行动。因此,本质上复杂的规划问题对于学生来说变成了一个简单的监督学习问题。
尽管这种方法很简单,但机器人学会了动态行为,如目标转向时减速,或者预测目标去向并拦截。
研究人员在一个四足机器人上测试了这种方法,它仅依靠内置摄像头和本体感知,就成功与人类和其他机器人进行了追逐游戏。该机器人也展现出了模型在模拟环境中学习到的复杂追捕行为。
这种“特权学习”的方法教会了机器人进行基于视觉的追踪,实现了像捉迷藏这样复杂的动态任务,是机器人技术向真实世界应用迈进的一个进步。
不过,目前该系统还无法处理障碍物,需要更广泛的AI训练和更好的传感器来实现。