文章概要:
1. 谷歌DeepMind设计语言模型SayTap,可将人类指令转为机器狗可理解格式
2. SayTap可处理复杂、模糊指令,让机器狗做出适当反应
3. SayTap可将自然语言转为机器可理解格式,未来可让机器人听从人类语言指令
谷歌DeepMind的研究人员开发了一个大型语言模型SayTap,可将人类各种指令转换为四足机器狗可以理解的格式。
这个模型让机器狗不仅可以理解基本的前进、后退等指令,还可以理解一些情况性的复杂概念,比如抓住松鼠或快速跑等。
研究人员为四足机器狗设计了期望的“足接触模式”,其中1表示脚接触地面,0表示脚离开地面。他们根据这些输入的不同组合来教会机器狗如何行走、小跑或原地跳跃。
研究人员表示,这些足接触模式组合构成了一种“自然语言用户指令与底层控制器之间的新接口”。例如,在一个测试中,研究人员让狗“缓慢地向前小跑”,SayTap就会将这句英语指令转换为对应的二进制代码,传递给机器狗执行。
研究人员表示,SayTap最有趣的地方在于它可以“处理非结构化和模糊的指令”。仅提供简短的提示,它就可以成功地指挥机器狗在被告知“我们要野餐”时跳上跳下,或在被告知“假装地面很热”时快速奔跑。它甚至可以在被要求远离松鼠时缓缓后退。
研究人员在博文中写道,SayTap作为一种可以传递到真实机器人硬件的控制器,为自然语言与底层控制器之间架起桥梁,这可让人类仅通过像对待另一个人类一样对机器人说话来指挥它们。尽管该技术还处在早期阶段,但未来可能让人类通过自然语言指令来控制机器人。