科技魔方

DeepMind推Genie模型,可用图像制作类似超级马里奥的游戏

更多动态

2024年03月01日

  3月1日 消息:在Google DeepMind的最新研究中,他们推出了名为Genie的模型,该模型能够从图像中生成类似于超级马里奥兄弟游戏的2D视频游戏。Genie是Generative Interactive Environments的缩写,经过在互联网视频上的培训,它能够从图像、视频,甚至以前未见过的草图中创建可玩的游戏场景。

  该模型不仅仅是一个有趣的AI模型,Google DeepMind认为它具有潜在的通用代理(Generalist Agents)影响,这是专为处理各种AI任务设计的AI系统。Genie的设计理念是通过学习从视频等媒体中提取的潜在动作,并将其转移到人工设计的环境中,从而实现对其他领域的应用,而无需额外的领域知识。

  团队表示,Genie项目只是“刚刚触及未来可能性的表面”。该模型通过对其输入的20万小时的互联网视频进行训练,包括2D平台游戏(如超级马里奥)和机器人数据(RT-1)。尽管互联网视频通常没有标签,但它学到了细粒度的控制,包括可控制输入的哪些部分,还能推断在生成的环境中一致的潜在动作。

  Genie的体积达到了110亿参数,Google DeepMind将其称为“基础世界模型” - 一个从世界运作中学习的系统。Genie能够从观看数千个互联网视频中学到动作,理解像跳跃这样的动作,并将其应用于类似游戏的环境中。与人类从视频中学习的方式相似,Genie也能理解人类绘制的草图,并将其转化为类似游戏的表现形式。

  对于Genie模型是否将提供给公众,或者是否会在未来的Google产品中应用,目前尚无消息。但感兴趣的读者可以在Genie展示页面上查看示例生成。这一创新展示了深度学习在创造性领域的潜在应用,也许为实现通用人工智能迈出了一步。

+1

来源:站长之家

延展资讯