科技魔方

谷歌DeepMind推出两款新型AI模型

更多动态

2025年03月13日

  3月13日消息,当地时间周三,谷歌发布了两款新型 AI 模型——Gemini Robotics 和 Gemini Robotics-ER(具象推理),旨在提升机器人在现实世界中的任务执行能力。这一突破标志着机器人技术在通用性、互动性和安全性方面迈出了重要一步,同时也为未来智能机器人的广泛应用奠定了基础。

  一、技术突破:从多模态理解到具象推理

  1. Gemini Robotics:多模态世界理解

  据网经社云计算台(CC.100EC.CN)查询DeepSeek后获悉,Gemini Robotics 是一款视觉语言行动模型,基于谷歌最新的 Gemini 2.0 模型开发。它通过加入物理行动的新模态,实现了对现实世界的多模态理解。这一模型的最大亮点在于其通用性,能够在未经专门训练的情况下理解新情境,并执行精确的物理操作,如折纸或打开瓶盖。这种能力使机器人能够更好地适应复杂多变的环境,为未来的家庭服务、医疗护理等领域提供了技术支持。

  2. Gemini Robotics-ER:具象推理与安全性

  Gemini Robotics-ER 则专注于复杂动态世界的理解,特别是在动作安全性方面的评估。该模型通过分层安全策略,确保机器人在执行任务时能够评估潜在风险并采取相应措施。这一功能对于机器人在工业、医疗等高风险环境中的应用尤为重要,为智能技术的安全性提供了保障。

image.png

  二、应用前景:推动机器人技术的普及

  1. 人形机器人的开发

  谷歌 DeepMind 与 Apptronik 合作,致力于打造下一代人形机器人。Gemini Robotics-ER 模型的开放将为这一领域注入新的活力,推动人形机器人在服务、制造等领域的应用。通过与多家公司合作,谷歌 DeepMind 正在加速智能技术的商业化进程。

  2. 多领域应用的潜力

  这两款模型不仅在家庭服务机器人领域具有广阔前景,还可应用于工业自动化、医疗护理、物流配送等多个领域。例如,在医疗领域,机器人可以协助医生完成精细的手术操作;在物流领域,机器人可以高效完成货物的分拣和搬运。这些应用将显著提升生产效率,降低人力成本。

  三、挑战与未来展望

  尽管 Gemini Robotics 和 Gemini Robotics-ER 展现了强大的技术潜力,但其在实际应用中仍面临诸多挑战。例如,如何确保模型在极端环境下的稳定性,以及如何降低技术成本以实现大规模普及。此外,随着机器人技术的快速发展,伦理和安全问题也亟待解决。

  未来,随着技术的不断迭代和优化,Gemini Robotics 系列模型有望成为机器人领域的核心技术之一。通过与行业伙伴的深度合作,谷歌 DeepMind 正在为智能机器人的广泛应用铺平道路,推动人类社会迈向智能化新时代。

+1

来源:网经社

延展资讯