谷歌DeepMind推出两款新型AI模型_科技魔方-中文AI大模型门户网站

　　3月13日消息，当地时间周三，谷歌发布了两款新型 AI 模型——Gemini Robotics 和 Gemini Robotics-ER(具象推理)，旨在提升机器人在现实世界中的任务执行能力。这一突破标志着机器人技术在通用性、互动性和安全性方面迈出了重要一步，同时也为未来智能机器人的广泛应用奠定了基础。

　　一、技术突破：从多模态理解到具象推理

　　1. Gemini Robotics：多模态世界理解

　　据网经社云计算台(CC.100EC.CN)查询DeepSeek后获悉，Gemini Robotics 是一款视觉语言行动模型，基于谷歌最新的 Gemini 2.0 模型开发。它通过加入物理行动的新模态，实现了对现实世界的多模态理解。这一模型的最大亮点在于其通用性，能够在未经专门训练的情况下理解新情境，并执行精确的物理操作，如折纸或打开瓶盖。这种能力使机器人能够更好地适应复杂多变的环境，为未来的家庭服务、医疗护理等领域提供了技术支持。

　　2. Gemini Robotics-ER：具象推理与安全性

　　Gemini Robotics-ER 则专注于复杂动态世界的理解，特别是在动作安全性方面的评估。该模型通过分层安全策略，确保机器人在执行任务时能够评估潜在风险并采取相应措施。这一功能对于机器人在工业、医疗等高风险环境中的应用尤为重要，为智能技术的安全性提供了保障。

　　二、应用前景：推动机器人技术的普及

　　1. 人形机器人的开发

　　谷歌 DeepMind 与 Apptronik 合作，致力于打造下一代人形机器人。Gemini Robotics-ER 模型的开放将为这一领域注入新的活力，推动人形机器人在服务、制造等领域的应用。通过与多家公司合作，谷歌 DeepMind 正在加速智能技术的商业化进程。

　　2. 多领域应用的潜力

　　这两款模型不仅在家庭服务机器人领域具有广阔前景，还可应用于工业自动化、医疗护理、物流配送等多个领域。例如，在医疗领域，机器人可以协助医生完成精细的手术操作;在物流领域，机器人可以高效完成货物的分拣和搬运。这些应用将显著提升生产效率，降低人力成本。

　　三、挑战与未来展望

　　尽管 Gemini Robotics 和 Gemini Robotics-ER 展现了强大的技术潜力，但其在实际应用中仍面临诸多挑战。例如，如何确保模型在极端环境下的稳定性，以及如何降低技术成本以实现大规模普及。此外，随着机器人技术的快速发展，伦理和安全问题也亟待解决。

　　未来，随着技术的不断迭代和优化，Gemini Robotics 系列模型有望成为机器人领域的核心技术之一。通过与行业伙伴的深度合作，谷歌 DeepMind 正在为智能机器人的广泛应用铺平道路，推动人类社会迈向智能化新时代。

谷歌DeepMind推出两款新型AI模型

延展资讯