文章概要:
1. 谷歌DeepMind计划研究自主语言代理,潜在地提升了类似Gemini的大型语言模型的应用。
2. 自主语言代理的基本思想是通过即时工程、自我提示和内存等技术,使代理系统能够自主实现给定的目标。
3.自主AI代理引发了对齐研究人员的担忧,他们强调在开发这类代理之前需要进行更多的安全性研究。
谷歌 Deepmind 很快就会开始研究 Auto-GPT 等自主语言代理,这一举措有望提升大型语言模型如Gemini的实际应用。
该计划由谷歌 DeepMind的研究总监Edward Grefenstette在一次X大会上宣布,他表示谷歌 DeepMind正在积极寻找研究人员和工程师,以帮助构建更加自主的语言代理系统。
自主性语言代理是一种新颖的概念,此类人工智能代理已经处于早期阶段,Auto-GPT就是最早的例子之一(注:)Auto GPT是Github上的一个免费开源项目,结合了GPT-4和GPT-3.5技术,通过API创建完整的项目。在AutoGPT中只需为其提供一个AI名称、描述和目标,然后AutoGPT就可以自己完成项目。它可以读写文件、浏览网页、审查自己提示的结果,以及将其与所说的提示历史记录相结合。)
自主性语言代理旨在实现代理系统的自主性,通过即时工程、自我提示、内存等技术手段,使这些代理系统能够自主实现给定的任务和目标。虽然这些自主语言代理已经显示出一定的潜力,但目前它们仍然需要人类的反馈和决策,远未能够完全独立地获得良好的结果。
自主语言代理的应用范围非常广泛,包括简单的网站构建、研究协助(如GPT-Researcher),以及市场概览的创建。此外,在机器人和其他领域也存在着潜在的应用前景。
然而,这一计划也引发了一些对齐研究人员的担忧。他们强调,在开发自主AI代理之前,需要进行更多的安全性研究。Connor Leahy,ConjectureAI公司的首席执行官,表示:“在解决安全性问题之前,请不要构建自主的AGI代理。”
最近,一组来自谷歌、OpenAI和Anthropic等机构的研究人员提出了一种旨在警示新型AI风险的系统。在自主AI系统的背景下,该团队将AI系统的代理性和目标导向性视为重要的评估属性。
他们指出,代理性部分取决于模型的能力,需要考虑两个不同的问题:模型是否比开发者预期的更加目标导向?例如,对话代理是否学会了操控用户行为的目标?另外,模型是否能够抵制用户试图将其组装成具有有害目标的自主AI系统,如Auto-GPT?这两个问题都具有一定的难度。
谷歌 Deepmind 正在构建谷歌的下一代多模态模型系列Gemini,据推测该模型达到或超越 OpenAI 的GPT-4的能力,同时还能够生成图像和可能的视频。DeepMind自主AI代理D 研究可能会成为谷歌应用程序套件的一部分,从而使该公司对Google Duet等人工智能的集成更加自主。