面壁智能联合清华大学自然语言处理实验室发布了 GitAgent,这是一种可以自主扩展工具箱的大模型智能体应用框架。通过 GitAgent,大模型智能体可以从 GitHub 上扩展工具集合,以应对复杂任务需求。
GitAgent 的工具箱扩充过程包括搜索、配置、应用和存储四个阶段。在搜索阶段,GitAgent 会在 GitHub 上搜索适合用户需求的仓库,并判断仓库是否能用来解决问题。在配置阶段,GitAgent 会根据仓库的 README 文件执行配置命令,还可以通过学习人类经验来解决问题。在应用阶段,GitAgent 使用配置好的仓库来解决用户需求,如果仓库没有清晰的使用入口,GitAgent 还可以通过学习人类经验来解决问题。在存储阶段,GitAgent 将配置好的仓库及其执行环境存储下来,以便未来使用。
研究团队通过案例展示了 GitAgent 的应用,包括 Qlib 搜索、Bringing-Old-Photos-Back-to-Life 配置和 Sniffles 应用。通过 GitAgent,可以灵活选择不同的搜索策略,并能够熟练处理配置和应用阶段中的各种问题。
GitAgent 的发布拓展了大模型智能体的能力边界,使其可以自主扩展工具箱,从而更好地应对复杂任务需求。这一研究成果有望推动大模型智能体技术的发展,帮助人类实现更加多样更加复杂的任务需求。