科技魔方

GPT-4 又进化了,画图、插件、代码等能力被整合,网友:“更像是 AI Agent 了”

大模型

2023年10月31日

  本文来自于微信公众号 CSDN(ID:CSDNnews),整理 | 朱珂欣 。

  近日,OpenAI 再次闷声放大招!

  用灰度测试的方式,向不少用户暗戳戳的「剧透」了最新进化版的 GPT-4。

  据悉,新版本能使用户无需切换即可访问所有 GPT-4工具,包括浏览和 DALL·E3。为此,该功能被许多用户称之为 “ALL TOOLS 模式” !

  上传任意文档,即可分析

  在过去, GPT-4的文档分析功能可以用「麻烦」二字来形容。

  面对一个 PDF 信息提取的任务,前版本可能还需要额外使用「 Advanced Data Analysis 」功能上传附近才可以办到。

  如今,新版本的 GPT-4则将多类型文件完全统一。

  简单来说,更新后,用户可以上传任意文档,包括 PDFs、数据文件等做分析。按照官方功能提示,未来将比此前支持更多的文档类型。

  整合所有工具,无需手动切换

  此外,还有备受瞩目的「所有工具整合」功能。

  众所周知, GPT-4的不同模式「各司其职」:

  能同时处理文本、图像和声音等多种类型的数据的多模态模式;

  帮助用户在网络上查找和获取最新且准确的信息的实时联网模式;

  具备了强大的数据处理和分析能力的高级数据分析模式;

  集合大量第三方资源和功能的插件模式;

  轻松制作长绘本的 AI 绘图 DALL-E 模式。

  然而,他们也存在明显「短板」:

  多模态模式可以上传图片,但是不能上传其他格式文件;

  实时联网模式不能上传任何文件;

  高级数据分析模式不能实时联网;

  DALL-E 不能上传文件。

  因此,此次整合工具后的 GPT-4,用户将无需切换即可使用所有的功能。

  GPT4将根据指令并准确理解用户的意图,随后自动选择并串联多个工具完成任务,无论是网络浏览、高级数据分析还是 DALL-E 绘图,GPT-4都能够一站式完成。

  简单来说,它可以做到一体化的完成意图识别、任务分配、工具调用等诸多任务。

  有报道称,该功能的出现意味着 GPT-4比此前更加智能,非常像此前大家说的 AI Agent 的能力。

  网友:“更像是 AI Agent 了!”

  值得关注的是,GPT-4“ALL TOOLS 模式”并不包含 ChatGPT 插件。

  外媒 Search Engine Journal 指出,这或许是一个深思熟虑的举措,旨在简化用户体验,并排除历史上提供类似功能的第三方添加功能。

  直接在系统内分析 PDF 和其他文件的能力,有效地消除了对迄今为止一直在填补这些空白的第三方 ChatGPT 插件的需求。通过将功能整合到最新版本的 ChatGPT 中,响应了用户的反馈。

  毋庸置疑的是,GPT4自现世以来,不仅继承了 GPT-3的强大自然语言处理能力,更在多模态、绘图、联网和插件等方面进行了重大的创新和拓展。

  虽然 OpenAI 尚未「官宣」其它信息,多功能的 GPT-4也仍处于测试阶段,但根据其在已有的测试和用户反馈中展现的潜力,已令不少网友直呼「期待」:

  “ChatGPT,终将成为一个为集 Midjourney、PDF Chat 、Perplexity AI 和高级数据分析于一体的「AI超级应用程序」”;

  “进化版的 GPT-4,更像 AI Agent 了”;

  “坐等11月6日 OpenAI 开发者大会 DevDay”;

  “哪怕只是看到升级版的 GPT-4的蛛丝马迹,也足够让人期待它了” ……

  对此,你怎么看?

+1

来源:微信公众号 CSDN

延展资讯