科技魔方

ChatGPT正在测试原生文件分析功能,DALL·E 3能P图啦

大模型

2023年10月30日

  本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区。

  10月29日,有部分用户在社交平台上分享,ChatGPTPlus正在测试原生文件上传、分析功能,可以通过文本问答的方式,对上传的PDF等数据文件进行提问、搜索。

  例如,上传一份50页的员工手册PDF文件,然后向ChatGPT提问,能帮我总结一下手册的5个核心观点吗?;新入职员工触犯规则后,会遭遇哪些处罚?

  其实,文件分析功能并不是最近才推出的,用户借助ChatGPT早期推出的第三方插件功能就能实现。但在性能、效率、海量数据上下文理解方面无法与原生相媲美。

  如果加上此前ChatGPT推出的代码解析功能,用户通过问答方式就能根据上传的文件,直接生成可视化图表,这对于金融、市场、营销等业务人员帮助巨大。

  无需编写任何一行代码,切换多个工具,在单一平台就能完成所有的数据分析和创建可视化数据图。

  分享用户展示了ChatGPT的PDF分析功能:他上传了一份开源大语言模型Mistral7B的说明文档,然后提问,用两句话总结一下这份PDF文档。

  ChatGPT回答:Mistral7B是一个70亿参数的大语言模型,在各种基准测试上优于现有模型,同时使用分组查询注意力和滑动窗口注意力提升性能。它是在Apache2.0许可证下发布的,展示了高性能和高效的推理,特别是在推理、数学和代码生成任务中。

  同样支持多轮深度提问模式,可以继续发问,Mistral7B在PIQA基准中的测试评分比Code llama高多少?

  另外一个重磅测试功能是,用户可以通过上传图片,在ChatGPT 中进行P图。这个使用了ChatGPT最新发布的文生图模型DALL·E3,并展示了强大的语义理解能力。

  例如,上传了一份金毛的图片,然后提问,让这只狗奔跑起来吧。

  上传一张水豚的图片,然后让其按照皮克斯的风格重新生成一下。

  这种细腻的语义理解和图片控制功能比Midjourney还要简单方便。此外,OpenAI还对其他功能进行了优化。

  例如,用户不必从GPT-4下拉菜单中选择“使用 Bing 浏览”模式,ChatGPT可以根据上下文猜测他们是否需要联网。

+1

来源:微信公众号 AIGC开放社区

延展资讯