科技魔方

Sam Altman发布2025年技术愿景,你想OpenAI怎么做?

媒体头条

2024年12月26日

  本文来自于微信公众号AIGC开放社区。

  Sam Altman发布了新的一年技术愿景,并在社交平台上征求网友的意见,希望OpenAI发布哪些技术同时优化哪些功能。

  用户对这个非常感兴趣,评论已经超过8300,浏览量破270万,算是Sam今年最高的推文之一了,比前几天的连续12天直播热闹很多。

  对于用户的反馈,Sam回复也非常积极,并且还肯定了一些意见非常不错,基本上已经安排上很快就会实现。

  下面「AIGC开放社区」就挑选一些Sam基本确定的技术路线,以及比较好的意见。

  更强的GPT-4o替换品,GPT/o系列模型/文生图模型Sora可以无缝集成到 ChatGPT中(也就是说要求ChatGPT更强的多模态能力)

  50/70美元的计划,中间价位?(最近200美元的Pro太贵了)更长的上下文窗口。当然,终极愿望还是AGI,相信你们会实现的。

  Sam非常喜欢这个建议,明年会完善的。

  希望可以添加家庭账户。这样可以为我的孩子增加带保护功能的账号,这样可以放心的让他们发挥自己的想象,但又在设定的合理范围之内,同时也能根据他们对ChatGPT的使用,来了解孩子的想法。

  非常棒的建议。

  更好的语音聊天轮流检测。现在比较烦人的是,我还没安静地思考5秒呢,就会被AI打断。(就是认为语音模式下AI回复太快了,应该更人性化一点停顿时间长一些。)

  Sam认为这是一个非常好的建议,未来OpenAI会修复这个问题。

  当我使用高级语音模式时,我希望它能更好地记住我之前的对话,即便只是一个 RAG 系统。我喜欢在通勤时进行对话和头脑风暴,但我发现不得不详细重复之前的内容!

  这位老哥的问题给Sam干懵圈了,没搞懂他的需求。其实,他的意思是就想让语音模式的ChatGPT能像文本那样,记住他们之前的对话。估计现在语音模式还不具备记忆的能力。这个应该以后也会修复。

  可拖放式用户界面,能将多个独立的聊天/模型串联在一起,生成和优化输出。(这简直就是大锅炖,不敢想真实现了能有多香。)

  Sam认为,这个想法非常有趣,我们还没认真考虑过呢。

  说实话,现在的非思考模式的 GPT-4o有点不行了,甚至mini也不太好。

  这个问题确实存在。

  发布GPT-4o的图像生成功能。

  希望会实现的。

  高级语音模式的本地存储功能。我经常遇到这样的情况:我在手机上说了3分钟,然后连接失败,我的整个输入就消失了。

  其实他的这个需求和上面那个人差不多,基本都是要求ChatGPT的高级语音模式新增“记忆”功能。

  能够在使用语音模式时同时看到文本。有时候阅读回复更快,但仍希望能够以语音方式回应。

  看来OpenAI的高级语音模式优化空间相当大,明年肯定会再更新一波吧。

  更好的AI Gent功能用于研究城市中的本地事,例如,公共交通、活动、电影时间、景点、门票等。这些通常涉及多步骤的工作流程,以进行研究并获得答案。希望可以一键完成。

  我希望能够将 Gmail 和 Google 日历等API 与ChatGPT相结合,这样它就能随时了解我的日程安排和工作内容。(其实谷歌的Gemini模型已经实现了)

  新的用户界面类型,例如,思想连接可视化的空间界面、AI和人类共同构建的协作Canvas、根据上下文变化的流动工作空间,以及在应用之间自然传递的AI Agent功能。

  关于AI Agent用户关心的也比较多,明年OpenAI肯定会上线一款的,前不久已经公布在研发了。

  目前,网友的积极性非常高,估计这周末评论轻松破1万。看来大家对OpenAI还是相当期待的,而这次Sam搞的用户反馈大会也相当成功,2025年OpenAI的主要动力之一便是完善用户的需求。

+1

来源:微信公众号AIGC开放社区

延展资讯