大型科技公司正忙着升级自家的大型语言模型。据报道,OpenAI和Meta即将发布各自的新版人工智能(AI)模型,他们声称这些模型将能够进行推理和规划,这是在机器中实现超人认知的关键步骤。
本周,OpenAI和Meta的高管表示,两家公司正准备推出其大型语言模型的下一个版本,这些模型为生成式人工智能应用提供动力。
Meta表示,将在未来几周内开始推出Llama 3;而OpenAI则表示,它的下一个型号,预计将被称为GPT-5,将“很快推出”。
推理功能
Meta人工智能研究副总裁Joelle Pineau表示,“我们正在努力弄清楚如何让这些模型不仅能说话,而且能真正进行推理和规划……拥有记忆。”
OpenAI首席运营官Brad Lightcap在接受采访时表示,下一代GPT将在解决推理等“难题”方面取得进展,“我们将开始看到人工智能能够以更精密的方式处理更复杂的任务,我认为,我们才刚刚开始触及这些模型推理能力的表层。”
Lightcap补充道,如今的人工智能系统“非常擅长一次性的小任务”,但其能力仍然“相当有限”。
为AGI铺路
伴随着科技公司间越来越“卷”技术,进步的步伐正在加快,它们竞相创造更复杂的生成式人工智能——这种模型可以创造出与人类无异的文字、图像、代码和视频,其质量也在不断提高。今年,谷歌、Anthropic和Cohere等公司陆续发布了一波新的大语言模型。
推理和规划功能便是通往“通用人工智能(AGI)”的必经之路。AGI拥有人类水平的认知,它允许聊天机器人和虚拟助手完成相关任务的序列,并预测其行为的后果。
Meta首席人工智能科学家Yann LeCun周二(4月9日)在伦敦的一次活动上表示,目前的人工智能系统“在没有思考和计划的情况下,是一个接一个地生成单词”,他们很难处理复杂的问题或长时间记住信息,因此他们仍然会“犯愚蠢的错误”。
他表示,增加推理能力意味着人工智能模型将“搜索可能的答案”、“计划行动的顺序”,并建立一个“关于其行动将产生何种影响的心理模型”。LeCun补充道,这正是目前模型的重要缺失部分,而这些能力将使机器达到下一个智能水平。
OpenAI的Lightcap则表示,OpenAI很快就会对下一个版本的GPT“有更多话要说”。
Lightcap称,“我认为随着时间的推移,我们将看到这些模型走向更长、更复杂的任务,这就要求他们提高推理能力。”