10月22日消息,Meta近日宣布将发布一系列新的人工智能模型,其中包括一个能够自我评估的模型,这可能减少人工智能开发过程中的人类参与。
据网经社云计算台(CC.100EC.CN)获悉,这一发布是在Meta于8月份介绍该工具的论文之后进行的,论文中详细描述了该工具如何利用与OpenAI的o1模型相同的“思路链”技术来提高对科学、编码和数学等挑战性问题的回答准确性。Meta的研究人员通过完全由人工智能生成的数据来训练评估模型,消除了人工输入的需要。
两位负责该项目的 Meta 研究人员表示,许多 AI 专家设想未来可以开发出“智能化程度极高”的数字助手,可以自主处理大量任务,而无需人类介入。
值得一提的是,自我改进的模型有望减少目前使用的“基于人类反馈的强化学习”(RLHF)过程的需求。这一过程往往昂贵且低效,因为它依赖于拥有专业知识的人类来标注数据和验证复杂问题的答案是否正确。