科技魔方

微软发布新型AI训练法“思想算法” 使AI更具人类思维能力

大模型

2023年09月01日

  要点:

  微软与弗吉尼亚理工大学合作,提出“思维算法”新训练方法,目的是使大语言模型如ChatGPT在推理上更高效、更具人类思维逻辑。

  “思维算法”通过组织模型有序地探索不同解决方案,融合了人类直观认知与算法逻辑思维的优势。

  研究人员认为,这种方法可以指导模型高效解决复杂实际问题,还可减少模型的碳足迹。

  微软公司推出了一种名为“思维算法”(AoT)的全新AI训练方法,旨在提高大型语言模型(如ChatGPT)在推理能力方面的效率和人类相似度。

  对于已经在人工智能领域进行大量投资的公司来说,这是自然的发展步骤,尤其是对OpenAI——DALL-E、ChatGPT和功能强大的GPT语言模型的创造者。

  根据发表的研究论文,微软表示,AoT技术是一种潜在的游戏规则改变者,因为它“引导语言模型通过更简化的问题解决路径”。这种新颖的方法利用了“上下文学习”,使模型能够系统地以有组织的方式探索不同的解决方案。

  “我们的方法优于先前的单查询方法,并与最近采用广泛树搜索的多查询方法相当。有趣的是,我们的结果表明,使用算法指导模型可以导致性能超过算法本身。”

  研究人员声称,当这种技术优化其搜索过程时,模型获得了改进的“直觉”。

  人机混合算法?AoT方法解决了当前上下文学习技术(如“思维链”)的限制。有时,CoT提供错误的中间步骤,而AoT则使用算法示例来指导模型,以获得更可靠的结果。

  AoT从人和机器中汲取灵感,以提高生成型AI模型的性能。虽然人类在直观认知方面表现出色,但算法以其有组织的、详尽的探索而闻名。研究论文称,“思维算法”寻求将这两种方面融合起来,增强大型语言模型的推理能力。

  微软表示,这种混合技术使模型能够克服人类工作记忆的限制,从而能够更全面地分析想法。

  与CoT的线性推理或“思维树”(ToT)技术不同,AoT允许对子问题的不同选项进行灵活的思考,只需最少的提示就能保持有效性。它还与外部树搜索工具相媲美,有效地平衡成本和计算。

  总的来说,AoT代表了从监督学习到整合搜索过程的转变。通过改进提示工程,研究人员相信这种方法可以使模型高效地解决复杂的现实世界问题,同时也减少它们的碳足迹。

  鉴于其在人工智能领域的大量投资,微软似乎有能力将AoT纳入像GPT-4这样的先进系统。尽管具有挑战性,但教导语言模型以更人性化的方式进行“思考”可能会带来革命性的变革。

+1

来源:站长之家

延展资讯