科技魔方

可令 AI 模型计算复杂离散数学问题,谷歌 DeepMind 公布“FunSearch”训练法

大模型

2023年12月15日

  谷歌 DeepMind 日前公布了一种名为“FunSearch”的模型训练法,号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。

  据悉,FunSearch 模型训练法主要为AI模型引入了一个“评估器(Evaluator)”系统,AI模型输出一系列“创意解题方法”,“评估器”则负责评判模型输出的解题办法,反复迭代后,就能训练出数学能力更强的AI模型。

  谷歌DeepMind使用 PaLM 2 模型进行测试,研究人员建立了专用“代码池”,使用代码形式为模型输入一系列问题,并设置了评估器流程,之后模型便会在每一次迭代中,自动从代码池中挑选问题,生成“具有创造性的新解法”,并交由评估器进行评估,其中“最佳解法”将会被重新加入到代码池中,重新开始另一次迭代。

  IT之家注意到,FunSearch 训练法对“离散数学(Combinatorics)”特别擅长,经训练法锻炼后的模型,可以轻松解决极值组合数学问题,研究人员在新闻稿中便介绍了模型计算“上限级问题(数学中涉及计数和排列领域的一个中心问题)”的过程方法。

  此外,研究人员也成功使用 FunSearch 训练法解决了“装箱问题(Bin Packing Problem)”,这是一个“将不同大小物品放进最少数量容器”的问题,FunSearch 为“装箱问题”提供了一种“即时性”的解决方案,生成一项“根据物品现有体积自动进行调整”的程序。

  研究人员提到,与其他利用神经网络进行学习的 AI 训练法相比,经过 FunSearch 训练法锻炼后的模型,输出的代码更易于检查与部署,也就代表更容易被整合到实际工业环境中。

+1

来源:IT之家

延展资讯