科技魔方

Google发布AI编程助手AlphaCode2,基于Gemini系统

大模型

2023年12月07日

  谷歌日前发布了AlphaCode2,这是一款由Gemini模型驱动的AI编程工具,是对前代AlphaCode的改进版本。与Gemini模型同时亮相,AlphaCode2在编程竞赛中表现出色,尤其在动态规划等复杂问题上具备更强大的能力。

  研究人员通过在CodeForces竞赛网站上收集的约15000个问题和3000万份人类编写的代码的数据集上对Gemini Pro系统进行精细调整,为AlphaCode2的问题解决能力提供了强大支持。

  根据谷歌在Codeforces平台上的数据,AlphaCode2在涵盖Python、Java、C++和Go等多语言的编程竞赛中,平均胜过了约85%的竞争对手,相较于前代,这是一次显著的提升。在技术白皮书中指出,在12场最近的竞赛中,AlphaCode2解决了77个问题中的43%,而前代仅在25%的问题上获得成功。

image.png

  动态规划是编程竞赛中常见的复杂问题之一,而AlphaCode2展现出其在这方面的卓越表现。DeepMind研究科学家Rémi Leblond在一段预录视频中解释说,AlphaCode2不仅知道何时正确实施动态规划策略,还知道在何处使用它。这对于原始AlphaCode在处理需要动态规划的编程问题时曾经遇到的困难而言,是一项显著的进步。

  AlphaCode2的工作原理涉及一系列“策略模型”,这些模型为每个问题生成多个代码样本。不符合问题描述的代码样本被过滤掉,然后通过聚类算法将“语义相似的代码样本”分组,以避免冗余。最终,AlphaCode2内的评分模型确定每个最大代码样本“簇”中的最佳候选答案。

  尽管AlphaCode2在编程竞赛中表现出色,但白皮书指出其存在一些缺陷。例如,AlphaCode2需要大量的试错,运营成本较高,且过于依赖于过滤明显错误的代码样本。据猜测,迁移到更强大的Gemini版本,如Gemini Ultra,可能会缓解这些问题。

  Google DeepMind相信,通过使用Gemini Ultra,一个比Gemini Pro更大更强大的大型语言模型,他们可以构建一个更出色的代码编写模型,并表示正在努力将其能力提供给开发者。团队希望将AlphaCode2的独特能力引入基础Gemini模型,使这种新的编程范式成为所有人的首选。

  关于AlphaCode2是否会成为产品的问题,DeepMind的产品副总裁Eli Collins在一次简报中暗示了这一可能性。他表示:“关于最新结果最让我兴奋的事情之一是,当程序员与[由Gemini提供动力的] AlphaCode2合作时,通过定义代码应遵循的某些属性,[模型]的性能会变得更好。”他进一步指出:“在未来,我们预见程序员将利用高度 capable 的AI模型作为协作工具,从问题推理到辅助实施,助力整个软件开发过程。”

+1

来源:站长之家

延展资讯