继华为小艺、小米小爱同学、OPPO 小布助手升级 AI 大模型能力之后,vivo 也准备在大模型领域发力。
目前,华为、小米、OPPO 相关大模型以及全新智能助手已经开始或即将开始测试,而现在,vivo 自研大模型云端方案也已经出现在 C-Eval 排行榜上,可能会在 OriginOS 4 中为 Jovi 助手带来不一样的东西。
C-Eval 是一个全面的中文基础模型评估套件。它包含了 13948 个多项选择题,涵盖了人文、社科、理工以及其他专业四个大方向,包括 52 个不同的学科和四个难度级别。
从 C-Eval 给出的信息来看,vivo_Agent_LM_7B 是由 vivo AI 全球研究院自主研发的大规模预训练语言模型,从命名可以看出其有着 70 亿参数。
只看最终结果的话,vivo_Agent_LM_7B 最终得分为 64.4 分,位列 C-Eval 第五名,与第二名的 GPT-4 十分接近,甚至在人文领域更强,而且在社会科学领域也有不错的表现。