挑战高考数学完胜商汤日日新多模态大模型评测第一

　　刚刚，商汤科技日日新SenseNova多模态大模型，在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。

　　OpenCompass多模态大模型评测排名

　　商汤日日新平均得分达到77.4，领先GPT-4o、Claude 3.5 Sonnet以及国内所有不同尺寸的开源和闭源模型。尤其在涵盖算术、统计、代数、几何、数值常识、科学和逻辑的权威数据集MathVista维度上，取得78.4分的最高分，展现了领先的“数理”能力。

　　OpenCompass 多模态评测包含八个核心数据集，从多种视角客观量化多模态大模型的能力。此次评测中，商汤日日新在几乎所有维度上都达到或超过GPT-4o水平，其中四个维度上(MMStar、MathVista、OCRBench、MMVet)排名全球第一。

　　OpenCompass大模型开放评测体系是上海人工智能实验室推出的，拥有完整开源可复现的评测框架，定期发布对各类大模型的评测成绩和排名。体系覆盖了语言与理解、常识与逻辑推理、数学计算与应用、多编程语言代码能力、智能体、创作与对话等多个方面，是对大模型真实能力各个维度的全面诊断。

挑战高考数学完胜 商汤日日新多模态大模型评测第一