OpenAI 新模型o3在ARC-AGI基准测试得分破纪录_科技魔方-中文AI大模型门户网站

首页 OpenAI 正文: OpenAI 新模型o3在ARC-AGI基准测试得分破纪录; OpenAI

2024年12月25日

点赞; 　　OpenAI最新发布的模型o3在ARC-AGI基准测试中取得了显著成绩，标准计算条件下得分75.7%，高计算版本更是达到87.5%。

　　尽管这一成就震惊了AI研究界，但专家指出o3仍未达到通用人工智能(AGI)的标准。

　　o3的计算成本高昂，解决每个谜题需17至20美元，且在某些简单任务上表现不佳。

　　o3在ARC-AGI基准测试中获得75.7%的高分，表现超越以往模型。

　　o3解决每个谜题的成本高达17到20美元，计算量巨大。

　　尽管o3表现优秀，但专家们强调其尚未达到AGI的标准。

+1; OpenAI 大模型 AI模型模型; 来源：科技魔方