科技魔方

OpenAI 新模型o3在ARC-AGI基准测试得分破纪录

OpenAI

2024年12月25日

  OpenAI最新发布的模型o3在ARC-AGI基准测试中取得了显著成绩,标准计算条件下得分75.7%,高计算版本更是达到87.5%。

  尽管这一成就震惊了AI研究界,但专家指出o3仍未达到通用人工智能(AGI)的标准。

  o3的计算成本高昂,解决每个谜题需17至20美元,且在某些简单任务上表现不佳。

  o3在ARC-AGI基准测试中获得75.7%的高分,表现超越以往模型。

  o3解决每个谜题的成本高达17到20美元,计算量巨大。

  尽管o3表现优秀,但专家们强调其尚未达到AGI的标准。

+1

来源:科技魔方

延展资讯