OpenAI最新发布的模型o3在ARC-AGI基准测试中取得了显著成绩,标准计算条件下得分75.7%,高计算版本更是达到87.5%。
尽管这一成就震惊了AI研究界,但专家指出o3仍未达到通用人工智能(AGI)的标准。
o3的计算成本高昂,解决每个谜题需17至20美元,且在某些简单任务上表现不佳。
o3在ARC-AGI基准测试中获得75.7%的高分,表现超越以往模型。
o3解决每个谜题的成本高达17到20美元,计算量巨大。
尽管o3表现优秀,但专家们强调其尚未达到AGI的标准。
OpenAI最新发布的模型o3在ARC-AGI基准测试中取得了显著成绩,标准计算条件下得分75.7%,高计算版本更是达到87.5%。
尽管这一成就震惊了AI研究界,但专家指出o3仍未达到通用人工智能(AGI)的标准。
o3的计算成本高昂,解决每个谜题需17至20美元,且在某些简单任务上表现不佳。
o3在ARC-AGI基准测试中获得75.7%的高分,表现超越以往模型。
o3解决每个谜题的成本高达17到20美元,计算量巨大。
尽管o3表现优秀,但专家们强调其尚未达到AGI的标准。