Scale AI:GPT-5.3-Codex 创 SWE-Bench Pro 最高分
Scale AI 祝贺 OpenAI,57% 是 SWE-Bench Pro 有史以来的最高分。SWE-Bench Pro 仍是评估真实软件工程能力的领先基准
查看原文AI 资讯解读
本解读由 AI 自动生成,仅供参考。请以原文为准。
Scale AI 祝贺 OpenAI,57% 是 SWE-Bench Pro 有史以来的最高分。SWE-Bench Pro 仍是评估真实软件工程能力的领先基准
查看原文