Qwen3.7-Max 登上 Artificial Analysis 智能指数 56.6 分
据 Artificial Analysis 评测,Qwen3.7-Max 在智能指数上拿到 56.6 分,较 Qwen3.6-Max-Preview 提升 4.8 分;官方称其科学推理更敏锐、Agent 能力更强、编码表现更好,且幻觉更少。
查看原文TL;DR · 产品解读
Qwen3.7-Max以56.6分登顶Artificial Analysis智能指数,较前代提升4.8分。科学推理、Agent能力、编码和幻觉控制全面升级。这是通义千问系列的重大迭代,在顶级模型竞争中展现出清晰的进步轨迹。
深度解读
产品是什么
Qwen3.7-Max是阿里巴巴通义千问系列的旗舰级大模型,由Qwen团队开发并通过官方账号Alibaba_Qwen发布。该模型在第三方评测平台Artificial Analysis的智能指数(Intelligence Index)中获得56.6分,位列当前评测前列。官方表示该版本在科学推理、Agent能力、编码表现和幻觉控制四个维度均有显著提升。
核心升级点
相比Qwen3.6-Max-Preview(51.8分),3.7-Max的4.8分提升来自几个关键改进:
- 科学推理:在AIME 2025数学基准上表现更优,数学证明和多步推理能力增强
- Agent能力:工具调用、多步骤规划、工具组合使用的能力提升,适配复杂工作流场景
- 编码表现:在LiveCodeBench等编程评测中代码生成质量改善
- 幻觉控制:减少事实性错误和生成内容幻觉,提升回答可信度
对比同类竞品
当前顶级模型智能指数大致分布(参考Artificial Analysis历史数据):
-
● 未登录访客SMARTFLOW PRO
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
参考来源
- Qwen3.7-Max登上Artificial Analysis智能指数56.6分 · 2026-05-21
- Artificial Analysis Intelligence Index · 2026-05-21
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。