产品解读

Claude Opus 4.7 — 什么情况下用,什么情况下别用

硬 agent 编程旗舰级。长上下文严重回归。创意写作变机械。旧 prompt 必须重写。tokenizer 变更带来 0–35% 隐性涨价。

2026-04-25 10 篇信源 读完约 12 分钟

Claude Opus 4.7 — 什么情况下用,什么情况下别用

Claude 4.6 → 4.7 长上下文召回从 78.3% 跌到 32.2%,是近两年 Anthropic 旗舰模型最剧烈的单维度回撤。

A One-Line Read

一把极度锋利但也极度专用的 agent 编程手术刀。

Claude Opus 4.7 在编程 agent、代码审查、细颗粒度修复等"真正干活"的场景拉开差距。但在长上下文召回、创意写作、多轮研究三个维度,能力出现明显回撤。它不再是"默认最强模型",而是"特定场景下断档领先的模型"[1][2][3]

64.3%
SWE-bench Pro
70%
CursorBench 盲测
32.2%
MRCR 长上下文召回 · vs 4.6 的 78.3%
57
AA Intelligence Index

Versus 4.6

核心升级与回退一览。

维度Opus 4.6Opus 4.7变化
SWE-bench Pro59.4%64.3%+4.9
Terminal-Bench63.8%69.4%+5.6