行业 @AnthropicAI 2026-06-04

Anthropic：AI 研究是一系列下一步决策

AI 研究是一系列下一步决策。我们让 Claude 看研究员走错路会话并建议下一步，Mythos Preview 优于人类 64%（2024 年 22%）。

TL;DR · 观点解读

Anthropic 声称其 AI 系统 Mythos Preview 在「研究走错路后建议下一步」任务上超越人类基准 64%，较 2024 年的 22% 大幅提升。这暗示 AI 正从执行层走向策略层，但基准透明度存疑，Anthropic 自身有强烈动机将「AI 辅助研究」叙事讲通。

深度解读

说话人的历史观点 + 利益关联

Anthropic 这条推文的核心叙事是：AI 能力正在从「执行具体任务」升级到「做出正确的下一步决策」。这不是 Anthropic 第一次推这个方向——他们过去一年持续在宣传 Claude 在「研究推理」「战略规划」场景的能力，从 2024 年的 22% 到 2026 年的 64%，数字本身就在构建一个「快速逼近人类水平」的故事弧。

但这里有明显的利益关联：

商业层面：如果 AI 真的能辅助甚至替代研究人员的决策过程，这是对企业级 AI 产品的强力背书（Claude for Research / Enterprise）；
资本叙事：「AI 能帮研究员少走弯路」直接关联 Anthropic 的估值逻辑——研发效率提升是 AI 最重要的生产力论据；
竞争定位：与 OpenAI、DeepMind 的能力声明形成差异化——不只比「写代码快」，而是比「判断研究方向对不对」更高级。

Anthropic 联合创始人 Dario Amodei 历史上多次强调 AI 将改变科学研究的速度，这次表态是这个长期叙事的延续，而非

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

Anthropic 原始推文 · 2026-06-04
Dario Amodei 关于 AI 与科学研究的论述 · 2025-01-01
AI 基准可信度问题的行业讨论 · 2024-06-07

本解读由 AI 自动生成 · 模板：观点解读 · 仅供参考，请以原文为准。