AI 大事件

Grok Build:xAI 迟到一年的 Coding Agent 拿什么追 Claude Code / Codex

8 并发 subagent + plan mode + SuperGrok Heavy $300/月,能否撕开 Anthropic / OpenAI 把持的 CLI 编码 agent 战场

Pro 限定研报

2026-05-16 14 篇信源 读完约 16 分钟

Grok Build:xAI 迟到一年的 Coding Agent 拿什么追 Claude Code / Codex

一句话看清楚:2026-05-14 xAI 上线首款 CLI 编码 agent「Grok Build」,跑在 Grok 4.3 beta 之上,单次任务可派 8 个 sub-agent 并行,绑定 SuperGrok Heavy $300/月订阅(前 6 个月介绍价 $99)[1][2]。Anthropic Claude Code、OpenAI Codex 都已经在市场上跑了一年多,xAI 这次入场更像是「补齐缺口」而非「定义品类」。[3][4]


§ 1 这是什么:一句官方话 + 几个硬事实

xAI 在 5-14 把 Grok Build 描述为「a powerful new coding agent and CLI for professional software engineering and complex coding work」[5]。简单说就是一个终端原生的命令行 agent,开发者通过自然语言提示让它规划项目、编辑文件、执行 shell 命令、构建完整应用。[1][2]

4 个值得记的事实

  1. 发布时间:5-14 xAI 官方宣布 + Elon Musk 本人当天在 X 上发 beta 邀请[2]
  2. 底层模型:跑在 Grok 4.3 beta 之上(据多个第三方报道,xAI 官方未在产品页直接列出版本号)[6]
  3. 入口:xAI 官网登录后下载 CLI(exclusively SuperGrok Heavy subscribers,$300/月,首 6 个月介绍价 $99)[1][7]
  4. 能力清单(官方+多家媒体复述对齐)[1][5][8]
    • 自然语言生成实现 plan(执行前可审核)
    • 写 / 改 / 删项目文件
    • 执行 shell 命令 + 管理依赖
    • 通过 subagent 和 plugin 支持协作开发工作流

§ 2 8 并发 subagent — Grok Build 的差异化点

这是 Grok Build 相对 Claude Code / Codex 最 marketable 的设计点。[8][9]

按官方+媒体描述:单次任务可派最多 8 个 specialized sub-agent,同时做 plan / search documentation / write code[8] 对大规模、多文件项目,复杂任务被拆解后从多个方向同时进攻,而不是单线程顺序执行。[8][9]

值得对照的是底层模型本身的 multi-agent 设计:Grok 4.3 beta 内置 16-agent Heavy 架构 + 约 200 万 token 上下文窗口(据 MindStudio / NxCode 等多家覆盖 xAI 模型路线的第三方报告)[6]。所以 Grok Build 的「8 sub-agent」是产品层的工作流并发,跟底层模型的 16-agent Heavy 是两个不同层级的概念,不要混用。

📌 跟 Claude Code 怎么比:Anthropic 的 Claude Code 主推单 agent 模式 + MCP 连接器;多 agent 协作是通过 sub-agent skill 和 Cowork 矩阵搭出来的[3]。Grok Build 把「并发 sub-agent」做成默认行为,是一种产品形态上的 bet——赌大型项目场景下并发比串行更值得卖。

§ 3 plan mode — 跟 Claude Code 的对位

Grok Build 内置 plan mode:在写第一行代码之前,先生成完整的 execution plan,开发者可以审批、按步骤评论、整段重写,再启动执行。[1][8][10]

这跟 Anthropic Claude Code 的 /plan slash 命令和 OpenAI Codex 的 plan-then-execute 模式形态非常接近,不算 Grok Build 独创[3][11]。差异更多在交互细节——比如能否对单步评论、能否部分接受。具体到使用体验,beta 阶段公开能查到的细节不多,需要实际跑过才能判定。

§ 4 SuperGrok Heavy $300/月——这个定价怎么解读

这是 Grok Build 最有争议的产品决策。[7][12]