GTC 开幕周 | Claude 1M Token 上线、Perplexity 造电脑、LeCun 10 亿创业、xAI 大逃亡

本周（3 月 9 日—15 日）AI 行业的主旋律是「基础设施升级」。Anthropic 在一周内打出三记重拳——Code Review（3/9）、Excel/PPT 插件（3/11）、1M 上下文正式 GA（3/13），Claude 从「最好的编程模型」向「全场景工作伙伴」跃迁。Perplexity 则更激进，直接发布了一台搭载 Mac mini 的 Personal Computer 硬件，将 AI Agent 从云端拉到了桌面。

与此同时，NVIDIA GTC 2026 进入最后倒计时，Nemotron 3 Super 先行登场——120B MoE 仅 12B 激活参数的效率设计，vLLM、SGLang、Ollama 首日全部支持。编程工具赛道 Replit Agent 4 正式发布，GitHub Copilot、Cursor、Claude Code、OpenAI Codex、Replit 五大 Agent 竞争加剧。而 xAI 则成了本周最大反面教材——12 位联合创始人仅剩 2 位在职，多位前员工公开爆料内部管理问题。

本周核心判断：Anthropic 正以「超长上下文 + Agent 工具链」构建一个闭环生态——从代码审查到文档处理到 API 平台，Claude 正在成为不只是「最聪明」而是「最能干」的 AI。Perplexity 造硬件看似冒进，实则在抢占 AI 时代的「入口」位置。而 NVIDIA 通过 Nemotron 3 Super 向开源生态释放信号：我们不只卖 GPU，也要做模型。本周黄仁勋主题演讲（3/16）将是上半年最重要的行业风向标。

238

本周资讯总量

Claude 上下文窗口

78.3%

Opus 4.6 MRCR v2 1M

120B

Nemotron 3 Super 总参数

2/12

xAI 在职联合创始人

$1.03B

AMI Labs 种子轮融资

产品发布69

行业38

研究31

大模型31

观点29

企业动态16

活动11

机器人3

芯片2

人物1

01 / 08

Claude 生态大爆发：Code Review + 百万上下文 + Office 插件三连击

Anthropic 本周密集发布三项重大功能，Claude 从编程工具跃迁为「全场景 AI 工作伙伴」。

周一（3/9），Anthropic 推出 Claude Code Review——一个多 Agent 并行审查 Pull Request 的系统。它不是简单的代码扫描，而是由一组 Claude Agent 分别从不同角度（安全、性能、逻辑、风格）同时审查代码，再由一个「误报过滤器」汇总结论。官方数据显示，在大型 PR（>500 行）中 84% 的 PR 能发现至少一个真实问题，平均每个 PR 发现 7.5 个问题。有效评审率从传统 linter 的 16% 飙升至 54%。按 token 用量计费，单次平均 15-25 美元。

03-09

Anthropic 推出 Claude Code Review：多 Agent 并行查 Bug，有效评审率从 16% 飙升至 54%

Claude Code Review 使用 Agent 团队并行搜索 Bug 并按严重性排序，大型 PR 中 84% 发现问题，平均 7.5 个。按 Token 用量计费，单次平均 15-25 美元。

@claudeai 产品发布

周三（3/11），Claude Excel 和 PowerPoint 插件扩展至 Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 三大云平台，意味着企业客户可以在自己的云环境中使用 Claude 处理 Office 文档，数据不出企业边界。同时 Claude Skills 功能也登陆了 Office 插件，用户可以用自然语言定义重复性工作流。

周五（3/13）是本周最大的一枪——Claude 100 万 Token 上下文窗口正式 GA，面向所有计划用户开放（包括 Max、Team、Enterprise 和 API）。完整 1M 上下文按标准费率计费，无额外乘数——这是一个重要的定价信号。更关键的是，Anthropic 同步公布了 MRCR v2（多轮检索与推理）基准测试成绩：Opus 4.6 在 1M token 长度上准确率达 78.3%，远超 Gemini 3 Pro（26.3%）和 Sonnet 4.5（18.5%）。这不只是「能塞进更多文本」，而是「塞进去之后还能记住、理解和使用」。

03-13

Claude 100 万 Token 上下文窗口正式面向所有用户开放

可处理约 7 万行代码、2000 页文档或整个代码库。Opus 4.6 在 MRCR v2 基准测试 1M 上下文下准确率达 78.3%，远超 Sonnet 4.5（18.5%）和 Gemini 3 Pro（26.3%）。

@AnthropicAI · @alexalbert__ 大模型

周末（3/14），Anthropic 额外宣布非高峰时段用量翻倍，为期两周。这显示 Anthropic 对自身推理基础设施的产能信心——上周 GPT-5.4 发布后行业讨论焦点是「谁的 Agent 更好用」，Anthropic 选择用「更多用量」来回应竞争，而非降价。

编辑点评：本周 Anthropic 的策略非常清晰——用 Code Review 巩固编程赛道、用百万上下文切入文档处理赛道、用 Office 插件拿下企业场景。三者叠加，Claude 正在从「最聪明的对话 AI」变成「最能干的工作 AI」。MRCR v2 在 1M token 上 78.3% vs Sonnet 4.5 的 18.5% 的差距说明，在超长上下文这件事上，Opus 4.6 不是领先一点点，而是领先一个身位。

02 / 08

Perplexity Personal Computer：从搜索引擎到硬件平台的激进转型

Perplexity 一周内发布桌面硬件、企业版和移动端三个版本，将 AI Agent 从云端推向物理世界。

本周最意外的产品发布来自 Perplexity。周三（3/11），Perplexity 在旧金山 Ask 2026 开发者大会上发布了 Personal Computer——一款运行在用户自备 Mac mini 上的 24/7 AI 助手。它持续访问你的 Gmail、Slack、GitHub、Notion、Salesforce 等应用，能在你不在场时监控触发器、执行主动任务。敏感操作需用户批准，配有审计轨迹和紧急停止开关。仅限 Max 订阅用户（$200/月）。

03-11

Perplexity 发布 Personal Computer：Mac mini 上的 24/7 AI 助手

一台专为 AI 设计的硬件设备，24 小时在线运行，支持安全环境与多设备远程控制。同日发布企业版，跨 20 个模型、400+ 应用。

@perplexity_ai 产品发布

03-11

Perplexity 企业版 Computer：跨 20 个模型、400+ 应用的工作流自动化

面向企业的 Computer 版本同步上线，支持多模型切换和数百个应用连接器，定位为企业级 AI 工作流自动化平台。

@perplexity_ai 产品发布

03-13

Perplexity Computer 功能登陆移动端，支持跨设备同步

AI 可以在后台帮用户操作手机完成各种任务，支持手机端 App 操控，在移动平台实现了 AI Agent 的真正落地。

@peraboreal 产品发布

同日，Perplexity 还宣布 API 平台升级为全栈模型无关 Agent 构建平台，开发者可以用 Perplexity API 构建自己的 AI Agent，不绑定特定模型。两天后（3/13），Computer 功能登陆移动端——AI 可以在后台操作手机完成任务。

一周内，Perplexity 从搜索引擎变成了一个横跨桌面、云端、移动端的 AI Agent 平台。上周四还集成了 NVIDIA Nemotron 3 Super 模型，进一步扩大了模型选择范围。

编辑点评：Perplexity 造硬件让人想起 Rabbit R1 和 Humane AI Pin——但区别在于，Perplexity 的 Personal Computer 基于成熟的 Mac mini 平台，不是从零造一个新设备。软件能力已经验证（搜索+Agent），硬件只是解决「永远在线」的问题。这个策略比造一个新 gadget 聪明得多。但最终能否成功，取决于「24/7 在线的 AI 助手」是否是一个真实需求。

03 / 08

NVIDIA GTC 2026 预热：Nemotron 3 Super 首发，黄仁勋主题演讲在即

GTC 大会下周开幕，NVIDIA 先手打出 Nemotron 3 Super 这张开源模型牌，同时抛出「AI 经济五层架构」理论框架。

本周是 NVIDIA GTC 2026 的「预热周」。3 月 16 日黄仁勋将发表主题演讲，这是上半年最受关注的行业演讲。GTC 前一周，NVIDIA 密集释放信号：

Nemotron 3 Super（3/11）是本周最重要的技术发布之一——采用混合 Mamba-Transformer MoE 架构，120B 总参数仅 12B 激活参数，推理效率极高：中位数吞吐 429.6 tokens/s，是同类开源模型中位数（76.6 t/s）的 5.6 倍。在 Agent 基准测试 PinchBench 上得分 85.6%（开源最佳），支持 1M 上下文窗口（RULER 得分 91.75%）。更值得关注的是生态响应速度：vLLM v0.17.1、SGLang、Ollama、Together AI 全部首日支持。

03-11

NVIDIA Nemotron 3 Super 发布：120B MoE / 12B 激活参数，四大推理引擎首日支持

vLLM v0.17.1、SGLang、Ollama、Together AI 首日支持。vLLM 集成后吞吐量提升 5 倍。Kimi CEO 杨植麟确认将在 GTC 分享 K2.5 训练细节。

@nvidia · @vllm_project · @ollama 大模型

03-13

NVIDIA 提出 AI 经济五层架构模型

从芯片、系统、平台、模型到应用层逐层分析 AI 产业链的价值分布，认为 AI 经济不仅是软件，更是能源、芯片和基础设施。

@nvidia 观点

NVIDIA 同时抛出了「AI 经济五层架构」理论——芯片→系统→平台→模型→应用，强调 AI 经济不只是软件层面的事，更是能源、芯片和基础设施的故事。这个叙事显然是为 GTC 主题演讲预热，暗示黄仁勋将重点讲基础设施层面的愿景。

GTC 现场还展示了 Claw 机器人互动体验（3/13），参会者可以亲身操作 AI 驱动的机械臂。Ollama 宣布将联合 NVIDIA 在 GTC 举办本地 AI 开发者专场。

「AI 不只是一个行业，它是一个经济体。从芯片到系统到平台到模型到应用——五层都在同时发生革命。」——NVIDIA

编辑点评：NVIDIA 发布 Nemotron 3 Super 的信号值得细品：这家以卖 GPU 为核心业务的公司，正在越来越认真地做模型。120B 参数但只激活 12B 的 MoE 设计，明显是为了证明「在 NVIDIA GPU 上跑开源模型，效率可以非常高」。配合 GTC 主题演讲，预计黄仁勋将进一步推动「AI 工厂」叙事——不只卖芯片，而是卖整个 AI 基础设施栈。

04 / 08

AI 编程工具竞赛：Replit Agent 4 入场，五强混战格局加剧

Replit Agent 4 正式发布，与 GitHub Copilot、Cursor、Claude Code、OpenAI Codex 形成五大 AI 编程 Agent 的竞争格局。Cursor 同时遭遇核心人才流失。

继上周 Claude Code Review 引爆编程工具赛道后，本周 Replit Agent 4（3/11-13）正式发布，同步宣布完成 $4 亿 Series D 融资（估值 $90 亿，6 个月前仅 $30 亿）。Agent 4 带来并行 Agent（多个 Agent 同时处理项目不同部分）、多人实时协作和全栈 + 移动端开发能力。Replit 在三天内连续放出预告、直播和深度解析。swyx 评价称「Replit Agent 4 已超越 Google 和微软，成为最强 AI 生产力套件」。

03-11

Replit Agent 4 正式发布：多人协作、并行构建、全栈+移动端

支持 Web 和移动端应用开发、幻灯片动画及数据分析。前 100 名构建者获 100 美元积分。直播演示中现场构建了跨平台实时聊天应用。

@Replit 产品发布

03-12

Cursor 两位核心负责人出走加入 xAI 打造编程产品

宝玉爆料 Cursor 两位核心负责人已加入 xAI，将打造基于 Grok 的编程工具。Cursor 核心人才流失引发行业关注。

@dotey 企业动态

03-12

Cursor 发布 Agent 编程任务模型评测新方法

对比各模型在 Agent 编程任务中的智能与效率表现，为开发者选型提供参考。

@cursor_ai 大模型

同时，Cursor 遭遇人才危机——两位核心负责人出走加入 xAI 打造基于 Grok 的编程产品。不过 Cursor 也在反击，发布了 Agent 编程任务模型评测新方法，试图建立自己的评估标准。宝玉则分享了 Learn Claude Code 开源教程（3/14），12 节课从零搭建 AI 编程 Agent，进一步推动 Claude Code 的社区生态。

84% Claude Code Review 大 PR 发现率 54% 有效评审率 7.5 平均每 PR 发现问题数

编辑点评：AI 编程工具赛道正在从「谁的模型更好」转向「谁的生态更完整」。GitHub Copilot 占据最大市场份额和 IDE 生态，OpenAI Codex 主打云端沙箱异步执行，Cursor 凭借深度 IDE 集成快速增长，Claude Code 的优势在于底层模型能力和终端原生体验，Replit 则靠全栈闭环（编辑器+部署+协作）差异化竞争。Cursor 核心人才流失至 xAI 值得警惕——如果 xAI 做出基于 Grok 的编程工具，竞争将进一步白热化。

登录后阅读完整报告

包含详细分析、数据图表、竞品对比、参考文献等

Google 登录

或