本周(3 月 9 日—15 日)AI 行业的主旋律是「基础设施升级」。Anthropic 在一周内打出三记重拳——Code Review(3/9)、Excel/PPT 插件(3/11)、1M 上下文正式 GA(3/13),Claude 从「最好的编程模型」向「全场景工作伙伴」跃迁。Perplexity 则更激进,直接发布了一台搭载 Mac mini 的 Personal Computer 硬件,将 AI Agent 从云端拉到了桌面。
与此同时,NVIDIA GTC 2026 进入最后倒计时,Nemotron 3 Super 先行登场——120B MoE 仅 12B 激活参数的效率设计,vLLM、SGLang、Ollama 首日全部支持。编程工具赛道 Replit Agent 4 正式发布,GitHub Copilot、Cursor、Claude Code、OpenAI Codex、Replit 五大 Agent 竞争加剧。而 xAI 则成了本周最大反面教材——12 位联合创始人仅剩 2 位在职,多位前员工公开爆料内部管理问题。
Claude 生态大爆发:Code Review + 百万上下文 + Office 插件三连击
Anthropic 本周密集发布三项重大功能,Claude 从「最强编程模型」跃迁为「全场景 AI 工作伙伴」。
周一(3/9),Anthropic 推出 Claude Code Review——一个多 Agent 并行审查 Pull Request 的系统。它不是简单的代码扫描,而是由一组 Claude Agent 分别从不同角度(安全、性能、逻辑、风格)同时审查代码,再由一个「误报过滤器」汇总结论。官方数据显示,在大型 PR(>500 行)中 84% 的 PR 能发现至少一个真实问题,平均每个 PR 发现 7.5 个问题。有效评审率从传统 linter 的 16% 飙升至 54%。按 token 用量计费,单次平均 15-25 美元。
周三(3/11),Claude Excel 和 PowerPoint 插件扩展至 Amazon Bedrock、Google Vertex AI 和 Microsoft Foundry 三大云平台,意味着企业客户可以在自己的云环境中使用 Claude 处理 Office 文档,数据不出企业边界。同时 Claude Skills 功能也登陆了 Office 插件,用户可以用自然语言定义重复性工作流。
周五(3/13)是本周最大的一枪——Claude 100 万 Token 上下文窗口正式 GA,面向所有计划用户开放(包括 Max、Team、Enterprise 和 API)。完整 1M 上下文按标准费率计费,无额外乘数——这是一个重要的定价信号。更关键的是,Anthropic 同步公布了 MRCR v2(多轮检索与推理)基准测试成绩:Opus 4.6 在 1M token 长度上准确率达 78.3%,远超 Gemini 3 Pro(26.3%)和 Sonnet 4.5(18.5%)。这不只是「能塞进更多文本」,而是「塞进去之后还能记住、理解和使用」。
周末(3/14),Anthropic 额外宣布非高峰时段用量翻倍,为期两周。这显示 Anthropic 对自身推理基础设施的产能信心——上周 GPT-5.4 发布后行业讨论焦点是「谁的 Agent 更好用」,Anthropic 选择用「更多用量」来回应竞争,而非降价。
Perplexity Personal Computer:从搜索引擎到硬件平台的激进转型
Perplexity 一周内发布桌面硬件、企业版和移动端三个版本,将 AI Agent 从云端推向物理世界。
本周最意外的产品发布来自 Perplexity。周三(3/11),Perplexity 在旧金山 Ask 2026 开发者大会上发布了 Personal Computer——一款运行在用户自备 Mac mini 上的 24/7 AI 助手。它持续访问你的 Gmail、Slack、GitHub、Notion、Salesforce 等应用,能在你不在场时监控触发器、执行主动任务。敏感操作需用户批准,配有审计轨迹和紧急停止开关。仅限 Max 订阅用户($200/月)。
同日,Perplexity 还宣布 API 平台升级为全栈模型无关 Agent 构建平台,开发者可以用 Perplexity API 构建自己的 AI Agent,不绑定特定模型。两天后(3/13),Computer 功能登陆移动端——AI 可以在后台操作手机完成任务。
一周内,Perplexity 从搜索引擎变成了一个横跨桌面、云端、移动端的 AI Agent 平台。上周四还集成了 NVIDIA Nemotron 3 Super 模型,进一步扩大了模型选择范围。
NVIDIA GTC 2026 预热:Nemotron 3 Super 首发,黄仁勋主题演讲在即
GTC 大会下周开幕,NVIDIA 先手打出 Nemotron 3 Super 这张开源模型牌,同时抛出「AI 经济五层架构」理论框架。
本周是 NVIDIA GTC 2026 的「预热周」。3 月 16 日黄仁勋将发表主题演讲,这是上半年最受关注的行业演讲。GTC 前一周,NVIDIA 密集释放信号:
Nemotron 3 Super(3/11)是本周最重要的技术发布之一——采用混合 Mamba-Transformer MoE 架构,120B 总参数仅 12B 激活参数,推理效率极高:中位数吞吐 429.6 tokens/s,是同类开源模型中位数(76.6 t/s)的 5.6 倍。在 Agent 基准测试 PinchBench 上得分 85.6%(开源最佳),支持 1M 上下文窗口(RULER 得分 91.75%)。更值得关注的是生态响应速度:vLLM v0.17.1、SGLang、Ollama、Together AI 全部首日支持。
NVIDIA 同时抛出了「AI 经济五层架构」理论——芯片→系统→平台→模型→应用,强调 AI 经济不只是软件层面的事,更是能源、芯片和基础设施的故事。这个叙事显然是为 GTC 主题演讲预热,暗示黄仁勋将重点讲基础设施层面的愿景。
GTC 现场还展示了 Claw 机器人互动体验(3/13),参会者可以亲身操作 AI 驱动的机械臂。Ollama 宣布将联合 NVIDIA 在 GTC 举办本地 AI 开发者专场。
AI 编程工具竞赛:Replit Agent 4 入场,五强混战格局加剧
Replit Agent 4 正式发布,与 GitHub Copilot、Cursor、Claude Code、OpenAI Codex 形成五大 AI 编程 Agent 的竞争格局。Cursor 同时遭遇核心人才流失。
继上周 Claude Code Review 引爆编程工具赛道后,本周 Replit Agent 4(3/11-13)正式发布,同步宣布完成 $4 亿 Series D 融资(估值 $90 亿,6 个月前仅 $30 亿)。Agent 4 带来并行 Agent(多个 Agent 同时处理项目不同部分)、多人实时协作和全栈 + 移动端开发能力。Replit 在三天内连续放出预告、直播和深度解析。swyx 评价称「Replit Agent 4 已超越 Google 和微软,成为最强 AI 生产力套件」。
同时,Cursor 遭遇人才危机——两位核心负责人出走加入 xAI 打造基于 Grok 的编程产品。不过 Cursor 也在反击,发布了 Agent 编程任务模型评测新方法,试图建立自己的评估标准。宝玉则分享了 Learn Claude Code 开源教程(3/14),12 节课从零搭建 AI 编程 Agent,进一步推动 Claude Code 的社区生态。