本周(3月2日—8日)可能是 2026 年迄今最密集的一周。GPT-5.4 在周三正式发布,原生支持计算机操控、百万 token 上下文,加上 Thinking 推理模式,让 AI 编程工具领域瞬间进入紧急状态——Cursor 公开宣布「战时状态」,Claude Code 200 美元订阅消耗约 5000 美元算力成本的消息同步流出,说明 Anthropic 在用极高补贴换市场份额。
在模型层面,本周同样是开源生态爆发的节点:vLLM v0.17.0 集成 FlashAttention 4,Google 发布 Gemini 3.1 Flash-Lite,Karpathy 开源 autoresearch 自动化研究框架,以及 SGLang 在 Blackwell Ultra GB300 上实现 25 倍推理吞吐提升。与此同时,Qwen 技术负责人林俊阳离职,OpenAI 推理研究员 Max Schwarzer 加入 Anthropic,人才流动信号值得持续关注。
GPT-5.4 正式发布:Thinking 推理、百万上下文、原生计算机操控
3月5日,OpenAI 发布 GPT-5.4,Thinking 模式和 Pro 版本同步上线,标志着推理、编程、Agent 能力首次整合进统一旗舰模型。
Claude Marketplace + Opus 4.6 安全能力:Anthropic 拓展生态护城河
Anthropic 本周推出企业采购平台 Claude Marketplace,同步披露 Opus 4.6 两周发现 Firefox 22 个安全漏洞,CEO Dario 发布重要公开声明。
Coding Agent 军备竞赛:Cursor 战时状态、Claude Code 暴力补贴
本周 AI 编程工具领域激烈程度超出预期:Cursor 宣布战时状态,Claude Code 披露成本结构,OpenAI Codex 支持 Windows,双方都在快速迭代。
开源模型生态:Qwen 3.5、Gemini 3.1 Flash-Lite、vLLM v0.17.0
本周开源模型生态持续扩张:vLLM 发布大版本、Google 更新 Flash-Lite 性能超越上代、Qwen 系列量化版登陆 LM Studio 和 Ollama。