核心要点
2026 年 4 月 26 日,Sam Altman 在 X 上发布两段相连的观点:"是时候认真重新思考操作系统和用户界面是如何设计的",紧跟一句括号补充:"(互联网也是 — 应该有一套对人类和 Agent 同等可用的协议)"。同期他在 Sequoia Capital 内部活动上详细描绘了这套新协议应该长什么样:类似 HTTP 量级的基础协议、组件联邦化、Agent 持续地暴露和消费工具,认证 / 支付 / 数据传输全部在底层内建。这是 OpenAI 把自己从"AI 模型公司"重新定位为"智能时代的默认基础设施层(default interface to intelligence)"的最直白表态。
原推文 + 中文翻译
原文:"Feels like a good time to seriously rethink how operating systems and user interfaces are designed. (also the internet; there should be a protocol that is equally usable by people and agents)"
翻译:"我觉得现在是认真重新思考操作系统和用户界面设计的好时机。(也包括互联网本身——应该有一套对人类和 Agent 同等可用的协议。)"
为什么这条推文是 4-26 一天里最重的一条
4 月 26 日这一天 Altman 至少发了 4 条值得分析的推文(见末尾关联解读),这条是最具有战略重量的一条。理由:
- 现存 OS / 互联网协议都是为人设计的:HTTP / REST / OAuth / cookie / form / DOM / accessibility 全部假设交互方是「眼+鼠标+键盘」的人。Agent 现在通过 screen scraping / DOM parsing / OCR 来"扮人"——成本高、可靠性低、容易被反爬
- 2025-2026 已有零散尝试:Anthropic MCP(Model Context Protocol,2024-11 发布)、Google A2A(Agent-to-Agent,2025)、OpenAI Operator / Computer Use、Browserbase 的 Stagehand 等。但都是私域协议或工具,没有形成"HTTP 量级"的开放标准
- Altman 明确把这事提到"OS / 互联网协议"层级:意味着 OpenAI 准备从应用层(Codex、Operator、Atlas)下沉到协议层 / OS 层做战略动作。这是从"AI 应用提供方"升级为"AI 时代基础设施"的关键一步
Sequoia Capital 内部演讲补充 — 协议长什么样
同期 Altman 在 Sequoia Capital 内部活动上更详细地描绘了这套协议的技术骨架:
- 类似 HTTP 量级的开放协议,不是某家公司私有 SDK
- 联邦化(federated):不像单一公司控制(不是 Anthropic 一家说了算的 MCP,也不是 Google 一家的 A2A),多方平等参与
- Agent 持续暴露 / 消费工具:每个网站 / 服务在协议层声明"我能干什么",Agent 自动发现并调用,不需要每个 Agent 单独写适配器
- 底层内建三大能力:
- 认证(Auth):Agent 代表谁在操作,怎样授权,怎样吊销
- 支付(Payment):调用付费 API / 服务时如何结算(按 token / 按调用次数 / 订阅 / 信用卡)
- 数据传输(Data Transfer):结构化数据流,不再依赖 HTML 解析
- Altman 用词:"Everything can talk to everything(一切都能与一切对话)"
这套设想跟现有协议生态的对比
2025-2026 已经存在几套不完整的"Agent 协议"尝试。Altman 设想的是把它们整合到一个 HTTP 级开放标准里:
- Anthropic MCP(Model Context Protocol,2024-11):解决了 Agent 调用本地 / 远程工具的标准化问题,但主要是工具发现和调用接口,没解决支付 / 跨厂商认证
- Google A2A(Agent-to-Agent,2025):Agent 之间沟通的协议,针对 multi-agent 场景,但跟 MCP 是不同维度的协议(A2A 是 agent 间,MCP 是 agent 对工具)
- OpenAI Operator + Atlas(2025-2026):让 GPT 通过浏览器扮人,本质上是"用 LLM 适配现有 OS / web"的反向方案,是新协议出现前的过渡
- HTTP 402(Payment Required):HTTP 标准里早就有支付状态码,但 30 年没真正落地,因为之前没有"自动支付"的真实需求。Agent 时代会重新激活这条历史伏笔
- OAuth / OIDC:现有授权协议是为"人 → 应用"设计的(用户授权应用代表自己),不是为"应用 → Agent → 工具"三层链条设计的。Agent 时代需要"代表代表"语义
OpenAI 的潜在动作 — Altman 这条推文背后的产品路线
Altman 公开"OS / 互联网协议级别重思"的话题,结合 OpenAI 2025-2026 的实际产品节奏,能推演出至少三个方向:
- OpenAI 自己的 Agent 协议 / Agent SDK 加码:可能基于 MCP 或 fork 出新协议,把支付 / 认证 / 工具发现整合进 GPT-5.5 / Operator / Atlas / Codex 的统一 SDK
- "OpenAI OS"或类操作系统:Atlas(浏览器)+ Operator(任务自动化)+ ChatGPT Apps(应用商店)+ Codex(编码)拼起来已经是"半个 OS"。Altman 说"重新设计 OS"暗示这是产品方向
- 跟 Apple / Google / Microsoft 的协议谈判:要做 OS 级别的事必须跟 iOS / Android / Windows / macOS 厂商对接。OpenAI 跟 Apple 已在 ChatGPT 集成上合作(iOS 18+ Apple Intelligence),下一步可能是更深的协议层合作
对开发者 / 创业者意义
- SaaS 公司未来必须做 "agent-ready" 接口:现在 SaaS 提供 REST API + Web UI 两层。未来需要第三层:"Agent-friendly 协议层",允许 Agent 自动发现服务、自动认证、自动支付。早做的公司会拿到 Agent 时代的"先发流量"
- 支付层创业机会:Stripe / Paddle 等会面临 Agent 支付场景的重塑(按 token 微支付?智能路由?预付额度?)。这是 2026-2027 fintech + AI 交集最大机会
- "Agent 友好性"会成为新 SEO:如同今天网站要做 SEO,未来网站要做 "AEO"(Agent Engine Optimization)。结构化数据 / 工具暴露 / 认证清晰会带来 Agent 流量优势
- 反爬 vs 协议层博弈:现在很多公司用 Cloudflare bot 防护拦截 Agent,未来可能反过来:在协议层主动暴露工具 + 收费,而不是粗暴拦截。这会改变整个 web 的反爬产业逻辑
值得关注
- OpenAI 接下来 90 天的具体协议动作:是发布"OpenAI Agent Protocol"白皮书?跟 W3C / IETF 提交标准?还是直接通过 GPT-5.5 SDK 把私有协议推开?
- Anthropic / Google / Apple 的反应:MCP 已经成为事实标准的最大厂商是 Anthropic。Anthropic 是否会与 OpenAI 合作把 MCP 升级到 HTTP 级开放协议?还是开打"协议战"?Google A2A 与之关系?Apple 的角色?
- 支付层标准化:HTTP 402 复活迹象(如 Cloudflare 已在 2025 推 "Pay Per Crawl")。Stripe / Paddle / x402 等是否会成为"Agent 时代的 Visa / Master"?
- "AI Agent 友好性"在 SEO 行业的兴起:MCP server 数量增长曲线 / 主流 SaaS 的 Agent API 暴露比例 / 网站对 Agent UA 的允许率。这些数据是 Agent 时代基础设施成熟度的最直接 KPI
- 监管 / 标准制定的速度:Agent 协议层涉及跨国数据传输 / 自动支付 / 身份代表等敏感问题。EU AI Act 后续 / 中国数据出境管理 / 美国 SEC 对 Agent 自动交易的态度,都会影响协议落地
原文来源:@sama 推文 2026-04-26
背景报道:OfficeChai: Altman 呼吁重思互联网架构(含 Sequoia 演讲补充) · NewsBytes: Altman 呼吁为人类和 Agent 同等设计技术
关联解读:12175 - GPT-5.5 太好用 + AGI 后经济崩溃 · 12177 - GPT-5.5 开发者反响 · 12178 - OpenAI 五大原则更新 · 12180 - Ollama Cloud 上线 V4-Pro