产品发布 @OpenAI 2026-04-16

OpenAI：Codex 在 macOS 上具备通用电脑使用能力

通过 macOS computer use，Codex 可自行看、点击、输入以操作任意应用，后台运行不占用户桌面，适用于前端迭代、应用测试等无 API 场景。

TL;DR · 产品解读

OpenAI 发布 Codex macOS 版，让 AI 直接操控电脑操作系统任意应用，后台运行不占桌面，适合前端测试和传统软件自动化场景。这是 Agent 从 API 调用走向操作系统级控制的关键一步。

深度解读

产品具体是什么

Codex 通过 macOS computer use 功能，让 AI 模型能够像人一样"看"屏幕、理解界面元素，然后执行点击、输入等操作来控制任意应用。它在后台静默运行，不占用用户桌面空间，也不干扰正常操作。这意味着 AI Agent 首次能够绕过 API 直接操控那些没有开放接口的传统桌面软件。

解决什么问题

大量真实工作场景依赖没有 API 的工具——传统 ERP 的操作界面、老旧桌面软件的交互、某些不支持自动化的 Web 应用。开发者过去只能用 Selenium 等工具编写复杂的爬虫脚本，或者干脆靠人工点击来完成任务。Codex 把这个过程自动化了：给定一个任务描述，它就能自动规划步骤、执行操作、验证结果。这对前端迭代和自动化测试尤为有价值——无需为每个应用单独写 API 适配器，AI 直接模拟人类操作流程。

从 API 到 OS 级的跨越

这次发布代表了 AI Agent 能力的重要跃迁：从"调用 API"到"操作系统级控制"。Codex 基于 GPT-4.5 的多模态理解能力，不仅能看懂屏幕内容，还能将 UI 状态转化为可执行的行动计划。这种能力在 Claude Computer Use（Anthropic，2025年10月发布）上已有先例，OpenAI 此番跟进并将能力落地到

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

OpenAI 官方推文 · 2026-04-16
Anthropic Claude Computer Use 发布公告 · 2025-10-22

本解读由 AI 自动生成 · 模板：产品解读 · 仅供参考，请以原文为准。