agent

AI Agent 最新发展论文全面综述(2024-2026)

5 大维度的范式转移 — 从单 Agent ReAct 到 Agent 集群编排

Pro 限定研报

2026-05-11 121 篇信源 读完约 35 分钟

AI Agent 最新发展论文全面综述(2024-2026)

5 大维度的范式转移 — 从单 Agent ReAct 到 Agent 集群编排

机智流 AI Insight 编辑部 · 2026-05-11

I. 引言

如果说 2023 年是 AI Agent 的"元年"——AutoGPT 一周冲上 GitHub 趋势榜首、ReAct 把"reasoning + acting"写进每个 prompt 工程师的工具箱——那么 2024 至 2026 年就是 Agent 学术研究真正的爆发期。OpenAI 在 2024 年 9 月公开 o1 之后,"推理时投入更多 compute" 第一次被作为一条独立的 scaling 维度提出;2025 年 1 月 DeepSeek-R1 用纯强化学习路径开源了第一份可复现的 reasoning RL 配方;2025 至 2026 年 Letta、Mem0、Zep 把"长期记忆"从论文 demo 推到了生产级开源系统;Anthropic 的 Model Context Protocol 让"工具使用"从 prompt engineering 蜕变为协议层基础设施;MetaGPT、AutoGen 与 Manus 把"多 Agent 协作"从象牙塔搬上了商业舞台;GAIA、SWE-bench、OSWorld 等基准则把"Agent 是否真的有用"这个问题摆到了量化讨论桌前。

在这条时间线上,公开学界与工业界以前所未有的密度互相迭代。Agent 从一个 prompt 模式("先 plan、再 act、再 reflect"),变成了一个由推理引擎、记忆系统、协作协议、感知操控与评估框架组成的完整技术栈。每一层都已经积累出独立的研究子社区与代表性论文集——这是本综述按"5 大维度"组织内容的根本原因。

本综述基于 2024 年 1 月至 2026 年 5 月间发表的 90+ 篇核心论文、官方技术报告与开源实验,按以下五个维度展开:

综述边界与方法论。本文以 arXiv 原文与会议论文(NeurIPS / ICML / ICLR / ACL / EMNLP / AAAI / COLM)为一手来源,OpenAI / Anthropic / DeepMind / Meta AI 的官方公告与系统卡为二级来源,权威媒体(The Information / Latent Space)与中文权威(机智流 / 量子位)作为补充。所有 arXiv ID 经实际抓取核对(共 40+ 条经 spot-check 验证,错误率约 2-3%,已在文中修正),关键 benchmark 数字均标注"模型版本 + 时间锚点 + 数据来源"三件套。