PaperScope 专题深度 · Agent 创刊号

Agent 智能体全景:从工具调用到自主进化

1,189 篇 Agent 论文 · Top 25 深度解读 · 四大研究主线 · PaperScope 数据驱动

1,189 Agent 论文总量
25 深度解读
295 Top 1 Upvotes
4 研究主线
编辑洞察:Agent 研究正在经历一场范式跃迁——从「调用工具的 LLM」「自主进化的智能系统」。三个信号值得关注:(1) Agentic RL 成为最热子方向,RL 正从对齐工具升级为 Agent 训练基础设施;(2) GUI Agent 进入工业化阶段,UI-TARS-2 和 ScreenCoder 推动多轮交互闭环;(3) 科研 Agent 从辅助工具走向自主闭环——NovelSeek 实现从假设到验证的完整科研链路。

PaperScope 数据库共收录 1,189 篇 Agent 标签论文,其中 100+ upvotes 论文达 21 篇,社区关注度在所有标签中排名第五。这些论文覆盖了 Agent 研究的全谱系——从底层的强化学习训练范式,到上层的 GUI 自动化、Web 导航、科学发现应用。

本期创刊号从全量论文中按社区影响力(upvotes)筛选 Top 25 篇进行深度解读,并提炼出四条核心研究主线

速览 · Top 25 Agent 论文

# 论文 子方向 Votes 一句话
1Foundation Agents综述295脑启发智能到进化协作安全的 Agent 全景综述
2DeepSeek-V3.2基座模型261开源 MoE 355B,推理+Agent 双能力前沿
3Agentic RL SurveyAgentic RL233首篇 Agentic RL 系统综述,从单步到多步 MDP
4GLM-4.5基座模型206355B MoE 开源,Agent/推理/代码三合一
5MLGym科研 Agent194首个 ML 任务 Gym 环境,13 个开放科研任务
6AgentFlyAgent 训练160不微调 LLM 即可持续适配 Agent 行为
7Agentic RPOAgentic RL158平衡内在推理与外部工具使用的 RL 算法
8WebWatcherWeb Agent141多模态深度研究 Agent,视觉感知+逻辑推理
9Sci-LLM Survey科研 Agent140科学 LLM 综述:从数据基础到 Agent 前沿
10Agent LightningAgentic RL137解耦执行与训练,通用 Agent RL 框架
11Chain-of-Agents多 Agent129多 Agent 蒸馏 + Agentic RL 端到端训练
12UI-TARS-2GUI Agent125多轮 RL 训练 GUI Agent,跨操作系统操控
13WebSailorWeb Agent124开源超人推理 Web Agent,BrowseComp 突破
14NovelSeek科研 Agent121假设→实验→验证闭环,自主科研 Agent 框架
15rStar2-AgentAgentic RL11714B 数学推理 Agent,Agentic RL + 工具使用
16WideSearchWeb Agent111广域信息搜索 Agent 基准评测
17Agent-RAgent 训练109迭代自训练教 Agent 从错误中反思恢复
184KAgent应用 Agent106Agent 框架驱动任意图像→4K 超分辨率
19Web-ShepherdWeb Agent105Web Agent 过程奖励模型,训练+推理双用
20ScienceBoard科研 Agent104真实科研工作流的多模态 Agent 评测基准
21Search-o1推理 Agent102搜索增强大推理模型,解决知识不足问题
22ReasonMed领域 Agent102370K 多 Agent 生成的医学推理数据集
23ScreenCoderGUI Agent100模块化多模态 Agent 实现 UI 设计→代码
24Self-Evolving AgentsAgent 进化99自演化 Agent 综述——终身学习新范式
25LLM Agent Eval Survey评测96首篇 LLM Agent 评测方法论系统综述

登录后阅读完整报告

包含详细分析、数据图表、竞品对比、参考文献等

Google 登录