← 返回资讯
产品发布 @nvidia 2026-06-12

首个代理AI基础设施基准AgentPerf出炉,NVIDIA Blackwell能效领先20倍

代理AI需串联数十至数百次模型调用,现有基准无法评估。AgentPerf为开发者、企业和基础设施提供商提供统一比较标准,首轮测试显示NVIDIA Blackwell每兆瓦处理代理数量是竞品的20倍。

查看原文
TL;DR · 产品解读

英伟达发布首个代理AI基础设施基准AgentPerf,聚焦多步代理工作负载的能效与吞吐量评估。首轮测试显示Blackwell每兆瓦处理代理数量是竞品20倍,为AI基础设施竞争提供新衡量标准。

深度解读

产品是什么

AgentPerf是首个专门评估代理AI(Agentic AI)基础设施性能的基准测试工具。与传统AI基准(如MLPerf)聚焦单次模型调用延迟不同,AgentPerf针对代理AI的核心特征设计——需串联数十至数百次模型调用、涉及工具调用、状态管理、决策分支等复杂操作。

从NVIDIA披露的信息看,AgentPerf核心评估维度是能效(Agents per Megawatt,每兆瓦处理代理数量)和吞吐量,这直接关联到大规模部署的运营成本。

解决什么问题

代理AI工作负载的崛起暴露了现有基准的盲区。传统基准模拟的是"一次调用"场景,而真实代理应用需要反复调用模型、做决策、调用外部工具、维持状态——这种"多步骤编排"(Multi-step Orchestration)对底层基础设施提出了截然不同的要求:内存带宽、NVLink互联带宽、多实例调度效率等成为关键瓶颈。

AgentPerf的价值在于为这个新兴但快速增长的工作负载类型提供统一的量化语言,让基础设施采购和架构选型有据可依。

对比同类竞品

目前市场上缺乏专门的代理AI基准,竞品对比需从两个层面看:

参考来源
  1. NVIDIA官方公告 · 2026-06-12
  2. MLPerf Inference基准官网 · 2026-01-01
本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。