首个代理AI基础设施基准AgentPerf出炉,NVIDIA Blackwell能效领先20倍
代理AI需串联数十至数百次模型调用,现有基准无法评估。AgentPerf为开发者、企业和基础设施提供商提供统一比较标准,首轮测试显示NVIDIA Blackwell每兆瓦处理代理数量是竞品的20倍。
查看原文英伟达发布首个代理AI基础设施基准AgentPerf,聚焦多步代理工作负载的能效与吞吐量评估。首轮测试显示Blackwell每兆瓦处理代理数量是竞品20倍,为AI基础设施竞争提供新衡量标准。
产品是什么
AgentPerf是首个专门评估代理AI(Agentic AI)基础设施性能的基准测试工具。与传统AI基准(如MLPerf)聚焦单次模型调用延迟不同,AgentPerf针对代理AI的核心特征设计——需串联数十至数百次模型调用、涉及工具调用、状态管理、决策分支等复杂操作。
从NVIDIA披露的信息看,AgentPerf核心评估维度是能效(Agents per Megawatt,每兆瓦处理代理数量)和吞吐量,这直接关联到大规模部署的运营成本。
解决什么问题
代理AI工作负载的崛起暴露了现有基准的盲区。传统基准模拟的是"一次调用"场景,而真实代理应用需要反复调用模型、做决策、调用外部工具、维持状态——这种"多步骤编排"(Multi-step Orchestration)对底层基础设施提出了截然不同的要求:内存带宽、NVLink互联带宽、多实例调度效率等成为关键瓶颈。
AgentPerf的价值在于为这个新兴但快速增长的工作负载类型提供统一的量化语言,让基础设施采购和架构选型有据可依。
对比同类竞品
目前市场上缺乏专门的代理AI基准,竞品对比需从两个层面看:
- MLPerf I
● 未登录访客SMARTFLOW PRO
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- NVIDIA官方公告 · 2026-06-12
- MLPerf Inference基准官网 · 2026-01-01