NVIDIA:Blackwell Ultra GB300 长上下文推理性能大幅领先 GB200
LMSYS 最新基准测试显示,NVIDIA Blackwell Ultra GB300 在长上下文开源推理中延迟降低 1.5 倍、用户吞吐量提升 1.87 倍,由 NVIDIA Dynamo 编排调度。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
LMSYS 最新基准测试显示,NVIDIA Blackwell Ultra GB300 在长上下文开源推理中延迟降低 1.5 倍、用户吞吐量提升 1.87 倍,由 NVIDIA Dynamo 编排调度。
查看原文