← 返回资讯
芯片 @nvidia 2026-04-03

NVIDIA:黄仁勋称 NVIDIA 每 Token 成本全球最低

NVIDIA CEO 黄仁勋表示其 Token 生成成本全球最低,源于架构卓越和极致协同设计,是衡量 AI 经济效益的关键指标。

查看原文
AI 资讯解读

核心要点

2026年4月3日,NVIDIA 官方账号 @nvidia 发布动态,CEO 黄仁勋公开声称 NVIDIA 生成的每个 Token 成本为全球最低,并将其归因于公司自研架构的卓越性与芯片到系统全链路的极致协同设计(co-design)。这一表态并非单纯的市场宣传,而是直接回应了当前 AI 行业对推理(Inference)规模化经济效益的核心关切——随着大模型从训练阶段进入大规模部署阶段,Token 生成成本(即每次模型响应的计算成本)已成为云服务商、企业客户和投资者评估 AI 商业化可行性的首要指标。

原文 + 中文翻译

原文:"Our cost per token is the lowest in the world. This is because of our architecture — and our extreme co-design from chip to system." — Jensen Huang, NVIDIA

翻译:「我们的每 Token 成本是全球最低的。这得益于我们的架构——以及从芯片到系统层面的极致协同设计。」—— 黄仁勋,NVIDIA

深度解读

一、为什么「每 Token 成本」成为行业核心战场

Token 是大语言模型处理和生成文本的最小单元,每当你向 ChatGPT、Claude 或任何 LLM 发送一条 prompt,模型内部发生的计算量都可以折算为 Token 数量并乘以单 Token 成本。因此,当 OpenAI、Anthropic、Google 等公司将 API 定价压到小数点后四位时,背后本质上是芯片厂商之间每瓦性能(Performance per Watt)和每美元吞吐量(Throughput per Dollar)的竞争。

黄仁勋此番表态直击行业痛点:2024-2025 年间,随着 GPT-4o、Gemini 1.5 Flash、Claude 3.5 Sonnet 等模型相继大幅降价,API 价格战已从「几分钱每千 Token」杀入「厘级」区间。这场价格战的本质,是云厂商将 GPU 利用率的优势转化为更低的终端定价,而 NVIDIA 凭借 H100、H200 到 Blackwell 架构的持续迭代,在推理密度(Inference Density)上保持代际领先,使客户能够用更少的 GPU 承载更多的并发请求。

二、架构卓越与协同设计的护城河

NVIDIA 所言的「架构卓越」,核心指的是从 Volta 到 Hopper 再到 Blackwell 架构中持续增强的张量核心(Tensor Cores)、专用 Transformer 引擎以及 NVLink 高速互联技术。以 Hopper 架构的 H100 为例,其 Transformer Engine 支持 FP8 精度推理,使每块 GPU 的 Token 生成速度较前代 A100 提升约 2-3 倍,而 Blackwell B200 在同等功耗下 further 将这一差距拉开。

更关键的是「协同设计」理念——NVIDIA 不只卖单卡,而是提供从 GPU、DPU、网络交换机(InfiniBand/NVLink Switch)到 DGX 服务器、NIM 微服务(NVIDIA Inference Microservices)再到云端 API 的全栈方案。这种纵向整合意味着,当黄仁勋说「成本最低」时,他指的是客户在 NVIDIA 完整生态下运行模型时的端到端 TCO(Total Cost of Ownership),而非某一环节的孤立指标。这与 AMD MI300X 或英特尔 Gaudi 3 等竞品的单点性能对比,形成了系统性差距。

三、对行业格局与竞争态势的影响

这一声明对当前 AI 芯片竞争格局具有多重含义。首先,对于正在自研芯片的云厂商(Google TPU v5、AWS Trainium、Microsoft Maia)而言,NVIDIA 的成本优势意味着自研芯片的内部替代收益必须首先跨越这道门槛——这也是为什么即便拥有自研能力,Google Cloud 和 AWS 仍在大规模采购 H100/B200。其次,对于 AMD 而言,黄仁勋将「成本最低」定性为架构层面的系统性优势,而非单纯的规模效应,这实际上是在抬高竞争门槛,迫使 AMD 必须展示 MI300X 在特定工作负载下的同等或更优性价比。

最后,这一表态对 NVIDIA 的投资者关系和估值逻辑同样关键。「AI 基础设施成本下降」是整个行业叙事的前提——只有推理足够便宜,AI 应用才能渗透到中小企业和消费者市场,NVIDIA 才能从「卖铲人」进化为「AI 工业革命的能源提供商」。黄仁勋此时重申成本优势,既是防御性公关(回应芯片出口管制对性能的质疑),也是在 AI 股票估值回调背景下的价值重塑。

值得关注

信源行:
• 原文链接:https://x.com/nvidia/status/2040148759410081939
• 背景报道:NVIDIA 官方博客 - Blackwell 架构解析 | Reuters AI 专题 | The Information AI 追踪

本解读由 AI 自动生成,仅供参考。请以原文为准。