DeepSeek V4 — 1.6T 参数 MoE 全开源 · 首个脱离 CUDA 的前沿大模型

一句话定位
不只是又一个开源模型,而是首发即跑在华为昇腾上的前沿大模型。
2026 年 4 月 24 日,DeepSeek 同时开源 V4-Pro(1.6T/49B active)与 V4-Flash(284B/13B active)两个版本,MIT 协议,HuggingFace 全系开放[1][2]。Bloomberg 称其为"最具野心的新旗舰"[5]。梁文锋与幻方量化出品,深度学习核心团队研发。
3206
Codeforces Rating · 开源最高
93.5%
LiveCodeBench 代码生成
80.6%
SWE Verified · 官方自测
$200亿
目标估值(融资洽谈中)
Spec Sheet
一图看懂 · 模型规格表。
| 维度 | DeepSeek V4-Pro / V4-Flash |
|---|---|
| 开 / 闭源 | 全开源 · MIT 协议 · HuggingFace + GitHub 同步发布 · 商用零门槛 |
| 模型尺寸(V4-Pro) | 1.6T 总参 / 49B 激活 · MoE · >32T tokens 预训练 |
| 模型尺寸(V4-Flash) | 284B 总参 / 13B 激活 · MoE · 同样 >32T tokens 预训练 |
| 上下文窗口 | 1M tokens 原生 · 不分档定价 |
| 最大输出 | 384K tokens · 业界最长之一(适合长篇生成 / Agent 长链) |
| 多模态能力 | 纯文本(V4 系列定位推理 + 编码,多模态待 V4-VL 单独发布) |
| 精度 | FP4 + FP8 混合(推理部署省一半显存) |
| 输入价格(Pro · 缓存命中) | ¥1 / $0.145 per 1M tokens |
| 输入价格(Pro · 未命中) | ¥12 / $1.74 per 1M tokens |
| 输出价格(Pro) | ¥24 / $3.48 per 1M tokens · 仅 Claude Opus 4.6 的 ~1/7 |
| 输出价格(Flash) | ¥2 / $0.28 per 1M tokens · 跨阶低价 |
| 夜间折扣 | 北京时间 23:00–07:00 全档半价(批处理友好) |
| SWE Verified(自测) | 80.6% · 与 Claude Opus 4.7 独测 87.6% 差距,待第三方复现 |
| SWE Pro | 55.4% · 工程级修复 |
| Codeforces Rating | 3206 · 当前开源最高 |
| LiveCodeBench | 93.5% · 顶级动态代码评测 |
| MMLU / MMLU-Pro | 90.1 / 73.5 |
| GPQA Diamond | 90.1 · 研究生级科学推理 |
| MRCR 1M(长上下文召回) | 83.5 · 在 1M 长度下保持高召回(vs Claude 4.7 的 32.2 大幅领先) |
| Anthropic API 兼容 | 原生支持 · Claude Code 用户两行 env 即可切换 |
| 硬件首发 | 华为昇腾 950PR + 950DT(首个脱离 CUDA 的前沿大模型)· 同步兼容 NVIDIA |
| HuggingFace | deepseek-ai/DeepSeek-V4-Pro · V4-Flash |
| API 端点 | api.deepseek.com(OpenAI 兼容) · api.deepseek.com/anthropic(Anthropic 兼容) |
| 旧 API 停用日 | 2026-07-24 · deepseek-chat / deepseek-reasoner 退役,需迁 V4 |
| 发布日期 | 2026-04-24 · 与腾讯 Hy3 preview 同日发布 |
| 融资进展 | 首次启动对外融资 · 目标估值 200 亿美元 · 腾讯阿里参与谈判 |
Two SKUs