产品解读

DeepSeek V4 — 1.6T 参数 MoE 全开源 · 首个脱离 CUDA 的前沿大模型

V4-Pro 1.6T/49B active + V4-Flash 284B/13B 同日开源 MIT 协议 · 华为昇腾 950PR 首发脱离 CUDA · 1M 上下文 + 384K 输出

2026-04-25 10 篇信源 读完约 14 分钟

DeepSeek V4 — 1.6T 参数 MoE 全开源 · 首个脱离 CUDA 的前沿大模型

V4-Pro 与 V4-Flash 同日全开源。Pro 版 1.6T MoE / 49B 激活,Flash 版 284B / 13B 激活。

一句话定位

不只是又一个开源模型,而是首发即跑在华为昇腾上的前沿大模型。

2026 年 4 月 24 日,DeepSeek 同时开源 V4-Pro(1.6T/49B active)与 V4-Flash(284B/13B active)两个版本,MIT 协议,HuggingFace 全系开放[1][2]。Bloomberg 称其为"最具野心的新旗舰"[5]。梁文锋与幻方量化出品,深度学习核心团队研发。

3206
Codeforces Rating · 开源最高
93.5%
LiveCodeBench 代码生成
80.6%
SWE Verified · 官方自测
$200亿
目标估值(融资洽谈中)

Spec Sheet

一图看懂 · 模型规格表。

维度DeepSeek V4-Pro / V4-Flash
开 / 闭源全开源 · MIT 协议 · HuggingFace + GitHub 同步发布 · 商用零门槛
模型尺寸(V4-Pro)1.6T 总参 / 49B 激活 · MoE · >32T tokens 预训练
模型尺寸(V4-Flash)284B 总参 / 13B 激活 · MoE · 同样 >32T tokens 预训练
上下文窗口1M tokens 原生 · 不分档定价
最大输出384K tokens · 业界最长之一(适合长篇生成 / Agent 长链)
多模态能力纯文本(V4 系列定位推理 + 编码,多模态待 V4-VL 单独发布)
精度FP4 + FP8 混合(推理部署省一半显存)
输入价格(Pro · 缓存命中)¥1 / $0.145 per 1M tokens
输入价格(Pro · 未命中)¥12 / $1.74 per 1M tokens
输出价格(Pro)¥24 / $3.48 per 1M tokens · 仅 Claude Opus 4.6 的 ~1/7
输出价格(Flash)¥2 / $0.28 per 1M tokens · 跨阶低价
夜间折扣北京时间 23:00–07:00 全档半价(批处理友好)
SWE Verified(自测)80.6% · 与 Claude Opus 4.7 独测 87.6% 差距,待第三方复现
SWE Pro55.4% · 工程级修复
Codeforces Rating3206 · 当前开源最高
LiveCodeBench93.5% · 顶级动态代码评测
MMLU / MMLU-Pro90.1 / 73.5
GPQA Diamond90.1 · 研究生级科学推理
MRCR 1M(长上下文召回)83.5 · 在 1M 长度下保持高召回(vs Claude 4.7 的 32.2 大幅领先)
Anthropic API 兼容原生支持 · Claude Code 用户两行 env 即可切换
硬件首发华为昇腾 950PR + 950DT(首个脱离 CUDA 的前沿大模型)· 同步兼容 NVIDIA
HuggingFacedeepseek-ai/DeepSeek-V4-Pro · V4-Flash
API 端点api.deepseek.com(OpenAI 兼容) · api.deepseek.com/anthropic(Anthropic 兼容)
旧 API 停用日2026-07-24 · deepseek-chat / deepseek-reasoner 退役,需迁 V4
发布日期2026-04-24 · 与腾讯 Hy3 preview 同日发布
融资进展首次启动对外融资 · 目标估值 200 亿美元 · 腾讯阿里参与谈判
V4 选了「全开源 + 跨硬件 + 极致低价」三件套。MIT 协议、HuggingFace 全系开放、昇腾 + NVIDIA 双跑、API 输出价仅 Claude Opus 4.6 的 1/7——这是过去三年最具商业化威胁性的开源动作。

Two SKUs