DeepSeek API 输入缓存命中价格直降至 1/10
DeepSeek 宣布全系 API 的输入缓存命中价格立即下调到原价 1/10;同时 DeepSeek-V4-Pro 75% 折扣促销活动延续至 5 月 5 日。
查看原文核心要点
2026 年 4 月 26 日,DeepSeek 官方 X(@deepseek_ai)宣布:全系列 API 输入缓存命中价格立即下调至原价的 1/10(永久"1 折",非限时活动)。同时,DeepSeek-V4-Pro 75% 限时折扣促销延续至 2026-05-05 23:59 北京时间。两个动作叠加,V4-Pro 缓存命中场景实付仅 ¥0.025/百万 tokens,创下"全球大模型 API 价格新低"。
新价格表(验证自 api-docs.deepseek.com 官方页)
DeepSeek-V4-Pro(限时 75% 折扣,截止 2026-05-05)
- 缓存命中输入:¥0.025 / $0.003625 每 1M tokens(原价 ¥1,调价后 ¥0.1,再 75% 折后实付)
- 缓存未命中输入:¥3 / $0.435 每 1M tokens(原价 ¥12 / $1.74)
- 输出:¥6 / $0.87 每 1M tokens(原价 ¥24 / $3.48)
DeepSeek-V4-Flash(无额外折扣,缓存价直接永久 1 折)
- 缓存命中输入:¥0.02 / $0.0028 每 1M tokens(原价 ¥0.2,永久降至 1/10)
- 缓存未命中输入:¥1 / $0.14 每 1M tokens(原价 ¥4)
- 输出:¥2 / $0.28 每 1M tokens(原价 ¥8)
限时折扣截止:2026-05-05 23:59 北京时间 / 15:59 UTC。折扣到期后 V4-Pro 输出回到 ¥24/$3.48 — 仍只是 Claude Opus 4.6 输出价 $25 的约 1/7。
这次降价的两个层次
这次调价不是简单"促销",是结构性的两层降价,理解节奏很关键:
- 第一层(永久):缓存命中价格全部降至原价 1/10。这一层不是限时——5 月 5 日折扣结束后,V4-Pro 缓存命中仍是 ¥0.1,是过去 ¥1 的 10 分之一。这是"永久价格基准重置"。
- 第二层(限时):V4-Pro 整体 75% 折扣(2.5 折)。4 月 24 日开放并入这次活动,5 月 5 日结束。这一层是"促销叠加",跟"缓存 1 折"是两回事。
叠加效应:4-26 至 5-5 这 9 天,V4-Pro 缓存命中真实付费 = ¥0.025/M(永久 1 折 × 限时 25%)。这才是 DeepSeek 官方推文里"创全球大模型 API 价格新低"的具体数字依据。
缓存命中价格降到 1 折的产品策略意义
1. 鼓励用户用 system prompt + 长 context。缓存命中价格越便宜,开发者越愿意把大段上下文(system prompt / RAG 知识库 / few-shot 示例 / 用户历史记忆)塞进每次请求——而 DeepSeek-V4 的强项之一正是 1M 长上下文 + 高质量长文本理解。价格信号在引导用户充分用满模型能力。
2. 把"高频用户"的边际成本压到接近零。Agent 类应用(Cursor / Cline / OpenClaw / Cluely 等)每天对同一个用户的同一个 codebase 反复调用,缓存命中率天然高(命中率常 >70-85%)。这次调价对 Agent 应用是实质性的成本结构改写——之前算 $5/天/活跃开发者的 token 成本,现在可能跌到 $0.5/天。
3. 反竞争 + 反差化策略。Anthropic 没有可比的"缓存定价"产品(Claude prompt caching 是 90% 折扣但绝对价格仍贵),OpenAI 缓存命中是 50% 折扣 + 比 GPT-5.5 主价高得多。DeepSeek 把缓存价压到原价 1/10,等于对所有头部美国厂商在缓存场景上做"价格碾压"。
对竞品的实际压力
- Claude Opus 4.6:输出 $25/M。V4-Pro 折后 $0.87 = Opus 的 1/28;折后 $3.48 = Opus 的 1/7(即使到 5/5 后恢复原价仍碾压)
- GPT-5.5:输出公开定价较高(具体看 API tier)。V4-Pro 限时折后约 GPT-5.5 输出价的 1/10 量级
- Kimi K2.6:1T MoE 输出,月付 token plan + API 双轨。具体 API 价对比需逐项核对
- 开源模型自托管:V4 是 1.6T MoE,自托管至少 8× H200 节点,每月运维成本 $30K+。如果你的 token 量月用 < 30M,用 DeepSeek API 比自托管便宜得多,且免运维 / 模型更新自动同步——这次降价直接削弱了"开源自托管"对中小团队的吸引力
背景:4 月 24-26 三天 DeepSeek 三个动作
- 04-24 GA:V4 Preview 发布、1.6T MoE 全开源 MIT、华为昇腾 SuperNode 推理侧零日适配、限时 75% 折扣开始
- 04-25-26 调价:缓存命中价永久降至 1/10(即本条新闻)
- 同期:在 OpenRouter 等聚合平台上 V4-Pro 流量短期内激增
这是 DeepSeek 标志性的"开源 + 极低价 + 紧密节奏"打法在 2026 年的最强一次组合拳。对手的反应窗口只有 5 月 5 日折扣到期前的 9 天——9 天内若无降价响应,DeepSeek 会拿走这一轮 Agent 应用 + 长上下文 RAG 应用的存量。
值得关注
- 5 月 5 日折扣到期后是否会续:Anthropic / OpenAI / Kimi 是否会跟降?如果跟降,DeepSeek 大概率会再续一轮折扣稳定先发优势
- 缓存命中率统计公开化:DeepSeek 是否会公开各 API 路径的平均缓存命中率?这是开发者真实成本测算的关键数据
- 对 Cursor / Cline / OpenClaw 等 Agent 类客户的迁移诱惑:这些产品的底层模型选择会不会重新洗牌?尤其是"Cursor 在 2025 年下半年大量切到 Anthropic Claude"的趋势是否会被反转
- 对国产开源生态的影响:Kimi K2.6 / Qwen3 / GLM-5 的 API 价是否被迫下调?开源模型自托管玩家(潞晨 / 硅基流动等推理服务商)在新价格下的商业模型怎么调整
- DeepSeek 是否在准备 V4 正式版(非 Preview):限时折扣 + 缓存大降价的组合常常是新版本上线前的"清库存"信号——5 月中下旬是否会发 V4 GA / V4.5?
原文来源:@deepseek_ai 官方推文 2026-04-26 · DeepSeek API 官方定价页
背景报道:新浪科技:1 天时间 DeepSeek API 输入缓存又降价 1/10 · IT 之家:降至原有价格 1/10,DeepSeek API 输入缓存降价 · 知乎:如何评价 V4-Pro 限时 2.5 折 + 缓存永久大降价