大模型 @vllm_project 2026-07-02

vLLM：一个月把 DeepSeek V4 的 token 成本降到 1/5

vLLM 社区通过 day-zero 适配 + 对 kernel/调度/serving 的持续优化，一个月内将 DeepSeek V4 推理的 token 成本降低 5 倍，展示开源社区的迭代速度。

解读生成中或暂时不可用，请稍后刷新重试，或直接查看原文。