← 返回资讯
大模型 @vllm_project 2026-04-04

vLLM 发布 v0.19.0:支持 Gemma 4、零气泡异步调度、NVIDIA B300 适配

vLLM v0.19.0 发布,含 197 位贡献者的 448 次提交。亮点包括 Gemma 4 支持、零气泡异步调度+投机解码、Model Runner V2 成熟化、ViT 全 CUDA 图、通用 CPU KV 缓存卸载及 NVIDIA B300/GB300 支持。

查看原文
AI 资讯解读
本解读由 AI 自动生成,仅供参考。请以原文为准。