vLLM:3 月 12 日维也纳技术聚会,聚焦量化与推测解码
vLLM 将于 3 月 12 日在维也纳举办线下聚会,议题涵盖量化、推测解码、MoE 通信优化,以及基于 NVIDIA Dynamo + llm-d 的推理扩展方案。
查看原文AI 资讯解读
本解读由 AI 自动生成,仅供参考。请以原文为准。
vLLM 将于 3 月 12 日在维也纳举办线下聚会,议题涵盖量化、推测解码、MoE 通信优化,以及基于 NVIDIA Dynamo + llm-d 的推理扩展方案。
查看原文