vLLM:3 月 31 日波士顿 Meetup,联合 Red Hat、IBM、NVIDIA 等探讨大规模推理
vLLM 将于 3 月 31 日在波士顿举办技术聚会,涵盖模型压缩、投机解码、Agent AI 及 llm-d + Kubernetes 分布式推理等议题,Red Hat、IBM、NVIDIA 等联合支持。
查看原文本解读由 AI 自动生成 · 模板:事件解读 · 仅供参考,请以原文为准。
vLLM 将于 3 月 31 日在波士顿举办技术聚会,涵盖模型压缩、投机解码、Agent AI 及 llm-d + Kubernetes 分布式推理等议题,Red Hat、IBM、NVIDIA 等联合支持。
查看原文