vLLM 首日支持 GLM-5:稀疏注意力+推测解码+工具调用
vLLM 宣布首日支持智谱 GLM-5(744B 参数/40B 激活),集成 DeepSeek 稀疏注意力、MTP 推测解码和工具调用等功能。
查看原文AI 资讯解读
本解读由 AI 自动生成,仅供参考。请以原文为准。
vLLM 宣布首日支持智谱 GLM-5(744B 参数/40B 激活),集成 DeepSeek 稀疏注意力、MTP 推测解码和工具调用等功能。
查看原文