← 返回资讯
观点 @vllm_project 2026-06-12

vLLM现已支持Kimi K2.7-Code部署

1T参数MoE架构、32B活跃参数、256K上下文窗口,推理token减少约30%;复用K2.6部署配置即可。

查看原文
TL;DR · 观点解读

vLLM官方宣布支持Kimi K2.7-Code部署,是开源推理框架对国产MoE模型技术实力的"用脚投票",同时暗示Kimi在开源生态中获得了与Llama、Mistral同等的战略地位。

深度解读

说话人的历史立场与利益关联

vLLM项目长期坚持模型无关(model-agnostic)的开源立场——他们不做模型训练,只做推理引擎优化。这种定位决定了vLLM的"观点"表达方式:通过正式支持某个模型来传递技术认可,而非发表言论。

从历史来看,vLLM的支持列表基本等同于"开源模型圈的能力排行榜"。他们率先支持Llama 3、Mixtral、Qwen2,再到现在的K2.7-Code,每一步都伴随着模型本身的爆火周期。换言之,vLLM的支持本身就是一个免费的市场背书

对于Kimi/Moonshot AI而言,选择被vLLM官方支持,意味着从"月之暗面的封闭生态"向"可被企业自托管的开源选项"迈进了一步。这对B端用户极具吸引力——他们可以在自己的GPU集群上跑K2.7-Code,而不必依赖API调用。

技术参数透露的信号

K2.7-Code的核心规格:1T总参、32B活跃参数、256K上下文。这组数字说明:

参考来源
  1. vLLM官方宣布支持Kimi K2.7-Code · 2026-06-12
  2. Kimi K2.7技术规格(MoE架构、256K上下文) · 2026-06-10
本解读由 AI 自动生成 · 模板:观点解读 · 仅供参考,请以原文为准。