← 返回资讯
大模型 @vllm_project 2026-04-16

vLLM:Qwen3.6 开源权重发布,v0.19+ 提供 Day-0 支持

vLLM 祝贺阿里发布首个开源权重 Qwen3.6,带来更强 agentic coding 和跨回合保留推理上下文的思考保留选项;架构与 Qwen3.5 相同,vLLM v0.19+ Day-0 支持思考、工具调用、MTP 猜测解码与纯文本模式。

查看原文
AI 资讯解读

核心要点

2026年4月16日,vLLM 项目正式宣布 v0.19 及以上版本对阿里 Qwen3.6 开源权重实现 Day-0 支持。Qwen3.6 作为阿里首个开源权重版本,重点强化了 agentic coding 能力,并新增「思考保留」选项以支持跨推理回合的上下文连续性。架构延续 Qwen3.5,vLLM 可在发布首日即支持其思考模式、工具调用、MTP(Multi-Token Prediction)猜测解码与纯文本模式的全量功能。

原文 + 中文翻译

原文:"Day-0 support for Qwen3.6 open weights on vLLM v0.19+! 🚀 Congrats to Alibaba on their first open-weights Qwen release. 3.6 brings stronger agentic coding & thought preservation across turns, with same architecture as 3.5."

翻译:"vLLM v0.19+ 正式支持 Qwen3.6 开源权重,Day-0 支持!🚀 祝贺阿里发布首个开源权重 Qwen 版本。3.6 带来更强的 agentic coding 能力与跨回合思考保留功能,架构与 3.5 相同。"

深度解读

1. 开源权重策略的战略转折

阿里此次将 Qwen3.6 以开源权重形式发布,而非此前常见的仅 API 开放模式,标志着其开源策略的深层调整。对于企业用户和开发者而言,开源权重意味着可以完全自主部署、 fine-tune 和二次开发,无需依赖阿里云 API 服务,也不存在数据隐私顾虑和用量计费问题。在当前 Meta Llama 系列主导开源生态的格局下,Qwen3.6 开源权重有望吸引一批追求自主可控、注重数据安全的政企客户。

2. Agentic Coding 与思考保留的工程落地

Agentic coding(代理式编程)要求模型不仅生成代码,还要理解任务目标、规划执行步骤、调用工具或 API 并迭代修正。Qwen3.6 在这一维度强化,意味着模型在复杂软件开发场景中的可用性提升。「思考保留」(thought preservation)功能允许推理过程中的中间思考状态在多轮对话间延续,解决了大模型在长程任务中「遗忘」前期推理链路的核心痛点。这对于需要复杂规划、多步骤执行的 Coding Agent 和 Research Agent 场景尤为关键。

3. vLLM Day-0 支持的生态意义

vLLM 以「Day-0 支持」标榜,意味着 Qwen3.6 发布当天即可在 vLLM 框架上完整运行,而非等待社区适配。考虑到 vLLM 是目前最主流的高性能推理框架之一,这一支持极大降低了开发者的接入门槛。vLLM 同时支持 MTP 猜测解码(speculative decoding 的多 token 版本),可进一步提升实际推理吞吐量。在当前各大云厂商、 IDC 运营商纷纷部署 vLLM 的背景下,Qwen3.6 的快速落地将加速其在私有部署场景的渗透。

值得关注

信源行:
原文链接:https://x.com/vllm_project/status/2044787721538060784
背景报道:阿里 Qwen 官方发布页面(ModelScope/HuggingFace);vLLM 官方 GitHub Release v0.19 更新日志;The Decoder、机器之心关于 Qwen3.5 开源生态的分析报道

本解读由 AI 自动生成,仅供参考。请以原文为准。