← 返回资讯
研究 @Alibaba_Qwen 2026-02-25

通义千问:Qwen3.5 系列支持 4-bit 量化近乎无损,最长支持百万级上下文

Qwen3.5 在 4-bit 权重和 KV cache 量化下保持近无损精度。27B 支持 80 万上下文,35B MoE 在 32GB 消费级显卡上支持百万级上下文,122B MoE 在 80GB 显卡支持百万+上下文。同时开源 35B-A3B-Base。

查看原文
AI 资讯解读
本解读由 AI 自动生成,仅供参考。请以原文为准。