产品发布 @Alibaba_Qwen 2026-02-25

通义千问：Qwen3.5-35B-A3B 已上线 LM Studio

Qwen3.5-35B-A3B 模型现已在 LM Studio 上线，用户可直接下载使用该 MoE 模型进行本地推理。

TL;DR · 产品解读

通义千问发布 Qwen3.5-35B-A3B MoE 模型登陆 LM Studio，意味着用户可在消费级硬件上跑 35B 参数级别的模型。3.5B 激活参数的设计让本地部署门槛大幅降低，对个人开发者和边缘场景意义显著。

深度解读

产品是什么

Qwen3.5-35B-A3B 是阿里巴巴通义千问团队发布的下一代 MoE（混合专家）架构模型。其中 35B 表示总参数量，A3B 代表激活参数量为 3.5B。这种架构意味着模型总计有 350 亿参数，但在推理时每次只激活 35 亿参数参与计算，理论上能以接近 3.5B 模型的资源消耗达到接近 35B 模型的能力上限。

此次上线 LM Studio 意味着该模型以 GGUF 量化格式提供，用户无需依赖云端 API，直接在本地 Mac/Windows/Linux 设备上跑推理。LM Studio 提供 GPU 加速支持（CUDA/Metal/Vulkan），用户可以更灵活地控制上下文长度和量化精度。

解决什么问题

传统 dense 模型（如 Qwen2.5-32B）在本地部署时需要 60GB+ 显存，即使量化后也难以在消费级显卡（RTX 3090 24GB、RTX 4070 12GB）上流畅运行。Qwen3.5-35B-A3B 的 MoE 架构通过稀疏激活机制，让激活参数缩减至 3.5B，使得在 16-24GB 显存条件下运行成为可能。

这解决了三大人群的核心痛点：

● 未登录访客

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源，仅 Pro 会员可见
加入机智流 PRO →
¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

已是 Pro 但仍被提示？联系反馈

参考来源

Qwen3.5-35B-A3B 已上线 LM Studio · 2026-02-25
Qwen2.5 技术博客 · 2024-09-19
LM Studio 官方文档 · 2026-01-01

本解读由 AI 自动生成 · 模板：产品解读 · 仅供参考，请以原文为准。