深度分析 · AI 编程 · 2026.03

Kimi K2.5 进入 Cursor:
中国开源模型成为硅谷编程工具基座

Cursor Composer 2 发布 24 小时内被发现基于月之暗面 Kimi K2.5 构建。CursorBench 61.3 超越 Claude Opus 4.6,价格低 90%,但许可证争议与地缘政治风险随之浮现。

61.3
CursorBench 得分
-90%
vs Claude Opus 4.6 价格
1.04T
K2.5 总参数量
24h
从发布到真相曝光
核心事件:2026 年 3 月 19 日,Cursor 发布 Composer 2 编程模型,声称为"自研"成果。不到 24 小时,开发者在 API 流量中发现模型 ID 为 kimi-k2p5-rl-0317-s515-fast,直接揭露其基于月之暗面 Kimi K2.5 微调而来。这是中国开源大模型首次被确认为硅谷头部编程工具的基座模型。

这一事件的意义远超一次产品发布。它同时验证了三件事:中国开源模型的编程能力已达到商用水准;开源许可证的商业合规机制正在被严肃考验;AI 编程工具赛道的竞争已从"谁的模型更强"转向"谁的成本更低"。[1]

Cursor 背后的 Anysphere 公司估值正在冲击 500 亿美元,年化收入突破 20 亿美元。[2] 而为其提供基座的月之暗面估值 180 亿美元。[3] 一个 500 亿美元估值的硅谷公司,核心模型来自一个 180 亿美元估值的北京公司——这本身就是一个值得深入拆解的商业故事。

§1

事件始末:从发布到曝光的 24 小时

一个模型 ID 引发的连锁反应

完整时间线

2026-02-09
用户报告 Kimi K2.5 从 Cursor 模型列表中消失[4]
2026-03-19
Cursor 发布 Composer 2,博客文章称其通过"持续预训练 + 强化学习"实现,未提及任何基座模型来源[5]
2026-03-20
开发者 Fynn 在调试 API 流量时截获模型 ID:kimi-k2p5-rl-0317-s515-fast,明确指向 Kimi K2.5 + RL 微调[1]
同日
月之暗面预训练负责人 Yulun Du 确认 Composer 2 的分词器与 Kimi 分词器"完全一致",质疑 Cursor 许可证合规[6]
同日晚间
Cursor 员工 Lee Robinson 经历四条推文逐步承认,从"评估了多个基座"升级到"Kimi K2.5 是我们的起点"[1]
同日
月之暗面官方声明澄清:Cursor 通过 Fireworks AI 的托管平台以"授权商业合作方式"使用 K2.5[7]
2026-03-21
Cursor 联合创始人 Aman Sanger 公开致歉:"从一开始就没有在博客中提到 Kimi 基座是我们的疏忽"[1]
"It was a miss to not mention the Kimi base in our blog from the start. We'll fix that for the next model." — Aman Sanger, Cursor 联合创始人[1]

值得注意的是,这并非 Cursor 首次被发现使用中国模型。此前 Composer 1 就曾被开发者发现代码中包含中文注释和中文推理轨迹,暗示基座模型本身具有中文训练背景。[8] Cursor 研究员 Sasha Rush 在被直接询问"Composer 是否基于某个开源模型微调"时,选择了回避正面回答,仅表示"主要工作在 RL 后训练"。[8]

关键发现:Cursor 员工 Lee Robinson 披露了一个重要技术细节——"大约四分之一的预训练来自基座模型(Kimi K2.5),其余由 Cursor 通过微调和持续训练完成。"[1] 这意味着 K2.5 不仅是起点,更是 Composer 2 知识体系的基础构成部分。
§2

技术分析:Kimi K2.5 的编程实力

1.04T 参数 MoE 架构 + 原生多模态 + Agent Swarm

K2.5 核心架构

模型全称Kimi K2.5(Moonshot AI / 月之暗面)
架构Mixture-of-Experts (MoE),61 层(1 层 Dense + 60 层 MoE)
总参数量1.04 万亿(1.04T)
激活参数32B(每次推理仅激活 3.2% 参数)
专家数量384 个专家,每 Token 激活 Top-8 + 1 共享专家
注意力机制MLA(Multi-head Latent Attention,源自 DeepSeek-V2)
训练数据约 15T 混合视觉与文本 Token
上下文窗口256K Token
开源许可Modified MIT License(有商业使用门槛条件)
发布日期2026 年 1 月 26 日

Kimi K2.5 是在 Kimi-K2-Base 基础上,通过约 15 万亿混合视觉与文本 Token 进行持续预训练得到的原生多模态模型。[9] 与大多数"先训文本、后接视觉"的拼接方案不同,K2.5 在预训练阶段就整合了视觉与语言能力,实现文本与视觉模态的联合优化。

Composer 2 的技术管线

🤖
Kimi K2.5
1.04T MoE 基座
🔧
持续预训练
约占 75% 训练量
🎯
强化学习
长程编程任务
💻
Composer 2
via Fireworks AI

Cursor 在 K2.5 基础上执行了大规模持续预训练,专注于代码数据。据报道使用了"4 倍算力规模"的强化学习训练,并开发了 compaction-in-the-loop 机制——将上下文遗忘率降低 50%,智元效率提升 5 倍。[7] 最终模型通过 Fireworks AI 进行推理服务。

K2.5 独有技术亮点

🧠 Agent Swarm 集群

K2.5 能自主生成最多 100 个子 Agent,执行最多 1,500 步协调操作,实现 4.5 倍加速。通过 PARL(并行智能体强化学习)训练 Orchestrator 分解并行子任务。[9]

👁 视觉编程能力

上传界面录屏或截图,K2.5 可自动拆解交互逻辑并生成可运行的前端代码,完整复现动态布局、滚动触发等复杂效果。[10]

📈 MLA 注意力机制

采用来自 DeepSeek-V2 的 Multi-head Latent Attention,专门解决长文本场景下 KV Cache 显存问题,支撑 256K 上下文窗口。[10]

§3

性能对比:Composer 2 vs 竞品

CursorBench / Terminal-Bench / SWE-bench 三维评测

编程 Benchmark 对比

模型 CursorBench Terminal-Bench 2.0 SWE-bench Multilingual
GPT-5.4 Thinking 63.9 75.1 --
Composer 2 (K2.5 base) 61.3 61.7 73.7
Claude Opus 4.6 58.2 58.0 77.8
Composer 1.5 44.2 47.9 65.9
Composer 1 38.0 40.0 56.9

Composer 2 在 CursorBench 上得分 61.3,超越 Claude Opus 4.6 的 58.2(高出 5.3%),但仍落后于 GPT-5.4 Thinking 的 63.9。[5] 在 Terminal-Bench 2.0 上,Composer 2 同样领先 Opus 4.6(61.7 vs 58.0),但与 GPT-5.4 的 75.1 差距明显。[11]

从代际进步看,Composer 2 较 Composer 1.5 在 CursorBench 上提升了 17.1 分(+38.7%),在 SWE-bench 上提升近 8 分(+11.8%)——这是 Cursor 迄今最大的单代性能跃升。[5]

Kimi K2.5 基座模型自身表现

Benchmark K2.5 得分 对标竞品
SWE-Bench Verified 76.8% --
LiveCodeBench v6 85.0% Claude Opus 4.5: 64.0%
HLE-Full (w/ tools) 50.2% GPT-5.2: 45.5%
AIME 2025 96.1% --
MMMU-Pro 78.5% --
BrowseComp (Agent Swarm) 78.4% --

K2.5 基座模型自身在 LiveCodeBench v6 上达到 85.0%,大幅领先 Claude Opus 4.5 的 64.0%。在 Humanity's Last Exam(HLE)上得 50.2%,超越 GPT-5.2 的 45.5%。[9] 这些数据解释了 Cursor 选择 K2.5 作为基座的原因——在编程与推理能力上,K2.5 在开源模型中处于领先位置。

+17.1
CursorBench 代际提升
+5.3%
超越 Claude Opus 4.6
85.0%
K2.5 LiveCodeBench
-4.0%
落后 GPT-5.4 Thinking
§4

定价分析:成本优势的背后

价格低 90%,性能可比,成本结构彻底改变

模型 输入价格 ($/M tokens) 输出价格 ($/M tokens) 综合成本指数
Claude Opus 4.6 $5.00 $25.00 100%(基准)
GPT-5.4 $2.50 $15.00 58%
Composer 2 Fast $1.50 $7.50 30%
Composer 2 Standard $0.50 $2.50 10%
Kimi K2.5 (OpenRouter) $0.45 $2.20 9%
Composer 1.5 (旧版) $3.50 $17.50 73%

Composer 2 Standard 版定价 $0.50/$2.50(输入/输出),比 Claude Opus 4.6 低约 90%,比 Composer 1.5 低 86%。[11] 即便是 Composer 2 Fast 版($1.50/$7.50),成本也仅为 Claude Opus 4.6 的 30%。

性价比拐点:Composer 2 Standard 在 CursorBench 上超越 Claude Opus 4.6(61.3 vs 58.2),价格却只有后者的十分之一。这意味着 AI 编程工具的成本结构出现了根本性变化——同等质量的代码生成,成本降了一个数量级。对于大量使用 AI 辅助编程的团队,这可能意味着月度支出从数千美元降至数百美元。

这一定价策略的基础是 Kimi K2.5 的开源特性。Kimi K2.5 在 OpenRouter 上的直接调用价格仅 $0.45/$2.20,甚至低于 Composer 2 Standard。[12] Cursor 在 K2.5 基础上增加了大量工程价值(持续预训练、RL 优化、IDE 集成),其定价仍然能控制在极低水平,根本原因在于基座模型的获取成本趋近于零。

登录后阅读完整报告

包含详细分析、数据图表、竞品对比、参考文献等

Google 登录