Kimi K2.5 进入 Cursor：中国开源模型成为硅谷编程工具基座的完整故事

核心事件：2026 年 3 月 19 日，Cursor 发布 Composer 2 编程模型，声称为"自研"成果。不到 24 小时，开发者在 API 流量中发现模型 ID 为 kimi-k2p5-rl-0317-s515-fast，直接揭露其基于月之暗面 Kimi K2.5 微调而来。这是中国开源大模型首次被确认为硅谷头部编程工具的基座模型。

这一事件的意义远超一次产品发布。它同时验证了三件事：中国开源模型的编程能力已达到商用水准；开源许可证的商业合规机制正在被严肃考验；AI 编程工具赛道的竞争已从"谁的模型更强"转向"谁的成本更低"。^[1]

Cursor 背后的 Anysphere 公司估值正在冲击 500 亿美元，年化收入突破 20 亿美元。^[2] 而为其提供基座的月之暗面估值 180 亿美元。^[3] 一个 500 亿美元估值的硅谷公司，核心模型来自一个 180 亿美元估值的北京公司——这本身就是一个值得深入拆解的商业故事。

§1

事件始末：从发布到曝光的 24 小时

一个模型 ID 引发的连锁反应

完整时间线

2026-02-09

用户报告 Kimi K2.5 从 Cursor 模型列表中消失^[4]

2026-03-19

Cursor 发布 Composer 2，博客文章称其通过"持续预训练 + 强化学习"实现，未提及任何基座模型来源^[5]

2026-03-20

开发者 Fynn 在调试 API 流量时截获模型 ID：kimi-k2p5-rl-0317-s515-fast，明确指向 Kimi K2.5 + RL 微调^[1]

同日

月之暗面预训练负责人 Yulun Du 确认 Composer 2 的分词器与 Kimi 分词器"完全一致"，质疑 Cursor 许可证合规^[6]

同日晚间

Cursor 员工 Lee Robinson 经历四条推文逐步承认，从"评估了多个基座"升级到"Kimi K2.5 是我们的起点"^[1]

同日

月之暗面官方声明澄清：Cursor 通过 Fireworks AI 的托管平台以"授权商业合作方式"使用 K2.5^[7]

2026-03-21

Cursor 联合创始人 Aman Sanger 公开致歉："从一开始就没有在博客中提到 Kimi 基座是我们的疏忽"^[1]

"It was a miss to not mention the Kimi base in our blog from the start. We'll fix that for the next model." — Aman Sanger, Cursor 联合创始人^[1]

值得注意的是，这并非 Cursor 首次被发现使用中国模型。此前 Composer 1 就曾被开发者发现代码中包含中文注释和中文推理轨迹，暗示基座模型本身具有中文训练背景。^[8] Cursor 研究员 Sasha Rush 在被直接询问"Composer 是否基于某个开源模型微调"时，选择了回避正面回答，仅表示"主要工作在 RL 后训练"。^[8]

关键发现：Cursor 员工 Lee Robinson 披露了一个重要技术细节——"大约四分之一的预训练来自基座模型（Kimi K2.5），其余由 Cursor 通过微调和持续训练完成。"^[1] 这意味着 K2.5 不仅是起点，更是 Composer 2 知识体系的基础构成部分。

§2

技术分析：Kimi K2.5 的编程实力

1.04T 参数 MoE 架构 + 原生多模态 + Agent Swarm

K2.5 核心架构

模型全称	Kimi K2.5（Moonshot AI / 月之暗面）
架构	Mixture-of-Experts (MoE)，61 层（1 层 Dense + 60 层 MoE）
总参数量	1.04 万亿（1.04T）
激活参数	32B（每次推理仅激活 3.2% 参数）
专家数量	384 个专家，每 Token 激活 Top-8 + 1 共享专家
注意力机制	MLA（Multi-head Latent Attention，源自 DeepSeek-V2）
训练数据	约 15T 混合视觉与文本 Token
上下文窗口	256K Token
开源许可	Modified MIT License（有商业使用门槛条件）
发布日期	2026 年 1 月 26 日

Kimi K2.5 是在 Kimi-K2-Base 基础上，通过约 15 万亿混合视觉与文本 Token 进行持续预训练得到的原生多模态模型。^[9] 与大多数"先训文本、后接视觉"的拼接方案不同，K2.5 在预训练阶段就整合了视觉与语言能力，实现文本与视觉模态的联合优化。

Composer 2 的技术管线

🤖

Kimi K2.5

1.04T MoE 基座

→

🔧持续预训练
约占 75% 训练量

→

🎯强化学习
长程编程任务

→

💻

Composer 2

via Fireworks AI

Cursor 在 K2.5 基础上执行了大规模持续预训练，专注于代码数据。据报道使用了"4 倍算力规模"的强化学习训练，并开发了 compaction-in-the-loop 机制——将上下文遗忘率降低 50%，智元效率提升 5 倍。^[7] 最终模型通过 Fireworks AI 进行推理服务。

K2.5 独有技术亮点

🧠 Agent Swarm 集群

K2.5 能自主生成最多 100 个子 Agent，执行最多 1,500 步协调操作，实现 4.5 倍加速。通过 PARL（并行智能体强化学习）训练 Orchestrator 分解并行子任务。^[9]

👁 视觉编程能力

上传界面录屏或截图，K2.5 可自动拆解交互逻辑并生成可运行的前端代码，完整复现动态布局、滚动触发等复杂效果。^[10]

📈 MLA 注意力机制

采用来自 DeepSeek-V2 的 Multi-head Latent Attention，专门解决长文本场景下 KV Cache 显存问题，支撑 256K 上下文窗口。^[10]

§3

性能对比：Composer 2 vs 竞品

CursorBench / Terminal-Bench / SWE-bench 三维评测

编程 Benchmark 对比

模型	CursorBench	Terminal-Bench 2.0	SWE-bench Multilingual
GPT-5.4 Thinking	63.9	75.1	--
Composer 2 (K2.5 base)	61.3	61.7	73.7
Claude Opus 4.6	58.2	58.0	77.8
Composer 1.5	44.2	47.9	65.9
Composer 1	38.0	40.0	56.9

Composer 2 在 CursorBench 上得分 61.3，超越 Claude Opus 4.6 的 58.2（高出 5.3%），但仍落后于 GPT-5.4 Thinking 的 63.9。^[5] 在 Terminal-Bench 2.0 上，Composer 2 同样领先 Opus 4.6（61.7 vs 58.0），但与 GPT-5.4 的 75.1 差距明显。^[11]

从代际进步看，Composer 2 较 Composer 1.5 在 CursorBench 上提升了 17.1 分（+38.7%），在 SWE-bench 上提升近 8 分（+11.8%）——这是 Cursor 迄今最大的单代性能跃升。^[5]

Kimi K2.5 基座模型自身表现

Benchmark	K2.5 得分	对标竞品
SWE-Bench Verified	76.8%	--
LiveCodeBench v6	85.0%	Claude Opus 4.5: 64.0%
HLE-Full (w/ tools)	50.2%	GPT-5.2: 45.5%
AIME 2025	96.1%	--
MMMU-Pro	78.5%	--
BrowseComp (Agent Swarm)	78.4%	--

K2.5 基座模型自身在 LiveCodeBench v6 上达到 85.0%，大幅领先 Claude Opus 4.5 的 64.0%。在 Humanity's Last Exam（HLE）上得 50.2%，超越 GPT-5.2 的 45.5%。^[9] 这些数据解释了 Cursor 选择 K2.5 作为基座的原因——在编程与推理能力上，K2.5 在开源模型中处于领先位置。

+17.1

CursorBench 代际提升

+5.3%

超越 Claude Opus 4.6

85.0%

K2.5 LiveCodeBench

-4.0%

落后 GPT-5.4 Thinking

§4

定价分析：成本优势的背后

价格低 90%，性能可比，成本结构彻底改变

模型	输入价格 ($/M tokens)	输出价格 ($/M tokens)	综合成本指数
Claude Opus 4.6	$5.00	$25.00	100%（基准）
GPT-5.4	$2.50	$15.00	58%
Composer 2 Fast	$1.50	$7.50	30%
Composer 2 Standard	$0.50	$2.50	10%
Kimi K2.5 (OpenRouter)	$0.45	$2.20	9%
Composer 1.5 (旧版)	$3.50	$17.50	73%

Composer 2 Standard 版定价 $0.50/$2.50（输入/输出），比 Claude Opus 4.6 低约 90%，比 Composer 1.5 低 86%。^[11] 即便是 Composer 2 Fast 版（$1.50/$7.50），成本也仅为 Claude Opus 4.6 的 30%。

      性价比拐点：Composer 2 Standard 在 CursorBench 上超越 Claude Opus 4.6（61.3 vs 58.2），价格却只有后者的十分之一。这意味着 AI 编程工具的成本结构出现了根本性变化——同等质量的代码生成，成本降了一个数量级。对于大量使用 AI 辅助编程的团队，这可能意味着月度支出从数千美元降至数百美元。
    

这一定价策略的基础是 Kimi K2.5 的开源特性。Kimi K2.5 在 OpenRouter 上的直接调用价格仅 $0.45/$2.20，甚至低于 Composer 2 Standard。^[12] Cursor 在 K2.5 基础上增加了大量工程价值（持续预训练、RL 优化、IDE 集成），其定价仍然能控制在极低水平，根本原因在于基座模型的获取成本趋近于零。

登录后阅读完整报告

包含详细分析、数据图表、竞品对比、参考文献等

Google 登录

或