← 返回资讯
大模型 @Kimi_Moonshot 2026-01-31

Kimi K2.5 登顶 OSWorld 榜首

Kimi K2.5 凭借 Computer Use 能力登顶 OSWorld 排行榜,可构建像人类一样操作电脑界面的智能体

查看原文
深度解读
```json { "template_type": "launch", "tldr": "Kimi(Moonshot AI)发布 K2.5,在 OSWorld 榜单登顶,核心突破是 Computer Use——让模型像人类一样操作电脑界面、完成任务,标志着国产大模型在 AI Agent 操作能力上达到 SOTA,2026 年 AI 落地竞争进入"能动手"阶段。", "analysis_html": "

1 月 31 日,Moonshot AI 旗下 Kimi 系列发布 K2.5 版本,随即以 Computer Use(计算机操作)能力登顶 OSWorld benchmark 榜首。OSWorld 是评估 AI 智能体操作真实计算机环境的权威榜单,涵盖 GUI 操作、文件管理、多步骤任务等场景,含金量较高。

产品是什么?

K2.5 是 Kimi 的新一代旗舰模型,主打「能像人类一样操作电脑界面」的 Agent 能力。它不只做文本理解和生成,而是能理解屏幕 UI、控制鼠标键盘、跨 APP 完成任务(如自动填表、跨窗口操作、数据整理等)。这背后的技术涉及多模态理解 + 动作预测 + 长期任务规划。

解决什么问题?

当前大模型的普遍局限是「能说不能做」——可以聊天、写文章,但无法真正

SMARTFLOW PRO

继续阅读深度解读 + 编辑加注

下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,Pro 会员可见

加入机智流 PRO →

¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道

本解读由 AI 自动生成 · 模板:产品解读 · 仅供参考,请以原文为准。