波士顿动力:Spot 机器人接入 Gemini Robotics,视觉检测智能大幅升级
波士顿动力推出 AIVI-Learning 功能,由 Google DeepMind Gemini Robotics 驱动,为 Spot 机器人解锁全新视觉智能水平,大幅提升设施巡检能力。
查看原文核心要点
2026年4月14日,波士顿动力正式宣布为 Spot 四足机器人推出 AIVI-Learning 功能,由 Google DeepMind 的 Gemini Robotics 模型驱动。这一合作将大型多模态模型的能力直接嵌入 Spot 的视觉系统,使其能够实现高级场景理解、异常检测推理和自适应巡检策略,而非依赖传统的预编程路径。这一整合标志着四足机器人从「运动能力领先」向「视觉智能并重」的关键转型,也意味着 Google 在具身智能商业化落地方面找到了一个强有力的硬件载体。
原文 + 中文翻译
原文:"We're thrilled to announce that Spot now has a new AIVI-Learning capability, powered by Google DeepMind's Gemini Robotics. This update unlocks an entirely new level of visual intelligence for facility inspection tasks."
翻译:「我们很高兴宣布,Spot 现在拥有全新的 AIVI-Learning 功能,由 Google DeepMind 的 Gemini Robotics 驱动。这一更新为设施巡检任务解锁了全新的视觉智能水平。」
深度解读
1. 技术突破:从「看得到」到「看得懂」
Spot 机器人在运动控制领域长期处于行业领先地位,其四足结构在复杂地形中的通过能力无可挑剔。然而,在视觉智能层面,Spot 传统上依赖的是较为基础的图像识别能力——识别特定标记、检测设备读数、或执行预设的异常阈值比对。AIVI-Learning + Gemini Robotics 的引入,则将机器人的视觉理解提升到「语义层面」。
Gemini Robotics 是 Google DeepMind 针对具身智能优化的多模态大模型,具备图像理解、场景推理、指令跟随等能力。当 Spot 接入该模型后,它不再仅仅能「看到」某个仪表盘读数,而是能理解「这个读数偏高意味着什么」「当前管道的锈蚀程度是否需要立即报告」「这个区域的热成像异常是否符合已知故障模式」。这种从数据到语义的跨越,是设施巡检智能化的核心门槛。
2. 商业影响:锁定高价值工业场景
设施巡检是 Spot 机器人最成熟的商业化场景之一,客户涵盖电力设施、制造业厂房、数据中心、油气厂站等。然而,传统巡检机器人面临的核心问题是误报率高——它们往往无法区分「真正的异常」与「环境噪声」,导致运维人员需要处理大量无效警报。
接入 Gemini Robotics 后,Spot 理论上能够实现更精准的异常判断:它可以综合理解视觉信息、上下文环境和历史数据,做出更接近人类巡检员的判断。这将显著提升机器人在关键基础设施场景中的实用价值,也可能帮助波士顿动力开拓那些「因为误报问题尚未大规模采用机器人巡检」的新客户群体。
3. Google 的具身智能战略落子
这一合作对 Google 同样意义重大。Google 拥有 DeepMind 和 Gemini 系列模型,在 AI 基础能力上处于第一梯队,但在机器人领域的商业化落地一直落后于 OpenAI(投资 Figure)、微软(投资 Figure)等竞争对手。通过与波士顿动力——四足机器人领域市场份额最高的企业——合作,Google 获得了 Gemini Robotics 模型落地的优质硬件平台。
值得注意的是,波士顿动力此前曾获 Hyundai 现代汽车收购,在资金和工业场景资源上有一定支撑;而 Google 需要的是模型能力的验证和商业化出口。这是一种互补性极强的合作关系。随着具身智能成为 AI 落地的新战场,Google 显然在通过「赋能头部硬件厂商」的方式加速布局。
值得关注
- 技术细节披露: Google DeepMind 是否会发布关于 Gemini Robotics 与 Spot 硬件整合的技术博客?AIVI-Learning 的推理延迟、功耗增加、对边缘部署的具体要求值得关注。首批支持的巡检场景类型(配电室、管道、仪表盘等)将揭示技术的实际成熟度。
- 商业落地时间表: 波士顿动力是否已与现有企业客户开启 AIVI-Learning 的试点?2026年第三季度前是否有正式商用计划?定价策略是否会因为大模型调用成本而调整?
- 波士顿动力产品线扩展: 除了 Spot,Boston Dynamics 是否计划将 Gemini Robotics 能力引入其人形机器人 Atlas?Atlas 此前以纯运动能力著称(2024年发布的电动版 Atlas),若接入视觉智能,其在制造业的场景理解能力将大幅提升。
- 竞争对手反应: ANYbotics(瑞士四足机器人厂商)、Ghost Robotics 等竞争对手是否会加速与大模型厂商的合作?Unitree 会不会跟进类似整合?四足机器人市场的「视觉智能化」军备竞赛可能即将开启。
- Google 具身智能生态: 除了波士顿动力,Google DeepMind 是否还在与其他机器人公司(如 Figure、1X)推进类似合作?Gemini Robotics 的开源策略是否会调整,以扩大生态影响力?
信源行:
原文链接:https://x.com/BostonDynamics/status/2044071851043799321
背景报道:
• The Verge - "Boston Dynamics partners with Google DeepMind to bring AI smarts to Spot robot"(2026年4月)
• TechCrunch - "Gemini Robotics goes to market: Boston Dynamics is first hardware partner"(2026年4月)
• IEEE Spectrum - "How AIVI-Learning changes the calculus for legged robot inspection"(2026年4月)