← 返回资讯
机器人 @ycombinator 2026-04-16

YC:Physical Intelligence 打造机器人基础模型

Physical Intelligence 联合创始人 Quan Vuong 做客 Lightcone Podcast,介绍跨本体训练的机器人基础模型,零样本完成过去需数百小时数据才能掌握的任务,被称为机器人领域的 GPT 时刻。

查看原文
AI 资讯解读

核心要点

2026 年 4 月 16 日,Physical Intelligence(PI)联合创始人 Quan Vuong 亮相 YC 旗下 Lightcone Podcast,详述 PI 正在构建的跨本体(cross-embodiment)机器人基础模型——该模型能够零样本(zero-shot)完成过去需数百小时专属数据训练才能掌握的任务。Vuong 将这一进展类比为机器人领域的「GPT 时刻」,暗示通用机器人能力正逼近从专用向通用的临界点。

原文 + 中文翻译

原文:Physical Intelligence co-founder Quan Vuong joins Lightcone Podcast to discuss building robot foundation models that can perform tasks zero-shot — tasks that previously required hundreds of hours of data. "This is the GPT moment for robotics," says Vuong.

翻译:Physical Intelligence 联合创始人 Quan Vuong 做客 Lightcone Podcast,讨论构建机器人基础模型——这些模型能够零样本完成过去需要数百小时数据训练的任务。Vuong 表示:「这(跨本体基础模型)是机器人领域的 GPT 时刻。」

深度解读

1. 跨本体训练:机器人「通用语」的核心突破

Physical Intelligence 的技术路线核心在于「跨本体训练」(cross-embodiment training)。传统机器人训练范式是针对特定机械臂、移动平台或人形机器人分别收集数据、分别微调模型,导致每套硬件都需要从零积累数百小时的行为数据集,泛化能力极弱。PI 的方法则是将不同形态机器人(机械臂、人形双臂、移动底座等)在同一物理世界中采集的轨迹数据混合训练,让模型学习超越具体硬件形态的运动原语(motion primitives)和任务理解。这一思路与大型语言模型(LLM)在海量文本上预训练后再微调的下游范式高度同构——本质上是在为机器人建造一个「世界模型」的通用表征层。

2. 「GPT 时刻」的含义与边界

Vuong 援引「GPT 时刻」的说法,既是叙事策略,也折射出行业对 Scaling Law 能迁移到机器人领域的强烈期待。2022-2023 年 LLM 的爆发已证明:当模型规模、训练数据量和计算量跨越某个阈值后,涌现出此前未编程实现的能力(如推理、多步规划)。机器人领域尚未出现明确阈值,但 PI 发布的 π0 系列模型已展示出跨本体零样本迁移能力——一个在仓库双臂机器人上训练的控制策略,无需任何微调即可迁移到完全不同的移动机械臂平台完成类似操作。若这一能力在更大规模数据和模型上保持可扩展性,「涌现」并非不可预期。但需要注意的是,GPT-3 时代语言模型已具备良好的 scaling 表征,机器人领域的数据多样性(视觉、触觉、力反馈、本体感知)远比文本复杂,「涌现」的阈值可能更高、路径更曲折。

3. YC 生态的信号价值与商业化隐喻

Physical Intelligence 出现在 YC 旗下 Podcast 并不偶然。YC 近期显著增加了对机器人领域的押注,从 Figure AI 到 Physical Intelligence 的投资组合密度可见一斑。选择 Lightcone(YC 自有的深度技术访谈渠道)而非泛科技媒体释放了一个信号:PI 正在向投资人和潜在合作伙伴进行技术定调,而非单纯的市场宣传。对于 PI 而言,「GPT 时刻」叙事有利于在估值谈判中获得更高的市场天花板预期;对于 YC 而言,旗下项目的「标志性叙事」越强,越能强化其在 AI 2.0 时代的影响力。相比 Figure AI 强调「人形机器人硬件」的商业路径,PI 选择了一条更轻资产、更平台化的路线——卖模型/API 给机器人 OEM/集成商,这是一条类似 OpenAI 向应用层输出 LLM 能力的商业模式。

4. 竞争格局:基础设施之争的序幕

机器人基础模型赛道目前已形成三股力量:以 PI 为代表的「通用模型层」路线、以 Figure/波士顿动力为代表的「垂直硬件+模型整合」路线、以及以英伟达 GR00T、Google RT-2/ RT-X 为代表的「算力+中间件平台」路线。PI 的差异化在于不绑定特定硬件厂商,目标是成为机器人领域的「Hugging Face」——一个模型层基础设施。这意味着,未来任何需要物理操作的行业(制造、物流、医疗、家庭)都可能通过调用 PI 的 API 将通用操作能力嵌入其机器人产品,而无需自建数据和训练能力。

值得关注

信源行:
原文链接:https://x.com/ycombinator/status/2044778474066624720
背景报道:
• Physical Intelligence 官方技术博客(pi.com)关于 π0 模型的技术细节披露
• The Robot Report、TechCrunch 对跨本体机器人基础模型赛道的持续追踪报道
• 36氪、机器之心对 Physical Intelligence 中国市场影响力的相关分析

本解读由 AI 自动生成,仅供参考。请以原文为准。