2025-2026 · 人形机器人 / 基础模型 / 核心硬件 / 产业格局
2025年被公认为人形机器人"突破之年",从实验室原型走向规模化工业部署。全球年出货量约 1.3万台,商业化采用加速。Morgan Stanley 预测 2050 年市场规模达 $5万亿。
成本下降:Goldman Sachs 数据显示 2023-2024 年人形机器人制造成本下降 40%,Bank of America 预测物料成本将从 2025 年的 ~$35,000 降至未来十年的 $13,000-$17,000。
| 年份 | 市场规模 | 出货量 | 关键里程碑 |
|---|---|---|---|
| 2024 | $15.5 亿 | ~5,000 台 | 商业化试点启动 |
| 2025 | $18 亿 | 1.3 万台 | 规模化生产元年 |
| 2030 | $40-60 亿 | 13.6 万台 | 工业大规模部署 |
| 2035 | $510 亿 | 260 万台 | 消费市场启动 |
| 2050 | $5 万亿 | - | 全面普及 |
人形机器人正在成为 AI 在物理世界的具象化身,行业领导者如 Tesla、BMW、Mercedes-Benz、Hyundai、小米都在积极投资这一领域。
融资:2025年完成 $10亿 融资 (Series C)
投资方:NVIDIA、Microsoft、OpenAI、Intel、Amazon、Google
产品:Figure 02 已在 BMW 工厂全职运行,Figure 03 于 2025.10 发布
目标:4年内制造 10万台人形机器人
进展:2025年计划部署 5,000 台,Gen 3 手部 22 DoF
技术:复用 FSD 神经网络,支持不平坦地形导航
团队:2025.6 项目负责人更替,Ashok Elluswamy 接任
目标:2025年底-2026初工厂部署
融资:2025年融资超 $10亿($3.5亿 Series A + 后续轮次)
合作:Google、Mercedes-Benz、Jabil 制造
部署:Mercedes-Benz 匈牙利工厂试点
融资:2025.6 完成 $4亿 Series C
投资方:SoftBank、Amazon、Sony、TDK
里程碑:2024.6 首个商业部署 (GXO Spanx 仓库)
产能:俄勒冈工厂年产能 1万台
Atlas 新版:2026 CES 发布产品版,56 DoF,1.9m/90kg,可举 50kg
部署:2026全年订单已满,2028进入 Hyundai 工厂
合作:Google DeepMind 提供基础模型
Spot:已在 40+ 国家部署
定位:家用人形机器人,强调安全柔和交互
规格:160cm/45kg,肌腱驱动,噪音降低 10dB
技术:Redwood AI 多模态导航
目标:2026年年产 10万台
全球占比:Morgan Stanley "Humanoid 100" 榜单中 56% 为中国企业,2022年以来 61% 的机器人发布来自中国。
市场预测:2029年中国人形机器人市场预计达 750亿元,占全球 32.7%。
融资规模:2025年前8个月机器人领域融资 386亿元,为2024全年的 1.8倍。
出货:2025年出货 5,100+ 台,Omdia 全球第一
创始人:彭志辉(稚晖君),前华为"天才少年"
资本:IPO筹备中,已完成对上纬新材的要约收购
CES 2026:美国市场首秀,展示全线产品
融资:C轮后估值 120亿,投资方含中国移动、雷军、腾讯、阿里
业绩:年交付 1,500台人形,营收超 10亿元
IPO:已启动 A股辅导,预计 Q4 上市
市占:预期 2025出货量占全球 37%
订单:9,051万元订单撬动 24亿再融资
战略融资:Infini Capital $10亿战略协议
地位:中国人形机器人第一股
融资:2025.1 完成近8亿元 E轮,上海国资背景
交付:2025计划交付 300台,已交付百余台
背景:康复机器人起家,拓展人形
Vision-Language-Action (VLA) 模型成为具身智能核心架构,将视觉、语言理解与机器人动作生成统一在单一神经网络中,实现从"看"到"做"的端到端学习。
| 模型 | 开发方 | 架构 | 核心能力 | 状态 |
|---|---|---|---|---|
| GR00T N1.6 | NVIDIA | VLA + DiT | 首个开源人形机器人基础模型,跨embodiment泛化 | 开源 (Hugging Face) |
| Gemini Robotics | Google DeepMind | 基于 Gemini 2.0 | 视觉-语言-动作融合,物理世界推理 | 2025.3 发布 |
| RT-2 | Google DeepMind | PaLM-E / PaLI-X | Web+机器人数据联合训练,链式推理 | 研究 |
| PaLM-E | 540B 参数 LLM | 多模态嵌入,多机器人形态控制 | 研究 | |
| Helix | Figure AI | VLA (自研) | 通用视觉-语言-动作模型 | 内部开发 |
| RT-X | Google + 学术联盟 | RT-1/RT-2 扩展 | 20+实验室数据,跨机器人泛化 | 开源 |
双系统架构:System 1 基于 Diffusion Transformer 生成动作,通过 cross-attention 聚焦 VLM 输出。
Cosmos Reason:集成推理 VLM,将模糊指令转化为分步计划。
性能提升:合成数据+真实数据训练,性能提升 40%。
基于 Omniverse + Cosmos Transfer 世界模型,从少量人类演示生成大规模合成数据。
效率:11小时生成 78万条轨迹(等同 6,500小时/9个月人类演示)
关节执行器通常占人形机器人 BOM 成本的 30%以上(高配含灵巧手),基础版本可达 50%以上。Tesla Optimus 有 28+ 个旋转/线性执行器。
| 组件 | 类型 | 技术趋势 |
|---|---|---|
| 电机 | 无框力矩电机 | 高扭矩密度、轻量化 |
| 减速器 | 谐波减速器 / 行星减速器 | 旋转关节;精密传动 |
| 丝杠 | 行星滚柱丝杠 | 线性关节;高效扭矩转换 |
| 编码器 | 高精度位置/速度反馈 | 一体化集成 |
| 力/扭矩传感器 | 6D 力传感器 | 价格下降,渗透率提升 |
DoF:22 DoF 手部 + 3 DoF 手腕前臂
Gen 1/Gen 2 仅 11 DoF,Gen 3 大幅提升灵巧度
DoF:22 关节 (18 主动)
传感:400+ 触觉单元,20 位置传感器,5MP 掌心相机
双腱全向驱动,模拟人手运动学
DoF:27 DoF 灵巧手
触觉:高灵敏度阵列,最低检测 0.1N
线缆驱动,可操作柔软/易碎物品
驱动:肌腱驱动执行器
特点:超静音(降噪 10dB),适合家用
可举 68kg,负载 25kg
任务:钣金件装载 (pick-and-place)
周期:84秒总周期,37秒装载时间
成果:贡献 3万辆汽车生产,20小时连续作业
状态:11个月试点完成,Figure 02 已退役
任务:零件搬运、组件检测
地点:匈牙利 Kecskemét 工厂
定位:解决劳动力短缺,非大规模替代
计划:试点成功后扩展德国工厂
投资:$260亿美国运营投资,含机器人工厂 (年产3万台)
Atlas 部署:2028年 Georgia 电动车工厂
应用:2028零件分拣 → 2030组装/重载/复杂操作
Spot:已用于 HMGMA 焊接车间质检
目标:2025年底-2026初部署 Optimus
任务:pick-and-place,基础装配
挑战:手部设计问题导致计划调整
Agility Digit @ GXO Spanx 仓库:2024年6月首个商业人形机器人部署,Georgia 州。
当前渗透率:人形机器人在仓库部署不足 5%,单台运行 2-3小时需同等时间充电。
专为家用设计,2025年限量家庭试用,收集数据用于迭代升级。目标 2026年年产 10万台。
大部分"通用"演示仍在受控环境下进行,需要远程操作和人工引导。真正的家庭自主还需时日。
核心问题:仿真与现实的差距仍是具身控制系统部署的核心挑战。物理动力学和视觉外观的不匹配导致策略在真实环境中失效。
本质:不是感知问题,而是结构一致性问题——需要建立策略输入、状态表示和轨迹生成逻辑之间的结构恒等映射。
仿真中的摩擦、碰撞、柔性物体行为与真实世界存在偏差,导致运动轨迹不准确。
仿真渲染缺乏真实感,感知模型难以泛化到真实环境的光照、纹理、遮挡。
非结构化环境中的意外情况难以在仿真中穷举,安全边界有限。
PhysAligner:可微物理模块,联合优化机器人参数(控制增益、摩擦系数)以对齐仿真与真实动力学。
效果:参数估计误差降低 3.74%,优化速度提升 89.91%,任务成功率提升 29.17%。
多模态大模型 (MLM) 与世界模型 (WM) 结合,提升系统泛化性、跨任务学习能力,促进 Sim-to-Real 迁移。
DreamerV3:世界模型循环展开 + 动态奖励重建,显著提升策略稳定性。
| 挑战 | 现状 | 趋势 |
|---|---|---|
| 续航 | 运行 2-3小时需同等充电,停机率 >50% | Figure 03 电池 2.3kWh,续航 5小时 |
| 成本 | 单台 >$100,000 | IDTechEx 预测降至 $20,000 |
| 负载 | 有限载荷能力 | Atlas 可举 50kg |
| 数据采集 | 真实数据收集成本高、效率低 | 合成数据生成 (NVIDIA Omniverse) |
汽车装配、零件搬运、质量检测
客户:BMW、Mercedes、Hyundai、Tesla
分拣、搬运、库存管理
客户:GXO、Amazon
清洁、整理、陪伴 (探索中)
玩家:1X NEO
Figure BotQ、Agility 俄勒冈工厂、Hyundai 机器人工厂 (年产3万台) 将推动人形机器人从百台级迈向千台/万台级。
NVIDIA GR00T、Google Gemini Robotics 等 VLA 模型将实现更强的跨任务、跨形态泛化能力。
规模效应 + 国产供应链推动单台成本从 $100K+ 向 $20K-$50K 区间下探。
智元、宇树、优必选等头部企业 IPO,中国在出货量、融资、技术创新多维度保持全球领先。
从试点走向规模部署,汽车制造、仓储物流将成为首批规模化应用场景。家用市场仍在早期探索。
2030年代中期之前采用相对缓慢,2030年代末和2040年代将加速普及。