wxo新科技 · 详细版 · 2026-07-02 11:52 CST

全球智能化具身机器人研发和使用现况

这不是“人形机器人谁的视频最炫”的排行榜,而是一份现实进度图:哪些机器人已经在真实场景工作,哪些仍在训练场,哪些只是概念验证。核心结论是:具身机器人正在进入商业化前夜,但成熟顺序会是“工业/仓储/巡检 → 服务与康养 → 家庭通用”。

542,000 台IFR 披露 2024 年全球工业机器人装机量约 54.2 万台,自动化底盘已经很大。
575,000 台IFR 预计 2025 年全球工厂机器人装机约 57.5 万台,2028 年超 70 万台。
10,000 台级中国 2026 实景实训行动目标:推动万台级人形机器人商业化落地能力。
100+ 场景同一专项行动强调 100 个以上高价值应用场景,说明竞争焦点转向真实任务。
先给结论

2026 年的真实状态:行业在过“从演示到作业”的坎

具身智能的本质,是让 AI 不只会回答问题,而是能通过身体感知世界、理解目标、规划动作、执行任务并从结果中学习。这个方向一定会长期存在,因为它对应的是制造、物流、护理、家务、农业、安防、应急等大量真实劳动。

但当前最容易误判的是:公开视频中的机器人会跳舞、会后空翻、能端杯子,不等于它已经能在客户现场稳定工作。商业化需要更硬的指标:每天工作小时数、故障间隔、人工接管比例、任务吞吐量、部署成本、维护成本、安全认证和客户系统集成。

所以更准确的描述是:传统机器人和 AMR 已经规模化,人形机器人正在进入小批量试点,家庭通用机器人仍处非常早期。当前赢家不一定是单机体最酷的公司,而是能把硬件可靠性、训练数据、模型泛化、远程运维和现场流程改造做成闭环的团队。

工业臂 AMR 四足/巡检 移动操作 人形通用 成熟度不是“像人”,而是“能干活” 真实场景、长时间运行、安全合规、成本闭环,比单次演示更重要
成熟度梯队

五层落地进度

规模商业
工业机械臂、协作机器人、AGV/AMR、部分仓储自动化。已经有大量真实收入和安装经验。
可复制试点
仓储搬运、汽车制造物料配送、固定区域上下料,Digit、Figure、Apollo、Atlas 等正在争夺。
早期部署
巡检、零售补货、酒店/餐饮配送、实验室自动化、康养辅助,通常要限定路线、任务和环境。
训练场阶段
通用移动操作、人形多任务学习、跨场景泛化,依赖遥操作、示教和仿真数据。
家庭通用
长期想象最大,但开放家庭环境、安全、隐私、售后和价格仍是硬坎。

全球研发版图:谁在做什么

主体 代表产品/方向 2026 状态 强项 短板/待验证
Figure AI Figure 03、Helix VLA 2026-06-30 宣布 Figure 03 进入 BMW Spartanburg 工厂 Hall 52,做物流排序和拉料车相关任务。 双足、双臂、工厂任务、端到端模型叙事强。 需要公开更长期的吞吐量、故障间隔和人工接管比例。
Agility Robotics Digit 在 GXO 设施完成 100,000+ totes 搬运;与 Toyota Motor Manufacturing Canada 签署 RaaS 商业协议。 仓储物流任务更窄、更接近 ROI;RaaS 商业模式清晰。 能否跨更多客户站点复制,仍需观察。
Apptronik Apollo 2 / Apollo 3、Robot Park 2026-06-30 扩建 Austin Robot Park,用训练场采集物流、制造、零售任务数据;与 Google DeepMind、Mercedes 关系密切。 把“训练数据工厂”做成核心资产,双足和轮式路线并行。 Apollo 3 商业版量产、客户现场表现还要验证。
Boston Dynamics 全电 Atlas 产品版 Atlas 面向工业,2026 部署计划包括 Hyundai 和 Google DeepMind。 运动控制、机器人本体、可靠性工程积累深。 商业化速度可能比视频热度慢,成本和任务经济性需证明。
Tesla Optimus 官方定位为通用双足自主机器人,用于不安全、重复或无聊任务;招聘页面显示仍在强化操控、灵巧手、制造质量和高产自动化。 制造体系、电池/电驱、FSD 视觉经验、规模化野心。 外部可验证客户部署和真实任务指标仍有限。
NVIDIA Isaac、GR00T、Jetson Thor 发布 Isaac GR00T Reference Humanoid Robot,整合 Unitree H2 Plus、五指灵巧手、Jetson Thor 和 Isaac 软件栈。 不做单一机器人,而做仿真、训练、部署、算力和生态底座。 行业需要证明基础模型能跨机体和跨场景迁移。
Unitree G1、H1/H2、H2 Plus G1/H1/H2 系列推动低成本和开发者生态;H2 Plus 成为 NVIDIA GR00T 参考人形平台。 硬件成本、运动控制、开发者可及性、中国供应链速度。 从研发/教育/展示走向高可靠商业作业,还需要场景验证。
AgiBot 智元 A 系列、X 系列、D 系列、AGIBOT World 官方称 2026 年 6 月达到第 15,000 台机器人下线,并推出 embodied AI 数据集和生态。 中国整机量产、产品线丰富、数据平台叙事清楚。 需要区分“总机器人产量”和“人形机器人真实工作量”。
1X NEO 家庭机器人 订单页显示美国 2026 年开始交付,标准订阅 499 美元/月,复杂任务可由专家远程监督。 直接瞄准家庭,产品体验和安全外观设计突出。 家庭场景最难,早期高度依赖远程专家与学习过程。

地区路径:美国、中国、欧洲/日本各不相同

美国

基础模型 + 风投 + 客户试点

美国路径偏“AI 平台 + 创业公司 + 大客户试点”。Figure、Agility、Apptronik、1X、Boston Dynamics、Tesla、NVIDIA、Google DeepMind 等形成从模型、算力、本体到场景客户的链条。

优势:模型、资本、云/算力、自动驾驶和大客户资源。风险:硬件成本高、量产爬坡慢。

中国

政策牵引 + 供应链 + 场景开放

中国 2026 年“人形机器人与具身智能实景实训专项行动”把重心放在真实场景训练、创新联合体、技能攻关和部署验证。地方政府、央国企场景、整机厂和零部件供应链会共同加速。

优势:供应链、成本、制造速度、场景组织能力。风险:同质化、过早铺量、真实 ROI 不清。

欧洲/日本/韩国

工业机器人与精密制造底盘

欧洲、日本、韩国在工业机器人、汽车制造、精密减速器、电机、传感器和安全标准上有深厚基础。它们未必最会制造话题,但在高可靠工业场景里仍有强势位置。

优势:工业客户、可靠性、安全标准。风险:消费级和 AI 速度可能慢于中美。

技术栈:具身机器人不是一个模型,而是一条系统链

1. 机体与执行器关节电机、减速器、编码器、力控、手部灵巧操作、散热和电池决定了物理上限。
2. 感知相机、深度、LiDAR、IMU、触觉、力矩传感器让机器人知道自己和外界的状态。
3. 控制全身控制、平衡、轨迹规划、抓取规划、避障和安全停止,决定动作是否可靠。
4. VLA / 策略模型把视觉、语言指令和动作输出连接起来,让机器人能理解任务并泛化。
5. 数据闭环遥操作、示教、仿真、真机回放、失败样本复盘,是从“会一次”到“稳定会”的核心。
大模型不是万能

语言模型解决的是意图理解和高层规划,真正落到物理世界还需要低层控制、碰撞检测、抓取姿态、力反馈和异常恢复。把 ChatGPT 式能力直接套到机器人上,会低估物理世界的复杂度。

数据比算法更稀缺

互联网文本可大量抓取,但机器人动作数据必须从真实世界或高质量仿真里获得。Apptronik 的 Robot Park、AgiBot 的 AGIBOT World、Unitree 的开发者平台,本质上都在争夺“身体数据”。

应用场景成熟度详表

场景 成熟度 典型任务 为什么先落地/难落地 观察指标
仓储物流 tote 搬运、装卸、分拣、料箱转运、补货。 任务重复、物品规格稳定、ROI 清楚,Digit 已有真实搬运量案例。 每小时搬运量、人工接管率、故障间隔、RaaS 续约率。
汽车制造 中高 线边配送、零件排序、料车牵引、上下料、检查。 场景标准化,但节拍严格,停线代价高。Figure/Boston Dynamics/Apptronik 都在盯这个方向。 是否进入多工位、多班次、非演示节拍。
电子制造/精密装配 小件抓取、检测、插拔、搬运。 需求大,但对灵巧手、视觉和力控要求高,固定机械臂往往更经济。 良率、换线时间、末端执行器成本。
巡检/安防/特种 中高 电力巡检、隧道、园区、油气、消防侦察。 四足和轮式更成熟,人形不一定必要。 续航、环境适应、安全认证、远程运维能力。
零售/餐饮/酒店 配送、清洁、迎宾、补货、库存扫描。 客流和环境变化大,用户交互复杂,服务机器人已存在但经济性分化。 客诉率、维护成本、单位服务成本。
医疗康养 中低 陪护、搬运、康复辅助、物资配送、夜间看护。 老龄化需求强,但责任、隐私、跌倒和误操作风险高。 安全边界、医护审批、保险责任、可解释记录。
家庭通用 洗衣、收纳、拿取、开门、简单陪伴。 家庭开放度最高,物品无标准、儿童/宠物/隐私/安全都难控。 无需远程接管比例、事故率、售后成本、真实留存。

产业链拆解:机会不只在整机

上游

执行器/减速器/电机

人形机器人关节多,执行器成本占比高。谁能把扭矩密度、寿命、成本、噪音和发热平衡好,谁就掌握硬件核心。

感知

相机/深度/触觉/力控

灵巧操作离不开触觉和力反馈。未来“手”的传感器会像自动驾驶里的摄像头和雷达一样重要。

算力

边缘推理与仿真训练

NVIDIA、机器人芯片和边缘计算平台承担训练、仿真、部署和安全冗余,是机器人智能化的基础设施。

服务

RaaS、运维、集成

客户不只买机器人,也买部署、维护、远程监控、软件升级和流程改造。系统集成会很赚钱,但很辛苦。

风险清单

行业最容易踩的坑

  • 把遥操作包装成完全自主,短期可以演示,长期会伤害信任。
  • 只追求人形外观,不算任务经济性;很多场景轮式底盘或固定机械臂更合理。
  • 低估安全责任:机器人一旦在家庭、医院、工厂与人共处,事故责任会比软件 bug 更严重。
  • 忽视运维:电池、关节、手部磨损、跌倒损伤、现场网络和客户员工培训都会变成成本。
  • 过早铺量:没有任务闭环和售后体系的量产,容易从“规模优势”变成“规模故障”。
判断方法

怎么看一家公司是不是靠谱

  • 有没有真实客户现场,而不只是展厅视频。
  • 是否公布任务指标:吞吐量、连续运行小时、接管率、故障间隔。
  • 是否能解释数据来源:遥操作、示教、仿真、真机回流如何闭环。
  • 是否有安全策略:力限制、碰撞检测、急停、责任日志、远程接管边界。
  • 是否有商业模式:一次性购买、租赁、RaaS、维护服务和软件订阅。
我的综合判断: 2026 年具身机器人值得认真跟踪,但不能用“AI 大模型爆发速度”去套。大模型可以一夜之间服务上亿用户,机器人却要面对材料、关节、电池、跌倒、碰撞、质保、保险、工厂节拍和现场人员。它会更慢,但一旦跑通,会比纯软件更难被复制。短期看仓储和制造,中期看服务与康养,长期才看家庭通用。

接下来 12 个月观察表

观察点 代表问题 如果出现好信号
客户是否扩单 Figure/BMW、Agility/GXO 或 Toyota、Apptronik/Mercedes 是否从 pilot 进入多站点部署? 说明真实 ROI 开始成立。
人工接管比例 复杂任务到底多少由机器人自主完成,多少由人类远程专家兜底? 接管率下降是通用智能进步的硬指标。
供应链成本 执行器、灵巧手、电池和算力成本能否快速下降? 成本下降会让更多场景 ROI 转正。
中国实景实训 100+ 场景和万台级落地能力是否形成可复用数据和标准? 如果不是单点项目,而是行业数据资产,将显著加速迭代。
家庭机器人反馈 1X NEO 等早期交付后,用户留存、安全事件和远程接管体验如何? 家庭场景一旦真实可用,市场空间会打开,但短期概率仍低。