人形机器人全身一体化控制的突破性进展。
去年2月,Figure与OpenAI终止合作,转而进行完全自主研发的端到端机器人AI模型——Helix。
据介绍,作为首个“双系统”VLA模型,Helix用于实现人形机器人上半身的高频灵巧控制,支持多机器人协作完成复杂任务。
1月27日,Figure公司推出的升级版Helix 02,成功将这一能力拓展至机器人全身,实现了行走、操作与平衡的一体化协同控制,成为迄今该公司性能最强的人形机器人模型,更在攻克行业核心难题上迈出了关键一步。
Helix 02的核心优势在于依托单一神经控制系统,直接通过视觉像素实现全身自主控制,可在整间房间内完成灵活、长时程的复杂任务,达成了多项关键性技术突破。
其一,实现自主长时程移动-操作协同,在标准厨房环境中独立完成耗时4分钟的洗碗机装卸作业,全程融合行走、操作与平衡控制,无人工重置与干预,堪称目前人形机器人自主完成的时程最长、复杂度最高的任务。
其二,构建全传感输入-全执行器输出链路,通过单一统一的视觉运动神经网络,将视觉、触觉、本体感知等所有板载传感器与全部执行器直接连接,打破了传感与执行的割裂壁垒。
其三,依托System 0实现拟人化全身控制,这一自主学习控制器基于超1000小时人类运动数据训练,结合仿真到现实强化学习技术,以单一神经先验模型取代了近11万行手工编写的C++代码,让机器人动作更稳定自然。
其四,解锁全新精细操作能力,借助Figure 03配备的嵌入式触觉传感器与手掌摄像头,完成了精准分拣单粒药片、定量推注注射器药液、视线受阻下分拣细小不规则物品等此前难以企及的操作。
01.
人形机器人移动与操作
一体化控制的行业难题
这些突破的背后,是对人形机器人领域数十年未决难题的精准攻克——移动与操作的一体化控制。这项技术的难点并非单独实现移动或操作,而在于二者动态关联的协同拆解:
抓取物体瞬间会改变机器人平衡状态,行走一步则会调整可操作范围,四肢动作始终处于相互约束的动态循环中。
此前,人形机器人已能完成跳跃、舞蹈、瑜伽等令人印象深刻的短时程动作,但这些成果几乎都存在同一局限:机器人无法实现真正的自主可控。多数系统只能复现离线规划的动作轨迹,且反馈调节能力有限。一旦物体位置偏移或接触状态变化,动作就会失控中断。
传统机器人技术通过“拆分控制+状态机衔接”的方式规避这一问题:先行走、再停下、稳定身体、伸手抓取、再次行走。这种分段控制的切换过程速度慢、容错性差,且动作模式机械僵硬。
真正的自主控制,需要一套本质上截然不同的技术方案:一个能同时对全身动作进行决策的单一学习系统。这个系统需具备持续感知、实时决策、动态执行的能力——比如边走边搬运物体、在伸手取物时调整身体平衡、在动作失误时实时修正。
而这,正是 Helix 02 研发的初衷。
02.
加入System 0
Helix 02实现一体化全身移动-操作协同
Helix 02以“三层系统架构”给出了全新解决方案,在原有System 1与System 2基础上新增核心基础层System 0,三者各司其职且高效协同,构建起从视觉像素到关节扭矩的完整控制链路。
其中,System 2负责慢速目标决策,涵盖场景解析、语言理解与行为序列规划,可处理“走到洗碗机旁并打开它”等复杂指令,无需规划底层步态与四肢协同方式,只需生成一系列语义隐变量,由System 1 解析为运动指令,再交由System 0 执行;

System 1以200Hz频率实现快速感知响应,升级后实现全传感接入与全身关节控制,依托Figure 03 机型新增的手掌摄像头(可弥补视线遮挡)与触觉传感器(可感知低至3克作用力)的硬件配置,首次实现基于这些感知模态的神经网络策略控制。

System 1 沿用基于System 2 隐变量的 Transformer 模型架构,升级后可将环境感知转化为全身关节精准控制指令,并由System 0 以 kHz 级频率实时跟踪执行。
System 0 则以 1kHz 的高频执行动作,保障全身的平衡、接触与协同控制。
作为一套拟人化全身控制基础模型,其核心是通过学习人类运动数据,形成关于“人类如何在保持平衡稳定的前提下完成动作” 的神经先验知识。它是 Helix 02 物理躯体控制的核心支柱:当上层系统负责任务规划与决策时,System 0可确保每一个动作都流畅、安全、稳定地执行。
不同于传统技术中为行走、转弯、下蹲、取物等动作单独设计奖励函数的模式,System 0直接从庞大多样的人类运动数据集中学习动作轨迹。在复现人类动作的过程中,该模型自主掌握了力的协调分配、姿态调整方式,以及在各类动作中维持平衡的能力,为通用移动-操作协同奠定基础。
训练数据:超 1000 小时关节级人类运动重定向数据
模型架构:1000 万参数神经网络,输入全身关节状态与机身运动数据,输出关节级执行器指令,频率达 1kHz
仿真训练:System 0的训练完全在仿真环境中完成,覆盖超200,000个并行环境,并引入大量领域随机化技术,确保模型可直接迁移至真实机器人,并在多台设备上实现性能泛化
实测成果进一步验证了Helix 02的技术实力。
在移动-操作协同实测中,搭载Helix 02的机器人在标准厨房内装卸洗碗机,这一连续 4 分钟的行为,均为机器人全自主运行,无远程操控。
这是目前已公开的复杂度最高的自主操作序列,同时也是人形机器人领域首次实现 “从像素到全身” 的长时程端到端控制。
演示中,机器人4分钟内自主完成61个连续动作,手持易碎物品行走时维持稳定抓握,双手被占用时借助髋部关闭抽屉、用脚部抬起洗碗机门辅助操作,实现毫米级手指精细动作与房间尺度行走的跨量级协同,具备隐式容错能力。
在精细操作实测中,基于触觉传感与手掌摄像头,搭载Helix 02的机器人成功完成拧开瓶盖、精准取药、注射器定量推注、杂乱堆中分拣金属零件等任务,均为全自主运行,无远程操控,突破了纯视觉策略的局限。
值得一提的是,在分拣金属零件的演示中,Figure 03 机器人分拣的是来自 BotQ 生产车间的真实金属零件。
一年前,Helix 系列首次证明单一神经网络可控制人形机器人上半身;如今,Helix 02 将这一能力拓展至机器人全身。
依托System 0 的拟人化全身控制、System 1 的全传感-全执行器连接,以及 System 2 的长时程语义推理,Helix 02 实现了全新突破:在房间内,实现行走与操作无缝融合的连续自主控制。
尽管目前成果仍处于早期阶段,但已充分展现出全身自主控制的巨大潜力。4 分钟内流畅完成 61 个移动-操作协同动作、依托触觉与手掌视觉实现精细操作、将髋部与脚部纳入操作体系实现全身协同作业。
这一突破为行业解决移动-操作一体化控制难题提供了可行路径,为人形机器人走向实用化奠定了坚实基础。













沪公网安备31010702008139