JavaScript is required

4分钟61个连续动作全自主!Figure升级版具身模型Helix 02发布

人形机器人全身一体化控制的突破性进展。

去年2月,Figure与OpenAI终止合作,转而进行完全自主研发的端到端机器人AI模型——Helix。

据介绍,作为首个“双系统”VLA模型,Helix用于实现人形机器人上半身的高频灵巧控制,支持多机器人协作完成复杂任务。

1月27日,Figure公司推出的升级版Helix 02,成功将这一能力拓展至机器人全身,实现了行走、操作与平衡的一体化协同控制,成为迄今该公司性能最强的人形机器人模型,更在攻克行业核心难题上迈出了关键一步。

Helix 02的核心优势在于依托单一神经控制系统,直接通过视觉像素实现全身自主控制,可在整间房间内完成灵活、长时程的复杂任务,达成了多项关键性技术突破。

其一,实现自主长时程移动-操作协同,在标准厨房环境中独立完成耗时4分钟的洗碗机装卸作业,全程融合行走、操作与平衡控制,无人工重置与干预,堪称目前人形机器人自主完成的时程最长、复杂度最高的任务。

其二,构建全传感输入-全执行器输出链路,通过单一统一的视觉运动神经网络,将视觉、触觉、本体感知等所有板载传感器与全部执行器直接连接,打破了传感与执行的割裂壁垒。

其三,依托System 0实现拟人化全身控制,这一自主学习控制器基于超1000小时人类运动数据训练,结合仿真到现实强化学习技术,以单一神经先验模型取代了近11万行手工编写的C++代码,让机器人动作更稳定自然。

其四,解锁全新精细操作能力,借助Figure 03配备的嵌入式触觉传感器与手掌摄像头,完成了精准分拣单粒药片、定量推注注射器药液、视线受阻下分拣细小不规则物品等此前难以企及的操作。

01.

人形机器人移动与操作

一体化控制的行业难题

这些突破的背后,是对人形机器人领域数十年未决难题的精准攻克——移动与操作的一体化控制。这项技术的难点并非单独实现移动或操作,而在于二者动态关联的协同拆解:

抓取物体瞬间会改变机器人平衡状态,行走一步则会调整可操作范围,四肢动作始终处于相互约束的动态循环中。

此前,人形机器人已能完成跳跃、舞蹈、瑜伽等令人印象深刻的短时程动作,但这些成果几乎都存在同一局限:机器人无法实现真正的自主可控。多数系统只能复现离线规划的动作轨迹,且反馈调节能力有限。一旦物体位置偏移或接触状态变化,动作就会失控中断。

传统机器人技术通过“拆分控制+状态机衔接”的方式规避这一问题:先行走、再停下、稳定身体、伸手抓取、再次行走。这种分段控制的切换过程速度慢、容错性差,且动作模式机械僵硬。

真正的自主控制,需要一套本质上截然不同的技术方案:一个能同时对全身动作进行决策的单一学习系统。这个系统需具备持续感知、实时决策、动态执行的能力——比如边走边搬运物体、在伸手取物时调整身体平衡、在动作失误时实时修正。

而这,正是 Helix 02 研发的初衷。

02.

加入System 0

Helix 02实现一体化全身移动-操作协同

Helix 02以“三层系统架构”给出了全新解决方案,在原有System 1与System 2基础上新增核心基础层System 0,三者各司其职且高效协同,构建起从视觉像素到关节扭矩的完整控制链路。

其中,System 2负责慢速目标决策,涵盖场景解析、语言理解与行为序列规划,可处理“走到洗碗机旁并打开它”等复杂指令,无需规划底层步态与四肢协同方式,只需生成一系列语义隐变量,由System 1 解析为运动指令,再交由System 0 执行;

System 1以200Hz频率实现快速感知响应,升级后实现全传感接入与全身关节控制,依托Figure 03 机型新增的手掌摄像头(可弥补视线遮挡)与触觉传感器(可感知低至3克作用力)的硬件配置,首次实现基于这些感知模态的神经网络策略控制。

System 1 沿用基于System 2 隐变量的 Transformer 模型架构,升级后可将环境感知转化为全身关节精准控制指令,并由System 0 以 kHz 级频率实时跟踪执行。

System 0 则以 1kHz 的高频执行动作,保障全身的平衡、接触与协同控制。

作为一套拟人化全身控制基础模型,其核心是通过学习人类运动数据,形成关于“人类如何在保持平衡稳定的前提下完成动作” 的神经先验知识。它是 Helix 02 物理躯体控制的核心支柱:当上层系统负责任务规划与决策时,System 0可确保每一个动作都流畅、安全、稳定地执行。

不同于传统技术中为行走、转弯、下蹲、取物等动作单独设计奖励函数的模式,System 0直接从庞大多样的人类运动数据集中学习动作轨迹。在复现人类动作的过程中,该模型自主掌握了力的协调分配、姿态调整方式,以及在各类动作中维持平衡的能力,为通用移动-操作协同奠定基础。

  • 训练数据:超 1000 小时关节级人类运动重定向数据

  • 模型架构:1000 万参数神经网络,输入全身关节状态与机身运动数据,输出关节级执行器指令,频率达 1kHz

  • 仿真训练:System 0的训练完全在仿真环境中完成,覆盖超200,000个并行环境,并引入大量领域随机化技术,确保模型可直接迁移至真实机器人,并在多台设备上实现性能泛化

实测成果进一步验证了Helix 02的技术实力。

在移动-操作协同实测中,搭载Helix 02的机器人在标准厨房内装卸洗碗机,这一连续 4 分钟的行为,均为机器人全自主运行,无远程操控。

这是目前已公开的复杂度最高的自主操作序列,同时也是人形机器人领域首次实现 “从像素到全身” 的长时程端到端控制。

演示中,机器人4分钟内自主完成61个连续动作,手持易碎物品行走时维持稳定抓握,双手被占用时借助髋部关闭抽屉、用脚部抬起洗碗机门辅助操作,实现毫米级手指精细动作与房间尺度行走的跨量级协同,具备隐式容错能力。

在精细操作实测中,基于触觉传感与手掌摄像头,搭载Helix 02的机器人成功完成拧开瓶盖、精准取药、注射器定量推注、杂乱堆中分拣金属零件等任务,均为全自主运行,无远程操控,突破了纯视觉策略的局限。

值得一提的是,在分拣金属零件的演示中,Figure 03 机器人分拣的是来自 BotQ 生产车间的真实金属零件。

一年前,Helix 系列首次证明单一神经网络可控制人形机器人上半身;如今,Helix 02 将这一能力拓展至机器人全身。

依托System 0 的拟人化全身控制、System 1 的全传感-全执行器连接,以及 System 2 的长时程语义推理,Helix 02 实现了全新突破:在房间内,实现行走与操作无缝融合的连续自主控制。

尽管目前成果仍处于早期阶段,但已充分展现出全身自主控制的巨大潜力。4 分钟内流畅完成 61 个移动-操作协同动作、依托触觉与手掌视觉实现精细操作、将髋部与脚部纳入操作体系实现全身协同作业。

这一突破为行业解决移动-操作一体化控制难题提供了可行路径,为人形机器人走向实用化奠定了坚实基础。

点击查看全文
评论赞0分享
轨迹
人形机器人Figure

欢迎关注我们!

上海恩翌信息科技有限公司
1NE时代-小恩
188-1775-0862
沪ICP备17041240号-4