JavaScript is required

起底Figure 03|从实验室到客厅,读懂人形机器人「量产密码」

机器人做家务”走进现实。

就在上个月,美国人形机器人公司Figure宣布,公司C轮融资筹集了超10亿美元(约合人民币71亿元),投后估值达390亿美元(约合人民币2774亿元),资金将用于加速通用人形机器人在现实场景的规模化落地。

本月初,Figure发布了第三代人形机器人产品Figure 03。这款人形机器人专为Helix系统而生,面向家庭场景与全球规模化应用。

Figure 03 围绕「让 Helix 实现全场景的智能推理」展开优化,核心改进集中于 “感知-操作-数据” 三大环节,确保 Helix 能在真实场景中落地。

感知层:新一代视觉系统将帧率提升 2 倍、延迟降至 1/4、视场角拓宽 60%,提供密集稳定的环境感知流,解决复杂场景(如家庭杂乱空间)的导航难题;

操作层:手部嵌入宽视场角低延迟摄像头(解决主摄像头遮挡问题),自研触觉传感器可检测 3 克压力(能识别回形针重量),实现对不同物体的精细抓握与实时自适应控制;

数据层:10 Gbps mmWave 数据卸载能力支持 TB 级数据上传,为 Helix 提供持续学习的 “数据燃料”,支撑端到端 “像素-动作” 学习,最终实现“推理-动作”闭环。

针对家庭场景的设计,Figure 03 的安全性与易用性实现了双提升。

在安全性优化方面,Figure 03 的关键位置采用多密度泡沫材质防止夹伤,外覆盖柔性织物以替代硬质机械部件,避免碰撞伤害。相比 Figure 02,重量降低9% ,体积显著减小,更易在狭窄家庭空间(如走廊、厨房)移动。另外,在电池安全上,Figure 03采用多层防护设计,覆盖 BMS、电芯、互联、电池组层级,已通过UN38.3 标准认证,降低安全隐患。

在易用性优化方面,Figure 03的外覆材料可水洗,且无需工具即可拆装更换,支持定制服装,包含防割、耐用材质选项,以适配不同家庭需求。此外,Figure 03 升级后支持更自然的实时语音交互,相比Figure 02,扬声器尺寸×2、功率×4,麦克风重新定位以提升收音清晰度与性能。在充电方式上,Figure 03 支持2kW 无线感应充电,机器人脚部内置充电线圈,只需踏上传感底座即可补能,可自动 docking 实现“按需充电”。

Figure 虽专注于家庭市场,但丝毫不会削弱 Figure 03 在商业市场的潜力。家庭场景的技术改进,比如感知、续航、定制化,“反哺”提升了 Figure 03 的商用适配性。

基于 Figure 03 的高效操作能力,其执行器速度提升2 倍,扭矩密度显著优化,直接提升 “拾取-放置” 操作效率,适配物流、制造等商用场景的高效作业需求;另外,为 Helix 改进的视觉与手部触觉系统,可让机器人在仓库、工厂等商用环境中稳定抓取金属薄片、可变形塑料袋等多样物体。

此外,得益于Figure 03 的持续运行能力,依赖2kW 无线感应充电与休息时数据卸载,机器人可在作业间隙踏上传感垫快速补能,无需人工干预;休息时返回 docking 无缝完成数据上传,不占用作业时间,适配物流、制造等场景24 小时间歇作业的需求。

01.

产品迭代,Figure层层递进

Figure 成立于2022年,三年来迭代速度快。Figure 01作为技术验证原型,聚焦工业场景基础能力;Figure 02则着力商用落地过渡,优化算力与外观,首次交付客户;Figure 03的目标是量产化、跨场景,覆盖家庭 + 商用。

从落地场景来看,Figure 01 到 Figure 03 实现了从单一工业场景(宝马工厂,Figure 01)扩展至仓储制造商用场景(Figure 02),再到覆盖家庭 + 物流 + 酒店多场景(Figure 03)的递进。

总的来看,Figure 的路径是从工业场景验证技术,再通过商用场景打磨落地能力,进而实现量产化覆盖全场景,核心是通过快速迭代,先在 B 端(工业、仓储)验证稳定性,再向 C 端(家庭)延伸,最终实现通用人形机器人的目标。

02.

首个“双系统”VLA模型Helix

Figure 产品的迭代升级,离不开首个用于通用人形机器人控制的Vision-Language-Action (VLA) 模型Helix

今年2月,Figure与OpenAI终止合作,转而进行完全自主研发的端到端机器人AI模型——Helix

据介绍,作为首个“双系统”VLA模型,Helix用于实现人形机器人上半身的高频灵巧控制,支持多机器人协作完成复杂任务,攻克机器人领域多个长期难题,更是实现了多个“第一”

首个能输出 “手腕、躯干、头部、单个手指” 全上半身高频率连续控制信号的 VLA。

首个可同步在两台机器人上运行,使其协作完成 “从未见过物品” 长时程操控任务的 VLA。

搭载 Helix 的 Figure 机器人,仅通过自然语言指令,即可拾取几乎所有小型家居物品(含数千个训练中未接触过的物品)。

用单组神经网络权重学习所有行为(拾取放置、操作抽屉 / 冰箱、跨机器人交互),无需任何任务专属微调,区别于传统多任务需单独调整的方案。

首个完全在低功耗嵌入式 GPU上机载运行的 VLA,可直接部署至商用场景。

而家庭是机器人应用的最大难点场景,与可控的工业环境差异显著。首先,家庭场景的物品多样性极高,包含易碎玻璃器皿、褶皱衣物、散落玩具等,形状、尺寸、颜色、材质均不可预测。另外,需机器人按需生成新行为,尤其针对训练中未接触过的物品。

传统方法无法满足家庭场景的 scaling 需求,AI 领域的Vision Language Models (VLMs) 已实现 “即时泛化”,Helix 的核心目标是:将 VLM 捕捉的海量常识语义知识,直接转化为机器人可执行的动作,让原本需数百次演示的新技能,通过自然语言指令即可即时获取,改变机器人行为的 scaling 轨迹。

然而,传统 VLA 存在矛盾:VLM 骨干泛化强但速度慢,机器人视觉运动策略速度快但泛化弱。Helix 通过双系统端到端训练(可协同通信) 解决该问题。

Helix 可实现速度与泛化兼顾,匹配单任务行为克隆策略的速度,同时实现对数千个新测试物品的零样本泛化。同时支持高维动作空间,直接输出连续控制信号,避免传统 VLA 的 “动作 token 化” 方案(仅适用于低维控制如二进制平行夹爪),突破人形机器人高维控制瓶颈。

另外,在架构方面,基于开源组件(S2 用开源开权重 VLM,S1 用简单 Transformer 视觉运动策略),降低开发复杂度。而且S1 与 S2 可独立迭代,无需统一观测空间或动作表示,提升研发效率。

在数据效率方面,仅用~500 小时遥操作数据(为传统 VLA 数据集的 < 5%)实现训练,且通过 VLM 自动生成语言指令降低标注成本,同时保证对数千未知物品的零样本拾取,大幅降低规模化资源门槛。

今年6月,Figure 发文透露,自初步部署于物流场景后仅三个月,Helix 依托 “基于学习的机器人技术路径” 的可扩展性,在核心能力与实际应用表现上实现了跨越式提升,核心目标是向全自主包裹分拣迈进,逐步缩小与人类操作在灵活性、速度和可靠性上的差距。

Helix 在物流包裹处理中,从初步部署到升级后,核心性能提升集中在包裹处理范围、包裹处理速度条码扫描定向率以及自适应行为这四个方面,直接降低物流分拣的人工依赖,向全自主分拣落地迈进。

包裹处理范围:从仅处理刚性箱子扩展至可变形塑料袋、扁平信封等复杂类型,解决物流中包裹形态多样的核心痛点;

包裹处理速度:从 5.0 秒 / 件降至 4.05 秒 / 件(提速 20%),接近人类操作速度,可提升分拣线整体效率;

条码扫描定向率:正确定向率从 70% 升至 95%,减少因条码识别失败导致的分拣延误;

自适应行为:新增轻拍抚平包装等动作,无需人工干预即可应对包装褶皱问题。

Helix 的性能提升,离不开“数据规模化”和“架构优化”双路径。

数据规模化(10 小时→60 小时演示数据)解决了模型泛化能力不足的问题,通过更多人类操作案例,让模型学会处理多样包裹和复杂场景(如褶皱标签),数据量增加直接带来 58% 的吞吐量提升和 6.2% 的条码成功率提升。

另外,架构优化解决了操作效率与稳定性问题。例如,视觉记忆消除冗余动作、力反馈提升抓取精度,单独依赖架构优化无法覆盖多样包裹处理的需求(需数据支撑泛化)。

但是,仅靠数据无架构优化,模型无法高效利用数据,比如会因无记忆模块导致重复动作;仅靠架构无数据支撑,模型缺乏学习样本,无法应对实际物流中的复杂变量,比如不同材质包裹。因此,二者缺一不可。

可以预见的是,Helix 的灵活性和稳健性正在稳步提升,正在缩小学习到的机器人操作与实际任务需求之间的差距。正在进行的工作将继续拓展其技能组合,并确保其在更高速度和更高负载下的稳定性。

03.

Figure 03,为量产而生

针对人形机器人量产难、成本高、产能低的行业痛点,Figure 03 通过“设计重构-供应链建设-专属工厂”三位一体优化的解决路径,试图“趟”出一条路,打破人形机器人“原型化”困境。

首先,Figure 03 的设计与工艺近乎重构。

Figure 03 重构几乎所有组件,减少零件数量、装配步骤及非必要功能组件。在工艺上,从 Figure 02 的CNC加工为主转向压铸、注塑、冲压等工具化工艺,虽然需要前期工具投入,但单台制造成本大幅降低,且产量越高经济性越好。

其次,Figure 03 的全新供应链建设。

Figure 03 的核心模块,比如执行器、电池、传感器、结构件、电子元件等,均由 Figure 自研并垂直整合生产,避免依赖外部技术,实现垂直整合。另外,针对非核心零件,Figure 则筛选具备“高产能、严时效、高标准”的供应商,构建可随 Figure 成长的全球合作网络,满足数千至数百万件的量产零件需求。

最后,建立BotQ 专属制造工厂。

Figure 专为 Figure 03 打造的 BotQ 制造工厂,首条产线年产能1.2 万台,四年内目标总产量10 万台。该工厂核心系统自研生产,确保质量、迭代速度与生产效率,配备的自研制造执行系统(MES),所有子装配与总装均实现全流程追溯,保障质量一致性与持续改进。

就比如,今年7月,Figure 正式发布F.03 电池,则是由旗下 BotQ 团队完全自研自产。

该电池从 F.01 的外部背包式 bulky 矩形模块迭代而来,实现能量密度提升 94% 并直接集成于机器人躯干,关键性能包括2.3 kWh 容量支持 5 小时峰值运行、2 kW 主动冷却快充、成本较 F.02 降低 78% ,同时采用多层安全架构,是首款推进 UN38.3 与 UL2271 认证的人形机器人电池,可通过 1 米跌落、热失控等严苛测试,且支持 BotQ 年产 12,000 台人形机器人的量产需求。

04.

写在最后

美国《时代》杂志10月9日的报道中指出,Figure 03在发布后还没有准备好供家庭使用,实际上还不能用于家庭用途。

尽管如此,Figure 03 的发布已为行业树立标杆,或许这正标志着人形机器人发展迈入新阶段,因为量产落地应用始终是机器人绕不开的核心关卡

就目前而言,Figure 03 以 BotQ 工厂、十万台量产规划锚定落地核心,其将硬件升级与 Helix AI 结合的思路,正推动行业从技术演示走向实用化探索,这恰是新阶段的核心特征。

点击查看全文
评论赞0分享
轨迹
人形机器人Figure

欢迎关注我们!

上海恩翌信息科技有限公司
1NE时代-小恩
188-1775-0862
沪ICP备17041240号-4