JavaScript is required

朗咸朋点评VLA,未来也将应用在人形机器人中

和王兴兴观点不一致

事情的背景是今年8月份的世界机器人大会,王兴兴提出对VLA的担忧,认为这属于“相对傻瓜式架构”。该理念提出后,业内掀起了广泛的讨论。

时隔多月之后,理想自动驾驶负责人朗咸朋表达了自己的观点,提出了和王兴兴看法不一致的地方。9月理想VLA正式发布,12月6日OTA 8.1推送。此前,李想本人已经透露,未来理想一定会做人形机器人。

朗咸朋表达了自己的心得,VLA就是自动驾驶最好的模型方案、具身智能最终拼的是整体的系统能力。

朗咸朋表示,理想的VLA本质上就是生成式模型。只不过生成的Token不是文本,而是轨迹和控制信号。从用户使用的反馈看,在某些场景下理想的VLA已经具备了对物理世界的认知涌现,具体的表现是拟人行为表现不错。

对于世界模型和VLA的对比,朗咸朋认为世界模型更适合做“考场”,即仿真环境和强化训练,而不是做“考生”直接部署在车端。这是因为世界模型对算力的需求远高于VLA,决定了其更适合在云端做数据生成和极度逼真的仿真测试和强化训练。同时透露,理想汽车在云端已经应用了世界模型,规模达到几E flops。

此外,真实数据至关重要。这也是理想做VLA的底气,拥有数百万辆车构建的闭环数据,支持VLA的实现和优化。

对于具身智能,朗咸朋是通过汽车来说明的。

朗咸朋表示,要想做好自动驾驶,必须先把自动驾驶当作完整的具身智能系统对待,每一部分在研发过程中要相互配合才能将价值发挥出来。人类驾驶车辆并不需要特别强的能力,普通人都能学会。但这里讲的普通人,是各部分都能相互协调的正常人。再强的大脑,如果配的是高度近视的眼睛和不灵活的身体,是开不了车的。对于理想汽车而言,重点提到了底盘的例子。底盘VMM(车辆运动管理)模块会对自动驾驶的控制信号做精细化调校,在减速过程中区分卡钳制动和液压制动的使用策略,兼顾安全性和舒适体验,实现“身体” 和 “大脑” 的协同价值。

模型的关键要与整个具身智能系统适配,在此基础上,数据是起决定意义的。在机器人领域获取数据相对困难,但在自动驾驶领域,特别是建立起数据闭环能力的车企来说并不是大问题。理想不仅可以从过去几年积累的10几亿公里的存量数据里进行挖掘和筛选,更可以通过150万车主的日常使用源源不断的获取新的数据。这与用数据采集车做数据是完全不同的,其质量和分布相比真实情况是有很大差距的。另外,在筛选数据过程中,我们也发现很多有趣现象,比如有接近40%的人类驾驶数据都是偏一侧开车的,也几乎不会严格卡着限速值开车。我们认为其实这才是符合人类的驾驶行为,所以并没有刻意删除这些数据样本。大家在使用AD Max时如果发现也有这些行为,那是模型跟各位学习到的习惯。

最后,朗咸朋透露,理想的VLA不仅会服务于现在的理想汽车,还会服务于未来的汽车类具身机器人。但是否会共用同一套技术架构,并未明确提及。

点击查看全文
评论赞0分享
轨迹
人形机器人VLA朗咸朋

欢迎关注我们!

上海恩翌信息科技有限公司
1NE时代-小恩
188-1775-0862
沪ICP备17041240号-4