契机、博弈与破局之道。
在人工智能技术飞速迭代的当下,产业跨界融合已成为推动创新的核心动力。其中,智能汽车产业向具身机器人领域的迁移,既是技术演进的必然结果,也是市场需求的客观选择。
11月27-28日,“2025人形机器人关节模组产业链大会” 在杭州盛大召开,作为协办单位,NE时代也分享了自身对于具身智能的思考。
NE研究院智驾首席分析师刘嘉俊发表了关于《智能汽车产业向具身机器人产业迁移的困难与挑战》的演讲。在演讲中,刘嘉俊从产业逻辑、技术对标、现实挑战与市场趋势等多个维度,系统剖析了这一迁移过程中的核心问题。
本文将基于其演讲核心内容,深度梳理产业迁移的底层逻辑,解构技术与市场的双重博弈,并探寻企业破局的关键路径。
▍如需领取发言报告,请在文末联系编辑微信。
01.
汽车产业为什么都在做具身?
刘嘉俊认为,智能汽车与具身机器人的跨界融合,并非偶然的市场选择,而是人工智能技术发展到特定阶段的必然产物。两者共享AI技术主线,具备天然的产业协同性,而市场增量空间与企业自身优势,则进一步加速了这场迁移浪潮。
首先,人工智能的发展历程,直接决定了智能汽车与具身机器人的诞生节奏。
从1930年至1980年,人工智能处于符号智能与统计学习的早期阶段,此时的技术核心依赖规则设定与统计模型,虽未催生出真正意义上的智能化产品,但为机器人产业奠定了自动化基础——工厂中广泛应用的机械臂,便是这一阶段的典型成果。而汽车产业在这一时期,仍以燃油车为主导,与人工智能的耦合度极低,本质上是机械工业的延伸。
随着人工智能从统计学习时代向深度学习时代跨越,卷积神经网络(CNN)与Transformer架构的出现,让 AI 具备了更强的感知与决策能力。这一技术突破成为两大产业升级的 “催化剂”。
在汽车领域,AI 与电池、电驱、电控等硬件技术深度融合,推动传统汽车向智能汽车转型,L2/L3 级自动驾驶的规模化应用便是最直接的体现;在机器人领域,深度学习与灵巧手、高精度电驱、高能量密度电池等技术结合,催生了具身机器人的热潮,使其从单一自动化设备升级为具备自主感知、决策与交互能力的智能体。
随着 AI 技术向空间智能、物理 AI 的进一步演进,两大产业的发展边界持续拓宽。智能汽车未来会向 L4/L5 级全场景自动驾驶迈进,而具身机器人则从单一场景应用向泛场景适配演化。这种技术同源性,构成了汽车产业向具身机器人迁移的核心基础,两者本质上都是 AI 技术与硬件工程的集成产物,共享相似的技术底层逻辑。
除技术协同外,具身机器人市场的增量潜力,是吸引汽车企业入局的核心动力。
“2025年至2029年,具身机器人市场仍处于培育期,市场空间远未达到预期峰值。”刘嘉俊给出了更为理性的判断,当前具身机器人尚未在全产品生命周期内实现成本低于人力的核心优势,无论是To B的工业场景还是To C的消费场景,都缺乏规模化应用的基础。
真正的市场拐点或将出现在2030年。一方面,技术层面(比如机械结构、算法等)将逐步走向稳定;另一方面,市场层面将完成第一轮洗牌,低效玩家被淘汰,优质企业实现场景落地与成本控制的平衡。
这一周期判断,与自动驾驶产业的发展规律高度契合。自动驾驶同样经历了「泡沫期-衰退期-重启期」的波折历程,直到第二轮启动才真正迈向规范化的场景应用。
根据NE时代估算,随着技术成熟和应用场景陆续明确,中国具身智能人形机器人市场预计将在2035年达到14620亿元规模。
02.
车企与零部件供应商的集体迁徙与竞争格局
当前,具身机器人领域已形成三类玩家(车企及零部件企业、人形机器人初创公司、科技巨头)的竞争格局,其中汽车产业背景的玩家占据重要地位。
从主机厂来看,小鹏、小米、广汽、比亚迪等企业纷纷通过自建、合资或投资等方式布局具身机器人,就比如小鹏发布的“走猫步”人形机器人,其市场关注度甚至超越了新车型,成为车企跨界的标志性事件。
从零部件供应商来看,迁移趋势更为明显。地平线孵化了地瓜机器人,汇川技术、速腾聚创等汽车产业头部供应商也纷纷加大对具身机器人的投入。
刘嘉俊表示,更值得关注的是人才流动的趋势。当前多数初创机器人公司的CEO、CTO等核心管理层,均来自智能驾驶领域,成为连接两大产业的桥梁。
这种集体迁徙的背后,是汽车产业在智能化转型后,寻求新增长曲线的战略考量。随着智能汽车市场竞争日趋激烈,具身机器人成为车企拓展技术边界、开辟第二增长曲线的重要方向。
车企与零部件供应商入局具身机器人,并非盲目跨界,而是具备两大核心优势,构成了其竞争壁垒。
在需求端,应用场景的清晰度是汽车企业的首要优势。
与人形机器人初创公司四处寻找落地场景不同,车企与零部件供应商本身就具备天然的应用场景。比如在自有工厂内开展搬运、分拣等场景的试点,基于真实场景,通过自研自用快速优化迭代机器人性能;同时,未来具身机器人还可部署于 4S 店,面向消费者等等。
在研发端,技术泛用性进一步降低了迁移门槛。
具身机器人与自动驾驶在算法、芯片、传感器等核心技术上高度同源。比如蔚来、小鹏、理想等车企的自研芯片,地平线、Momenta等企业的算法与芯片一体化方案,均可无缝迁移至具身机器人领域。这种技术复用性,让汽车企业无需从零开始搭建研发体系,大幅缩短了产品研发周期,降低了研发成本。
此外,汽车产业百年积累的供应链整合能力、硬件研发经验,也远非初创机器人公司或科技巨头所能比拟。汽车作为高度集成化的产品,其供应链管理、成本控制、可靠性设计等能力,可直接复用于具身机器人的研发与生产。
但是,短板同样突出。人形机器人作为跨领域赛道,相关专业人才储备相对稀缺,成为技术突破的重要制约;另外,车企普遍存在组织架构庞大、决策链条较长的问题,相较于创业型企业,转型灵活性不足,产品迭代速度可能处于劣势,面临 “大象转身” 的困境。
以智元、宇树、优必选为代表的人形机器人初创公司,核心竞争力集中在技术深耕与迭代效率。自成立之初便聚焦具身智能与机器人研发,技术栈垂直且目标明确,在核心算法(如运动控制、人机交互)、产品原型打磨上形成了差异化优势;同时,轻量化的组织架构使其能够快速响应市场变化,产品迭代速度远超行业平均水平。
然而,初创公司的发展受制于两大核心瓶颈。一是应用场景高度依赖外部合作,缺乏自主可控的落地场景,场景拓展与商业化验证需依赖与其他企业的协同,成为制约其规模化发展的关键;二是抗风险能力较弱,相较于车企和科技巨头,资金储备有限,面对研发投入高、回报周期长的行业特性,可持续经营压力较大。
腾讯、百度、字节跳动、阿里、美团等科技巨头的优势集中在三大维度。一是大模型研发积累深厚,早年间便布局云端训练与算法优化,比如百度旗下文言一心、阿里的千问等大模型为具身机器人的智能交互、环境理解提供了核心技术支撑;二是生态构建能力突出,可依托现有产业生态整合上下游资源,快速联动生态内企业推出相关产品;三是C端用户粘性强劲,通过视频、支付、社交等高频应用场景,能够精准把握消费者需求,快速孵化符合C端市场需求的人形机器人产品。
但科技巨头的短板在于硬件领域的积淀不足,长期聚焦软件与互联网服务,在硬件制造、硬件整合与供应链管理上缺乏足够经验,成为其切入人形机器人赛道的核心制约;此外,需通过外部合作或自主补短板的方式突破硬件瓶颈。
“三类玩家各有优劣、各擅其长,目前尚无绝对的行业领导者。”刘嘉俊认为,未来,具身机器人行业的竞争将围绕技术互补、场景争夺、生态协同展开,各类玩家需针对性弥补自身短板,通过跨界合作、技术并购等方式强化核心能力,行业竞争格局有望在多元博弈中逐步清晰。
03.
技术维度的同与不同:从规避碰撞到主动交互
智能汽车与具身机器人虽共享AI技术底座,但由于应用场景与核心需求的差异,两者在技术实现层面存在显著不同。这种差异要求汽车企业在迁移过程中进行技术能力的重构,而非简单的复制粘贴。
在核心技术体系上,两者存在两大显著相似点。
一是算法演进路径的一致性。无论是智能汽车还是具身机器人,其算法均经历了“分布式小模型/分布式大模型/端到端模型/VLM/VLA/ 世界模型”的演进过程。
二是数据体系的相似性。两者的训练数据均由真实数据与仿真数据构成。在智能汽车领域,主机厂通过回收车辆运营数据获取真实路况信息,同时借助仿真平台生成海量仿真数据,用于算法训练与优化;在具身机器人领域,企业同样通过遥感技术收集真实场景数据,特斯拉等头部企业则搭建了专门的仿真平台,生成多样化的场景数据以弥补真实数据的不足。
两者最核心的差异在于场景定义与交互需求。
智能汽车的应用场景主要是结构化或半结构化的道路环境,其核心需求是“规避碰撞”。尽管道路场景中存在路人横穿、逆向行车等特殊情况,但这类 Corner Case 的发生率相对较低,算法通过规则预设与数据训练能够实现有效应对。
具身机器人的应用场景则呈现出绝大多数非结构化的特点,其核心需求是“主动交互”。需要与物理世界的物体、人类进行深度互动,完成搬运、操作、服务等具体任务。这些 Corner Case 的复杂度与发生率远超道路场景。这就要求具身机器人的算法不仅要具备环境感知能力,更要理解物理世界的力学规律、人类社会的行为规则,具备自主决策与灵活应变的能力,其技术难度远超自动驾驶。
在硬件层面,具身机器人比智能汽车增加了灵巧手这一核心部件,使得硬件系统更为复杂。
在算力需求上,两者也存在显著差异。智能汽车的端侧算力集中在500~1400TOPs,而具身机器人的端侧算力目前虽相对收敛,目前集中在200~700TOPs,但训练侧的算力需求远超汽车领域。根据NE时代的调研,具身机器人的训练算力需求是自动驾驶的十倍甚至更高。
这意味着,汽车企业在布局具身机器人时,不仅要解决端侧算力的适配问题,更要应对训练侧巨大的算力消耗,这对芯片技术、功耗控制、成本优化提出了全新挑战。
04.
汽车产业入局具身机器人的“迁徙之困”
尽管具备技术、场景与供应链优势,但汽车企业向具身机器人领域迁移,仍面临多重结构性挑战。
其一,具身大模型算法与目前自动驾驶算法存在差异。
与智能驾驶 “规避碰撞” 的简单目标不同,具身机器人需要实现 “主动交互”,这要求大模型具备理解物理世界、人类行为等综合能力。
从LLM到VLM再到具备理解3D空间中不同物体的几何比例关系与位置距离信息,对于具身智能机器人最后一个核心环节是嵌入模型的机器人需要与外部世界的物体发生真实的物理交互。
正如宇树科技王兴兴所言,当前具身大模型的发展水平,是制约具身智能产业进步的最大瓶颈。而其持续演进离不开大量资源投入与快速迭代更新的支撑。
其二,分层模型与一体化端到端模型的选择困境
智驾领域的模型架构已完成从分层独立模式到一体化端到端方案的关键演化。三四年前,智驾系统的感知、规划、控制模块均由独立小模型承载,各模块各司其职、协同运作;随着技术迭代,特斯拉率先提出端到端模型理念,国内智驾企业随后纷纷跟进这一演化方向。然而,端到端模型在实践中仍面临训练难度高、算法不可解释性等核心问题。
这一演化逻辑进一步延伸至VLM/VLA及世界模型相关领域,具身智能领域目前呈现类似的发展特征。多数方案在认知推理规划层面采用大模型架构,而运动轨迹控制等环节仍依赖小模型完成。从行业动向来看,特斯拉等头部企业正推动技术向全链路端到端大模型方向演进,预示着具身智能领域可能迎来进一步的架构整合。
“这种模型架构的选择并非存在绝对的对错之分,其核心争议在于适配性时间节点,当前阶段的最优解未必适用于未来,而面向未来的技术路线在当下可能面临落地挑战。”刘嘉俊表示,对于源自汽车产业的算法企业而言,如何在分层模型的稳定性与端到端模型的前瞻性之间做出平衡,成为布局具身智能领域时必须面对的核心决策难题。
其三,具身人型机器人训练数据不足、数据采集难度高。
数据是约束具身智能技术突破和落地应用的关键因素。具身智能训练过程本身依赖海量数据供给,涵盖真实数据与仿真数据两大类别,二者各有优劣。要实现具身技术的落地与优化,数据的规模与质量是核心前提,必须予以攻克。
当前,具身智能数据的采集方式已形成多元路径。遥感操作数据是目前应用较为广泛的主流方案;视频学习、增强现实等技术的应用则相对有限。而仿真合成数据成为行业重点布局方向,特斯拉等头部科技企业均在该领域持续投入。从长远来看,具身机器人自主探索并生成训练数据的模式具备发展潜力,但目前仍处于较为遥远的阶段。
因此,当前具身智能的核心数据供给,主要聚焦于真实数据与仿真数据两大方向,二者呈现互补性优势。
真实数据的核心优势体现在数据真实性、闭环反馈完整性以及边缘场景捕获能力上,这是仿真数据难以替代的;但同时也存在明显短板,如采集成本高、规模化拓展难度大、数据标注门槛高等问题。
仿真数据的优势同样突出,在采集效率、规模化供给能力以及数据标准化质量等方面,均表现出适配训练需求的特性,能够显著提升训练效率;然而其局限性也不容忽视,在虚实场景的适配差距、算力消耗等方面,存在较高的技术要求与性能损耗。
其四,具身大脑算力需求增长不确定。
刘嘉俊坦言,自动驾驶产业的发展历程,揭示了一个残酷的现实。算力需求的增长速度,远超早期行业预判。七八年前,行业内普遍认为1000-2000TOPs即可实现L4/L5级自动驾驶,但如今L3级车型的算力已达1400TOPs,特斯拉HW5.0芯片更是朝着2500-3000TOPs迈进。
这一规律,极有可能在具身机器人领域重演,预计也会跟智驾产业相同在未来出现算力井喷增长。当前,行业对具身机器人的算力需求尚无明确答案:到底需要多少算力,才能支撑泛场景应用?
而具身大脑算力需求增长不确定原因包括具身机器人整体架构不确定、具身算法路线未固化、数据难迁移、实时性与功耗矛盾等,仍需突破诸多技术瓶颈。
05.
产业周期的镜鉴:从自动驾驶看具身机器人的未来
“具身智能的产业发展规律,大概率将复刻智驾过去十年的演进逻辑。”刘嘉俊表示,具从智驾产业的发展历程来看,其经历了三大关键筛选周期,每个周期的核心考验与市场格局变化形成鲜明对应。
第一阶段为“百花齐放后的量产能力筛选期”。早期智驾行业曾涌现百余家企业,但多数仅能完成技术demo演示,在对接主机厂项目时,普遍面临从demo到量产的转化难题,且难以在苛刻的成本约束下实现企业良性运营。最终,具备量产落地能力与成本控制下运营能力的企业得以留存,大量中小企业如知行者等逐渐淡出市场。
第二阶段为“C端落地后的技术路线抉择期”。随着高速NOA技术进入市场并走向C端,行业竞争的核心转向技术路线选择。企业能否精准判断并押注正确的技术方向,避免前期投入打水漂,成为这一阶段的关键筛选要素,进一步加速了行业洗牌。
第三阶段为“低成本优质产品供给期”。当前智驾行业的核心考验聚焦于 “功能体验一致前提下的低成本产品打造”,市场格局持续浓缩,从百余家企业逐步精简至一二十家,最终形成仅5-6家核心企业主导的竞争格局。量产能力、技术路线判断力与成本控制能力,共同构成了这一阶段的核心生存壁垒。
基于智驾产业的演进逻辑可推导出,具身智能企业若想在产业竞争中存活并发展,需具备三大核心能力:一是demo到量产的落地转化能力,二是正确技术路线的判断与选择能力,三是面向C端、B端及各类应用场景的低成本优质产品供给能力。唯有满足这三大要求,才能在产业迭代中脱颖而出。












沪公网安备31010702008139