2025年是小鹏阶段性成功的一年,全年交付量接近43万辆,同比增长126%,创历史新高。海外交付4.5万台,同比增长96%,覆盖全球60多个国家和地区。同时推进三个海外基地的建设,分别位于欧洲的奥地利、印度尼西亚和马来西亚。更为关键的是,小鹏汽车在2025年预计将实现单季度首次盈利(目前四季度数据未公开,3季度为近5年单季最低亏损)。前三季度营收合计突破54亿元。尤其是与大众的合作,为小鹏汽车贡献了极高的利润率。
这些都为小鹏汽车2026年的完美开局奠定了坚实的基础。
2025年11月,在三季度电话会议上,何小鹏给小鹏确定了一个新定位,“公司新的十年愿景是让小鹏汽车成为面向全球的具身智能公司”。而自动驾驶汽车便是物理AI最快应用的载体。
作为同行,何小鹏对特斯拉FSD赞誉有加。在体验FSD V14时,何小鹏感觉到“震惊”。因此何小鹏和刘先明打了一个赌,要在2026年8月30日,让小鹏的智驾水平在中国复杂道路的环境下,做到甚至超越特斯拉FSD在美国硅谷的表现。
01.
第二代VLA,领先友商5倍;未来将打通座舱
在2024年初,小鹏在研发端到端模型时发现,即何小鹏提到的第一代VLA,依赖小参数模型(参数量仅有0.5B)+Rule-base兜底的智驾系统本质上是一个“缝合怪”。绝大部分的小模型仍然以数字世界和语言为导向,而不是以物理世界的真实表象和连续运动为主,导致模型转换效率极低。虽然这类方案在高速、城区主干道上的表现很好,但在面对小路、封闭园区、断头路或地下停车场等复杂场景中,适应性较差。并且在行驶过程中,时不时会重度刹车,体验较差。
因此何小鹏和刘先明决定推倒重来,放弃第一代VLA的研发,直接研发第二代VLA。
第二代VLA有个非常重要的特征就是拆掉了“L”,因此其本身更接近VA模型。
为了解决拆除语言模块后推理能力的空白,小鹏在开发过程中进行了几大底层创新。
一是引入世界模型。通过世界模型进行生成(Generation)和扩散(Diffusion),去推演和预测未来的场景(比如生成接下来的视频画面或BEV鸟瞰图)。
二是采用隐空间思维链(Latent COT)。由于视频内容太大、太杂,因此推理过程都需要通过思维链(COT)中间环节。在传统的文本大模型中,COT是通过文字来展现模型的思考能力,小鹏拆除了语言之后,将其也替换成了Latent COT。Latent COT是指让模型在内部隐状态中完成推理,而不输出具体的文本。就像人类思考过程一样,比如人类看到一张照片,眼睛虽然捕捉到的是像素点,但大脑并不会记住每个像素点,而是直接总结图片内部,比如“有个红色的车在路上”、“天是蓝色的”等。该方式最大的优势是推理效率快。
三是不再生成离散的语言token,而是直接输出连续的物理动作(action)。
总结来看,小鹏借助世界模型学习世界如何演化,而非生成视频。同时在隐空间中进行推理,把关键特征提取出来。最后直接输出联系的物理动作。
即便如此,小鹏第二代VLA的参数量要远超目前的小模型,达到约20B。
对于第二代VLA的表现,何小鹏非常满意。一方面是场景能力的提升,更重要的是拟人能力的改善。何小鹏称之为“妈妈也安心开”,更是直言,领先友商5倍。
除此之外,小鹏正致力于将二代VLA与VLM打通,预计将在2026年的某个时间点发布。打通之后,相关的数据处理完全可以在本地运行,系统可以实现无延迟或极低延迟的车辆操作指令响应,尤其是通过与座舱交互控制辅助驾驶系统。比如在高速跟车时,用户可以直接说,“小P,我不要跟着这个大车,进行超车”,或者当系统识别前方封路时,会主动告诉用户,“你好,前方封路,我帮你换一条路”等。
值得一提的是,特斯拉Grok已经实现上车,但与FSD依旧是两套独立的系统
今年二月,小鹏完成一次组织升级,将自动驾驶中心与智能座舱中心合并,成立“通用智能中心”,在公司组织层面为舱驾模型融合铺平道路。
02.
云端工厂,一天迭代4个版本;图灵芯片,一颗顶10颗Orin-X
模型能力的持续提升,一方面依赖于云端的训练,另一方面则依赖车端芯片算力。
刘先明提到,短短几个月中,小鹏第二代VLA就已经更新了468版模型,平均每天接近4个版本。虽然何小鹏对于云端投资并不吝啬,但刘先明还是将云端的利用率用到极致。单颗GPU的训练效率从每秒0.1个训练样本提升到1.11个,整体效率提升10倍。单个GPU的利用率从早期的40%提升至90%。
除此之外,云端工厂储备了极高的数据密度,单次训练的云端高质量数据达到50PB的规模,在实际运行过程中,云端模型每天消耗约58.8万个Token,数据处理量相当于真实数字世界消耗量的80倍。
对于为什么坚持自研芯片,做软硬一体,何小鹏明确指出,仅仅依靠购买第三方的芯片,是不可能把算力的潜力完全挖掘出来。这也就意味着,芯片不能只看名义算力,还应关注有效算力。
小鹏图灵芯片采用7nm工艺,单颗算力为750TOS,是英伟达Orin-X的3倍(此前,小鹏大规模量产应用)。但在有效算力方面,可以达到英伟达的10倍。为此,小鹏通过底层硬件架构、专属AI编译器和底座模型结构的“三位一体”方式来实现。
在这种自带芯片、自带编译、自研量化、自研基础架构(Infra)、自研模型的全面自研下,小鹏将芯片的实际利用效率从通用芯片+开源模型的22.5%大幅提升至82.5%。
除此之外,第二代VLA模型通过蒸馏之后,同样将会在小鹏过去英伟达Orin-X的车型上实现应用。
03.
产品大年,全面出击,走向全球化
第二代VLA之外,小鹏还构建起一车双能的动力体系,即增程、纯电共用一套电驱系统,支撑新车型的快速投放。
2026年全系乘用车将换装图灵芯片,共推出三个配置。MAX版本搭载1颗图灵芯片,S1版本搭载2颗图灵芯片,Ultra版本搭载3颗图灵芯片,总算力达到2250TOS,以支持舱驾模型融合。小鹏X9为首款搭载图灵芯片和第二代VLA的车型。
除此之外,小鹏Robotaxi车型将在2026年推出,将在广州开启无安全员的无人化商业运营,将搭载3颗图灵芯片。人形机器人IRON同样将搭载3颗图灵芯片。
何小鹏强调,2026年将用产品矩阵去争夺每一个核心细分市场,一季度将推出3款超级增程产品。
总结.
国内新势力企业中,小鹏一直是最像特斯拉的公司。虽然在过去车型的销量中有所起伏,但小鹏从未放弃追赶特斯拉的脚步。如今,已经无需为“温饱”发愁的小鹏,能否在今年8月30日超过特斯拉FSD能力表现,我们拭目以待。












沪公网安备31010702008139