【E/ETec2023】小鹏姜鸿雷:中央计算平台的趋势和技术挑战

智车引擎 更新于2023-10-16 10:36:03

10月10日,由NE时代(NE Times)和纽伦堡国际博览集团(Nürnberg Messe)联合举办的“E/ETec2023新一代智能汽车电子电气架构技术大会”在上海顺利召开。

小鹏汽车技术专家姜鸿雷受邀参加,并在现场做了题为《智能汽车中央计算平台的趋势和技术挑战》的演讲,《智车引擎》整理了姜鸿雷先生分享的内容,略有删改,以飨读者。

本文福利:分享智能汽车中央计算平台的趋势和技术挑战》PDF,关注“智车引擎”,对话框回复“中央计算平台”下载报告。

以下是讲演实录。

大家好!感谢主办方的邀请,今天想对智能汽车中央计算平台的趋势和技术挑战,谈一下自己的一些看法。

我们知道目前中央计算平台的发展受到多种技术的发展影响,互相融合,面临着许多挑战,这里我简单罗列了四点,今天和大家做一个简短介绍:1.EEA算力集中化。2.车载大算力芯片的挑战。3.通信技术发展。4.大模型、人工智能的影响。

1、EEA算力集中的挑战。

随着整车智能化的发展,以软件定义汽车为目标,EEA需要朝向算力集中化发展,目前大部分厂家演进到以域架构和区架构的阶段,最终向服务化和面向云原生的目标发展。

车载以太网生态至关重要,通过万兆以太网、光纤以太网、非对称以太网等技术将会极大的拓宽车内传输速率,满足高速传感器和海量多媒体数据的传输需求,区控上将集成更多的传感器,进一步降低成本,区控制器上的算力也将向中央计算平台做集中发展。

许多厂家都在做跨域HPC,但目前还是通过内置多个SoC芯片与MCU芯片实现不同功能。随着技术的发展,智能驾座舱与智能驾驶功能将最终由一个SoC芯片支持实现。目前会从功能软件层率先开始融合,软硬件开始初步解耦,比如通过SOA架构的融合。

随着座舱域和驾驶域逐渐走向融合,会逐渐催生出更多的应用场景,由于体系结构的限制,传统的操作系统很可能无法适应这些新兴场景的需求,因此又会催生出一批更新的操作系统。车载OS是实现传统汽车向智能汽车升级的关键。未来汽车中央计算机上将运行着标准化的硬件系统和多核、分布、异构的操作系统及中间件服务,其上运行着各类丰富的应用,横跨座舱、自动驾驶、整车控制等各个领域。整车操作系统将是下一代电子电气架构的核心问题。我们看到许多整车厂,Tier1都已经开始在做相应的布局开发。

目前跨域融合也面临着许多挑战,首先硬件层面就是大芯片的算力,现在的芯片很难能完全满足需求。在软件上,各个系统面临着安全隔离,虚拟化效率的问题。在工程化方面,智驾与智舱的开发体系与测试体系差异巨大。从技术、组织、体系、人员上都存在的巨大挑战。

另外从辅助驾驶到自动驾驶功能的过渡显著增加了对传感器、性能和冗余系统结构的需求,对电子电气架构的功能安全架构设计有更严格的需求。比如制动冗余、电源冗余、通讯冗余、转向冗余、控制器冗余的需求,将会明显提升。从而确保自动驾驶系统能够在各种故障和异常情况下保持安全和可靠的运行。

在中央计算平台的下一个阶段,云原生和虚拟化技术正在成为汽车软件数字化转型的关键技术。虚拟化技术通过一套硬件上运行多个操作系统,有效提升汽车电脑的利用效率,并通过隔离安全关键系统和普通功能的软件执行环境,提高汽车的安全性。云原生技术可以实现汽车软件的微服务化和服务化重构,使软件系统模块化,有利于持续升级和集成创新服务。借助云原生和虚拟化,汽车软件可以实现持续集成和快速迭代升级,真正实现软件定义汽车。

目前许多汽车软件的社区也在推动云原生在汽车上的应用。如SDV group、SOAFEE组织等。比如SOAFEE架构,利用容器的特性,针对每个容器去配置不同的软件跟硬件资源。目前ARM有一些优势,因为大部分的汽车芯片都使用用ARM的IP进行设计,后面如果大家都在用SOAFEE,那么他可能也会成为一个事实上的标准。

2、大算力芯片的挑战

再看车载大算力芯片,随着集成电路的不断发展,逐渐接近物理极限成为一个挑战。摩尔定律已经很难持续,存储墙、功能墙、内存墙等都集约了集成电路的发展。目前行业也提出了许多方案,比如Chiplets 3D封装技术等,Chiplet被业界认为是超越摩尔及敏捷开发的最佳途径,集先进架构设计和先进集成封装技术为一体,进一步提高集成度,突破单片制造极限,解决良率、成本以及上市周期等问题。

去年3月英特尔、AMD等公司联合推出了Die to Die的标准UCIe,我国今年1月也提出了小芯片接口总线技术要求,目的就要是打造一个开放性的Chiplet生态系统。

Chiplet技术产业链涉及整个半导体产业链,将影响到从 EDA厂商、晶圆制造和封装公司、芯粒IP供应商、Chiplet产品及系统设计公司到Fabless设计厂商的产业链各个环节的参与者。通过使用Chiplet技术,芯片设计人员可以根据不同的功能需求,快速组装和重构不同的芯片模块,从而实现芯片的快速开发和迭代。

随着整个中央计算平台系统越来越复杂,目前我们目前也遇到的一些问题,一是半导体供应商对系统理解程度越来越难低,难以满足目前车厂的新平台需求,我们被迫直接找芯片原厂交流,希望半导体厂商做产品设计时,将我们的需求考虑其中。另外,随着芯片的集中度越来越高,功能越加固定,我们做产品开发时能发挥的地方越来越少,很容易同质化,没有核心竞争力。我想这也是目前车厂自研芯片的一个动力。随着Chiplet生态的逐步成熟,其敏捷,易拓展的能力将很容易满足目前车厂定制化的需求,从而将极大的改善目前的情况。

另外,随着汽车智能化的提高,对芯片内存带宽需求也越来越大。主要有两个原因,一是对于端侧的推理来说,实时性很重要,自动驾驶汽车的推理引擎,需要同时处理广泛的输入,比如视觉,激光雷达,雷达、超声波、惯导、卫星导航等数据,需要同时处理的数据越来越大。另外就是推理模型愈加复杂,特别是对于大型Transformer模型,内存是一个主要挑战,模型需要大量数据,通常受到内存容量和带宽的限制。根据目前的情况据美光评估,到了L3级,至少需要200GB/s,而到了L5级,系统将需要超过500GB/s的带宽。这对芯片架构,硬件设计都带来的了巨大挑战,我们看到特斯拉已经开始使用GDDR6产品了。

新算法的出现,新的需求,也在推动底层芯片架构的创新。目前深度神经网络处理器主要可以简单分为四个种类:指令集、存内计算、数据流、可重构的加速器。数据流、可重构的深度网络加速器也可看做近存计算的一种。存算一体技术将是大模型时代的一个重要的发展方向。

根据阿姆达尔定律,想要获得更好的AI加速,相较于GPGPU实现的方式,存内计算具有显著的优势,存内计算的数据搬运量大幅下降,有效算力密度线性增长。有效改善内存墙问题。

目前许多厂家都在向存算一体或近存计算寻找新动能,比如英伟达大算力芯片Thor,GPU采用Hopper架构,其内部增加了一个张量存储器加速器TMA,线程块之前可以直接共享数据,而不需要片外的DDR共享数据,数据不再需要读写操作。AMD最新大算力芯片也使用了近存计算。三星和海力士也推出了存内计算芯片,生成式AI在三星的HBM-PIM上可以提升2.33倍。LPDDR-PIM可以带来系统性能提高4.5倍和72%的功耗节省。SambaNova通过可重构架构,由八个芯片组成的节点能够支持多达5万亿个参数的模型,远超GPT-4,而使用标准GPU至少需要数百个芯片,SambaNova的成本不到行业标准方法的1/25。随着成本的快速下降,或许目前的大模型在未来也将变成一个中小模型了。

另外就是CXL互联技术,CXL技术的引入解绑了计算和内存,突破了内存带宽和容量的限制。CXL让系统可以用异构处理和内存进行扩展,所有设备都通过一致的机制来使用共享的内存空间。CXL近存处理技术充分利用CXL接口,可提升存储器的使用效率,轻松实现容量扩展。三星使用相同数量的设备对GPU和CXL-PNM进行端到端性能评估,与A-GPU相比,CXL-PNM的能效提高了2.9倍,吞吐量降低了10.8%,多个CXL-PNM可以提供比多个GPU高4.4倍的能效和153%的吞吐量。

今年ISSCC上AMD提出了系统化创新的概念,将多种技术多个环节协同设计提高芯片性能,比如存算一体、芯粒、3D封装,互联等技术同步使用,可以带来数量级的效率的提升,从而抬高AI大算力芯片的发展天花板。AMD将多种技术融合推出了MI300X芯片,单个芯片可以运行高达约800亿个参数的模型。

3、通信技术的影响

随着5G RedCap技术的落地,进一步降低了终端成本,随着成本和功耗问题的解决,5G网络也将快速铺开,工信部也提出了要在2025年实现县级以上城市5G RedCap规模覆盖。对于许多车企采用5G车机对成本控制仍然挑战巨大,RedCap既能满足车企对成本控制的需求,又能满足车联网业务低时延、高性价比的需求。

5G核心网的架构从传统的集中式部署转化成分布式的部署,5G核心网架构的变化,使软件定义网络(SDN)和网络功能虚拟化(NFV)成为可能。5G网络建设为算力网络奠定了云和网融合的底层技术基础,高效算力网络,具备了联网、云网与算网三个方面的技术元素。

端侧的硅基芯片总是有性能、成本、功耗几个影响,随着对算力黑洞不断的需求,需要网络化的算力来做平衡,随着技术的成熟,算力网络的建设,将使得端边云算力的分布普及开来。

中国算网一期从2022年到2025年,目前正在建设中,算力网络的建设目标是推动算力像水电一样,一点接入、即取即用。算力网络和云原生技术是一个完美的结合,使用弹性的算力实现更高效快速的迭代。

以软件定义为基础,中国计算机协会提出了泛在操作系统。随着通信技术的发展,通过软件手段对目前互联网操作系统的能力进行扩展、提升。

泛在操作系统对特定应用场景的“人机物”融合需求和复杂系统,提供具有相应场景的统一计算资源抽象管理和应用开发运行支撑能力。将人类社会、物理社会、信息系统融合到一起。

2023年2月,中国汽车工程学会、中国计算机学会与国家智能网联汽车创新中心共同筹备车用操作系统与泛在操作系统联合实验室。将交通基础设施、道路基础设施、信息基础设施融与一体,打造一个车路云一体化融合控制系统。融合泛在计算、泛在操作系统的理念,推动车路云一体化建设和智能网联汽车产业发展。

下一代的6G感知通信计算一体化网络架构会带来感知能力、通信能力、计算能力与AI 能力。这些基础服务能力将一步支持人机交互、智能体交互实现更高层次的综合应用。

“能力无所不及,连接无所不达,算力无所不在”,这是下一代通信网络的一个目标。随着统一算力底座,将为社会提供一个新型的信息服务的能力。

4、人工智能的影响

上面谈到的EEA,大算力芯片和通信技术,在网计算等其实都是为汽车中央计算平台提供一个强大的算力基础,满足深度神经网络的发展需求,推动智能汽车下一阶段的发展。

从去年开始,ChatGPT这种大模型的发展,展示了通往AGI的一种可能性。人工智能进入了2.0阶段。

Forrester将合成数据和强化学习、Transformer网络、联邦学习、因果推理视为实现AI 2.0的五项关键技术进展,解决AI 1.0所面临的一些限制和挑战,诸如数据、准确性、速度、安全性、可扩展性等问题。

我们看到一些厂家已经将大语言模型上车,开始做下一阶段人机交互的探索,智能汽车上有非常多的应用场景,智能汽车是大模型落地的一个绝佳载体。

先从智能座舱看,目前智能座舱的交互方式主要向几个发展方向,跨设备分布式交互、沉浸式无感交互、多模态情景感知交互。

大模型将会带来更加沉浸的无感交互。生成式AI除了生成文本还可以做下一代的渲染工具,生成图像、视频等。

我们借助大语言模型,人类第一次具备了机器直接沟通的方式,带来更加自由的语音对话。

通过下一代渲染工具,结合整车的XR技术,可以为用户提供个性化、逼真和交互性的体验,配合车内的空间音频,多种智能传感器,执行器,将带来更加沉浸式的体验。还可以利用三维生成的能力,可以实时渲染车内3D场景,跟人进行实时交互。

长期来看,多模态的无感交互将带来更大的变革,随着多模态大模型的发展,多模态AI能够处理和理解多种类型信息的人工智能,如文本、图像、音频、视频等。在不同数据类型间建立联系和融合,从而实现一个综合、全面的理解多模态。在5-10年内沉浸声场、气味模拟、触觉反馈、肌电接口、情绪感知等技术会得到广泛应用。

人机交互的路径,将从现在用户记忆搜索应用和用户界面的模式,转换到机器主动感知和推送服务,极大缩减交互路径的模式。机器从被动应答者向主动服务者角色转变,交互从单一显式的用户动作表达向隐性的机器智能推理与显式用户表达融合方向发展,在恰当时间与情境下提供用户迫切的智能服务成为必然发展趋势。

在智能驾驶方面,目前绝大部分厂家在感知融合方面已经形成了一个最佳实践-BEV鸟瞰视角。下一阶段大家通常认为都是感知决策一体化,端到端的解决方案。如果将多模态大模型应用于自动驾驶,使其具有更接近人类的感知和理解能力,将大幅提高自动驾驶的能力。

目前行业内许多厂商已经开始利用生成式AI进行困难场景的生成,利用大模型进行重构3D环境、预测路径规划、解释自动驾驶的动机,可以提高自动驾驶的安全性、可靠性和可解释性。

以大语言模型为核心的AI智能体,将使智能汽车成为你的专属助理,从用户适应产品到产品适应用户,每个人都可以拥有一个专属的L3/L4智能驾驶汽车,它还可以帮你预定机票、规划路径等等,提供个性化的专属服务。

大模型是一个比较大的系统工程,对车厂来说,数据收集、算法、集成、安全和隐私保护、持续更新和维护都是新的挑战,需要从主机厂从制造行业向科技公司做一个转变。

智能汽车是新技术革命的最佳载体。大数据、区块链、算力网络等都可以在上面做落地。所以对车厂来说,许多跨领域的融合对车厂提出了更高的要求,如何把这些技术用好、整合好,对组织架构、人力都是比较难的一个事。如果最终实现,将给全社会带来一个巨大的变革。

最后感谢大家。今天时间有限,只做了简单的介绍,如果后续想进一步沟通,欢迎会后与我联系。最近我有一本新书也出版了,大家感兴趣的话可以在签到台了解。谢谢大家。

总共0条评论

轨  迹 
NE原创
NE资讯
NE智能车
NE数据
NE活动

快讯

欢迎关注我们!

版权所有  :上海恩翌信息科技有限公司

联  系   人 :NE时代 Rela

联系电话 :159-0182-4655

备案许可号 :沪ICP备17041240号-4