2025年7月22日,在第八届智能辅助驾驶大会上,华为技术有限公司昇腾智能汽车&机器人领域产品总监黄梓亮指出,随着数据量激增和模型复杂度提升,算力成为车企竞争的关键。智能辅助驾驶系统从模块化端到端向大模型过渡,参数规模从百万级增长至百亿级,数据处理量达PB级/天,训练节奏加快至天级迭代。这些变化对云端AI算力提出更高要求,预计2028年中国汽车云端AI算力需求将达100EFLOPS。
针对行业需求,通过MindSpeed、Driving SDK等工具,华为昇腾实现多模态大模型训练加速,性能领先国内友商,并支持快速迁移开发。同时,其高可用架构确保千亿参数模型40天长稳训练,故障恢复时间小于10分钟,为智能辅助驾驶业务提供稳定可靠的算力支持。昇腾赋能乾崑智驾,通过澎湃算力和软件使能,联手打造业界领先的智能驾驶辅助ADS系统。同时,昇腾期待联手生态伙伴,为车企提供智能化解决方案,赋能智能汽车AI发展。
黄梓亮|华为昇腾智能汽车&机器人领域产品总监
以下为演讲内容整理:
智能驾驶业务趋势
随着技术逐步落地,L2及L2+级别辅助驾驶的渗透率持续提升,预计今年将达到80%。由此带来以下变化,其一,模型架构由模块化向一站式演进,并进一步发展为VLM、VLA架构,模型参数规模突破PB级;其二,数据采集方式从传统模式转向百万级量产车与AIGC生成数据相结合,训练数据量提升至每日PB级;其三,受市场竞争加剧影响,训练迭代周期从周级缩短至天级。未来,随着L3、L4级自动驾驶政策的落地实施,技术发展将推动厂商向端到端及VLA技术路线转型,这些转变对数据规模与迭代效率提出了更高要求,算力将成为车企竞争的核心要素。
图源:演讲嘉宾素材
我们预测到2028年中国汽车行业云端AI算力需求增量将达100 EFlops。基于L2、L2+向L3级智能驾驶训练的发展路径,可得出结论,需实现十倍规模扩张、十倍可靠性提升及终极迭代能力,同时处理百倍级数据量,方能优化辅助驾驶算法并在市场竞争中占据优势。因此,算力供应的稳定性与持续性将成为关键保障。
无论是E2E模型还是VLA模型,均对算力规模及网络性能提出了显著要求。以VLA模型为例,预计需实现10万张计算卡的部署与调度。
高效的数据挖掘与标注验证是构建智能驾驶数据闭环体系的基础。一是在数据挖掘方面,当前已积累海量数据,而多模态大模型的数据生成过程需依托高性能AI算力平台支撑;二是在数据标注环节,传统手工标注方式在准确性与一致性上已无法满足端到端辅助驾驶算法需求,同时路测验证难以覆盖全部危险场景。因此,需具备高性能AI场景生成能力以提升测试场景覆盖率。
总体而言,智驾大算力集群的建设与使用,对架构设计、运行效率、资源调度及生态协同提出了更高要求。面对千卡、万卡级集群规模,需确保主干网络具备高扩展性与卓越性能,同时实现故障快速监测与高可靠性恢复。在训练推理效率层面,应追求高性能计算与高速通信能力,并构建良好的生态体系以支持业界主流模型。
鉴于各车企已部署大量GPU、NPU等多元算力资源,需建立统一的训推资源管理体系,实现异构资源的协同调度与高效利用,最终达成系统高可靠性目标。针对算子开发、精度定位及性能调优等环节存在的技术难点,应提供开源融合算子参考方案,实现精度自动检测与业务无中断调优。此外,需与主流框架生态深度适配,确保系统开箱即用。
昇腾智能驾驶解决方案
昇腾AI秉持软硬件协同的全栈开放理念,为国内市场提供第二算力选择。其技术体系覆盖基础处理器、Atlas系列服务器与集群、CAN计算架构及AI框架MindSpore,全面对标国际主流厂商的技术标准与生态体系。通过底层软硬件全栈兼容能力,昇腾AI已实现万卡级集群与万亿参数模型训练支持,具备40天持续运行不中断的稳定性,并达成95%故障在10分钟内响应恢复的可靠性指标。在生态开放方面,系统全面支持业界各类框架加速库,适配100+基础模型,配套全流程工具链,可实现主流场景算法的快速迁移部署。凭借软硬件协同优化,我们的性能指标达到国内外行业领先水平。
自2018年华为发布全场景全栈AI技术以来,持续深耕人工智能领域,昇腾AI始终坚定投入AI产业建设。近期,我们推出超节点集群架构及智驾Drive SDK等新一代技术解决方案,进一步拓展AI技术应用边界。
昇腾AI算力全面覆盖智能驾驶训练、标注、脱敏等全业务流程。在训练场景中,我们推出Atlas系列训练服务器,可支撑大模型规模化训练需求;针对中心推理及数据预处理标注环节,提供Atlas 800I A2等推理服务器解决方案。
面向智能驾驶预训练与后训练场景,昇腾构建了高可靠、高可用、高易用的AI训练体系。该体系采用自上而下的技术架构:通过分布式加速套件MindSpore、智驾专用训练SDK、AI框架及芯片使能层,结合集群硬件基础设施,配套全流程开发工具链MindStudio与集群计算自动化引擎CCAE的智能运维,实现了性能、可用性与易用性的协同优化。其中,硬件轻量化设计与Transformer架构性能已达到或超越行业平均水平;高可用性方面,大规模集群平均修复时间控制在30分钟以内;高易用性层面,算子开发与模型迁移效率显著提升;在大规模集群部署中,算力、存储与网络的协同效率保持行业领先。
图源:演讲嘉宾素材
面向智驾不同发展阶段的技术需求,昇腾AI提供分层化的开发支持方案。针对模块化端到端架构,推出Driving SDK开发套件;面向座舱多模态交互及一体化端到端VLM/VLA架构,除提供专用SDK外,还发布MindSpeed多模态套件及其RL开源高性能框架,支持多模态内容生成、理解及强化学习任务。
昇腾Driving SDK开发套件是专为自动驾驶领域设计的NPU高性能算子与加速库接口体系,支持PyTorch框架无缝集成,通过一键式路径迁移实现分钟级模型适配。该套件通过算子级优化使全网络性能提升30%,在开源开放模式下,开发者效率提升20%。作为开源项目,华为诚邀行业开发者与科研机构共同参与生态建设,推动算法创新形态演进。
Driving SDK全面覆盖业界主流的感知、规划控制及E2E算法,其典型模型性能已达到或超越行业平均水平。后续我们将持续扩展算子模型库,通过商业合作项目快速响应客户需求,确保性能开箱即用并实现持续优化。
MindSpeed MM多模态套件为智能驾驶数据闭环及大模型训练提供高性能加速支持。该套件预置10个主流多模态大模型,具备极致性能表现,功能覆盖预训练、微调、在线推理及在线评估等全流程。同时支持灵活构建多模态生成与理解模型,并提供可扩展的组件化架构设计。
场景加速方面,我们通过集成MindSpeed Core基础加速算法,显著增强了多模态场景的加速性能。同时,基于RL后训练高性能框架,实现了训练脚本的开箱即用,并全面支持主流RL算法。该框架具备快速构建训练环境的能力,支持多模态数据处理的并行化,并实现了与沙箱环境的交互式训练。在高性能RL加速方面,我们开发了多种昇腾亲和的优化特性,包括高性能调度框架与寻优算法,同时提供了RL算子层的深度加速支持。
MindSpeed与PyTorch框架深度协同优化,经过多轮高强度性能调优,全面支持智能驾驶多模态生成与理解模型。经测试验证,优化后的主流模型性能提升超过10%,部分关键模型性能提升幅度达20%。
MindCluster是昇腾面向大规模集群打造的可靠训练解决方案,通过超大规模集群调度技术,突破K8s架构单集群5000节点的规模限制,实现大规模训练任务分钟级快速启动。在断点续训能力方面,支持从算子级无感恢复到作业级分钟级恢复,显著缩短故障恢复时间。在弹性训练层面,通过灵活可靠的动态扩缩容机制,使集群整体可用度提升5%。
昇腾通过完善全流程工具链配套,支持主流算法的快速迁移部署。实际应用案例显示,该体系可实现5分钟内生成算子支持度分析报告,通过一键式代码迁移工具,平均仅需1个工作日即可完成模型精度训练,为天级迭代效率提供关键技术保障。
图源:演讲嘉宾素材
通过ONNX统一转换技术,昇腾实现了从云端训练到车端部署的全流程工程落地。在中心训练环节,昇腾训练所得模型性能可对标GPU训练结果,经ONNX格式转换后,可无缝部署至车端异构硬件平台。目前,业界已成功验证昇腾至昇腾、昇腾至地平线、昇腾至英伟达等多条跨平台部署路径的工程化落地。
昇腾智能驾驶落地案例与生态合作
昇腾通过赋能华为云与乾坤ADS,构建了大规模算力集群,成功支撑千亿参数模型完成40天持续稳定训练,故障恢复能力达到行业领先水平:依托全栈故障模式库,95%的故障可在分钟级内完成检测;通过三级故障快速恢复架构,实现绝大多数业务场景的无感断点续训,确保训练任务40天零中断运行,性能指标优于业界平均水平。
此外,昇腾澎湃算力为数据服务、标注服务及仿真服务提供强力支撑:在多模态数据融合、海量数据处理等场景中,可快速定位问题并实现性能调优;通过真实场景向仿真环境的高效转换,结合自动标注工具覆盖全场景需求,使大模型标注效率显著提升,智能标注技术进一步降低人工干预强度;在3D仿真场景重建方面达到厘米级精度,同时对corner case具备快速响应与强适配能力。
图源:演讲嘉宾素材
今年4月,昇腾ADS 4.0正式发布。为支撑高速场景下的L3级自动驾驶试点落地,系统引入WEVA一段式端到端全新架构,通过世界模型实现AI自我进化机制。随着世界行为模型复杂度持续提升,对智能驾驶训练推理集群的算力与效率提出更高要求。昇腾凭借万卡级集群算力与Driving SDK开发套件,成功保障ADS 4.0快速迭代与如期发布,有力推动了问界M9、M8及尊界等车型的市场热销。
在生态建设层面,昇腾全面兼容智能驾驶领域主流开发框架、加速库及第三方开源社区,包括PyTorch、OpenMMLab、DeepSpeed等核心组件。这是昇腾经过四年持续投入形成的完整技术生态体系。
在商业生态构建层面,华为每年投入专项生态资金,助力商业伙伴实现可持续的商业成功。技术赋能方面,通过构建全场景课程体系,为合作伙伴开发者提供深度技术培训与持续创新支持。
当前汽车产业正加速向智能化、AI化转型,各业务场景与应用环节均呈现算力需求激增态势。针对行业存在的多系统烟囱式架构痛点,我们建议汽车产业构建统一技术架构、数据规范及开发平台,聚焦打造标准化人工智能中间平台,实现上层应用快速开发与下层业务数据高效对接。华为将提供算力底座、AI基础硬件及软件平台,联合生态伙伴共同为车企提供端到端智能化解决方案。
围绕汽车行业AI全场景创新,华为昇腾愿与中国汽车产业深度协同,共同构建智能驾驶新时代的技术生态,为中国汽车产业智能化转型贡献核心技术与产业协同力量。
(以上内容来自华为昇腾智能汽车&机器人领域产品总监黄梓亮于2025年7月22日在第八届智能辅助驾驶大会发表的《华为昇腾生态,众智合力,助力智能汽车AI发展》主题演讲。)
启泰网提示:文章来自网络,不代表本站观点。