华为智能驾驶最大的风险是技术失控和系统故障。在智能驾驶过程中,如果出现系统故障或交通事故,可能会对行人、车辆和其他道路使用者造成伤害。随着无人驾驶技术的发展,也有可能被黑客攻击,从而破坏其安全性和可靠性。在开发和测试智能驾驶技术时,需要充分考虑这些风险,并采取有效的预防措施。
摘要
之前的成功经验很可能是下一阶段的负担。
2024年3月开始,特斯拉开始在北美大规模推广FSD v12,带来了相当明显的体验升级,使得端到端成为业界追捧的热点。
近日,Xpeng Motors创始人何在美国加州体验了FSD的V12.3.6版本,并表达了对其进步的感受。他表示,整个体验下来,FSD的表现非常丝滑,大部分路况都让人放心,几乎接近人类驾驶员的驾驶水平。
与此同时,国内公司也在迅速跟进这一技术堆栈。华为、小鹏、荣源亓航和其他企业已经规划了端到端登机方案。
其中,华为智能汽车解决方案BU CEO金表示,华为ADS(自动驾驶系统)的目标是超越特斯拉FSD。他说,每一次大版本更新都显著提升了行业水平,即使纯视觉解决方案超越了特斯拉FSD,带激光雷达的解决方案也是碾压特斯拉。
近日,华为宣布Aouita将率先搭载华为干坤ADS 3.0(高级智能驾驶),并宣布大幅降价。ADS premium功能包标准一次性购买价格为36000元,调整后价格为30000元,比原价低6000元。
那么华为如何在体验上碾压特斯拉FSD呢?在端到端成为行业共识的背景下,华为需要跨越哪些门槛才能保持领先?更重要的是,在“遥遥领先”的背后,华为智能驾驶最大的风险是什么?
为奇迹而努力
在此之前,我们首先要回顾一下华为是如何成为智能驾驶第一梯队的。
业界普遍认为有两大原因:一是华为在智能驾驶方面起步早,最早可以追溯到2013年。当时,华为成立了车联网事业部,正式开始布局自动驾驶技术。在此之前,2012年,谷歌获得了首张自动驾驶执照。相比百度同期的路测,华为在时间上并没有落后。
相比之下,一些高调的自动驾驶公司,如马骁之星和Momenta,成立于2016年。
另一种说法是受益于华为巨大的资源投入和团队规模。
长期以来,在智能驾驶领域,团队规模直接影响研发的成熟度。尤其是处理大量的边角案例,需要大量的程序员和测试工程师进行开发和验证。
问界产品搭载了华为智驾系统 | 图片来源:问界相比主流车企和自动驾驶公司千人左右规模的R&D团队,华为BU的R&D团队总共才7000人。余承东曾表示,他们中70%到80%的人(约5000人)专注于自动驾驶的研发。这使得华为拥有国内外最大的自动驾驶R&D团队。
知乎博主“严清”表示,华为在R&D和新技术上的投入和决心在业内都是罕见的。华为同时在几个团队推进自动驾驶技术的研发,拥有大量的测试车辆,主要使用价格昂贵且易于改装的车型,可见其对硬件的投入。
软件方面,华为曾经是Matlab(美国MathWorks公司生产的商业数学软件,号称“工科生必备神器”)的大客户,购买了非常完整的许可证,甚至包括一些暂时不用的许可证。华为一年花在Matlab上的钱可能比几大OEM厂商的总和还多。虽然情况因禁令有所改变,但华为在软件方面的投入也显示了其在技术研发方面的决心。
同时,自动驾驶技术早就采用了分而治之的方法,将过程分为感知、预测、规划和控制,再分为雷达、建模、车辆监管标准、智能协作、高精地图、软硬件协作等组成部分。华为的R&D团队对这种方法很熟悉,他们习惯于大规模团队行动。
华为在自动驾驶领域的研发过程充分利用了其在大规模团队合作和项目管理方面的经验。分而治之的方法可以让所有部门专注于自己的技术问题,同时保证整体项目的协调进展。
[div][div]
华为ADS高阶智能驾驶辅助系统的演示区 | 图片来源:视觉中国这些说法都有道理,但不可忽视的是,华为有来自其他业务的技术储备。华为没有从零开始参与自动驾驶。相比国内其他厂商,华为在电驱动等汽车技术方面有着深厚的积累。
同时,自动驾驶对软硬件能力要求极高。从芯片制造、算法优化到系统建立、软件适配,每一个环节都需要扎实的技术积累。
目前,华为的软硬件整合能力是支撑其快速发展的关键。与其他厂商通常购买各种设备芯片并结合自研算法不同,华为不仅开发底层操作系统,还拥有AI芯片、激光雷达、电机、电控系统、毫米波雷达等独特的关键技术。简单来说,一辆智能电动汽车可以提供除车轮、外壳、座椅之外的所有其他技术。
这种集成优势使华为在优化各种设备的性能和数据处理方面具有高效率和灵活性。
能否跨越端到端时代?
目前,业界普遍认为,端到端开启了新一轮自动驾驶行业革命。华为先进的智能驾驶系统也经历了三个阶段:
ADS 1.0:于2021年推出,基于Transformer的BEV架构,依赖高精度地图。ADS 2.0:在2023年发布,减少了对高精度地图的依赖,采用RCR算法进行车道实时识别和路径规划,大幅提升了系统在城市环境中的泛化速度和更新频率。ADS 3.0:2024年发布,采用端到端大模型。与特斯拉宣称的「大一统」模型不同,华为ADS 3.0感知部分使用GOD(通用障碍物识别)大感知网络,而决策规划部分通过PDP(预测-决策-规划)网络来实现。
虽然业界都在追求端到端,但对其定义存在分歧和争议。一些技术原教旨主义者认为,许多公司倡导的“端到端”并不是真正的端到端;而实用主义者则认为,只要技术基本符合原理,产品性能得到提升,准确定义端到端的内涵并不是关键。
陈涛资本联合多家单位发布2024年《端到端自动驾驶行业研究报告》指出,自动驾驶技术架构演变为四个关键阶段:
感知「端到端」:感知模块通过多传感器融合技术实现了模块级别的全面覆盖,但决策规划仍主要基于规则。决策规划模型化:决策规划模块从传统的预测、决策、规划功能分离,演变为集成到单一神经网络中的模型。模块化端到端:感知模块不再输出人类理解的结果,而是特征向量;训练时需通过梯度传导同时进行,增强模块之间的协同性。One Model/ 单一模型端到端:不再区分感知、决策规划等功能,整体流程由同一深度学习模型完成,从输入信号到输出轨迹一体化。
业内人士认为,华为和很多国内厂商的解决方案大多处于“决策规划建模”阶段,距离模块化端到端或者一个模型端到端的自动驾驶量产还有很大距离。
未来,华为在迈向端到端自动驾驶新时代的过程中,将面临三大关键挑战:
首先是数据需求的激增。特斯拉从超过20亿英里(约32亿公里)的驾驶数据中挖掘了数万小时的视频数据,用于FSD训练。一名自动驾驶工程师表示,当他们训练端到端模型时,只有2%的原始路测数据可以使用。由此可见端到端模式对数据的巨大需求。
除了数据量,数据质量也至关重要。马骁知行CTO楼天成曾表示,为了训练一个高性能的端到端模型,对数据质量的要求比一般的性能模型高几个数量级。这是整个自动驾驶行业面临的主要挑战之一。
华为今年4月时候宣布,到 6 月训练算力将达到 3.5 EFLOPS | 图片来源:华为【/h/]第二,在端到端自动驾驶的发展中,对训练计算能力的需求越来越高,远远超过以往任何一个阶段。
有业内人士认为,端到端自动驾驶的初期训练可以从100个高性能GPU(如英伟达A100)开始。但特斯拉等领先企业的实践表明,要达到优秀的端到端效果,所需的计算能力远远超过这个量。特斯拉此前曾预测,2024年2月公司计算能力规模将进入全球前五,10月份计算能力将达到100 E FLOPS(每秒浮点运算次数),相当于约30万块英伟达A100的总和。
相比国内厂商,特斯拉的目标高得惊人。华为表示,2024年6月,智能驾驶ADS的训练计算能力将达到3.5EFLOPS,蔚来、Ideality和小鹏的智能驾驶计算中心的计算能力分别为1.4 EFLOPS、1.4 EFLOPS和0.6EFLOPS。
第三,端到端会带来自动驾驶团队的组织重塑。一般来说,企业的组织结构通常可以促进组件层面的创新,因为产品研发通常由多个团队进行,只要产品的基本结构不变,这是非常有效的。然而,当需要结构性的技术变革时,这种组织系统可能会阻碍创新,因为它限制了人和团队以新的方式进行交流和合作的能力。
使用端到端技术,之前的分而治之和KPI拆分模式可能会限制性能的提升,产生意想不到的反作用。过分关注单一KPI的优异表现,可能会牺牲其他指标的稳定性。
所以很多企业都在调整策略,缩减原来的团队规模,转向AI大模型和数据基础设施的开发。高质量的数据和顶尖的AI人才将成为关键资源。同时,以前的垂直组织体系要转向网格结构,同时拥有纵横团队,实现多目标优化而不是单目标优化。
端到端的神经网络架构提升了数据和AI能力在整个产业链中的重要性,带来了企业所需能力和资源的深刻变化。这也意味着智能驾驶的游戏规则被改写了,能跟得上这场竞争的玩家屈指可数,很多公司会落后。
华为在规则驱动时代确实有自己的资源和先发优势,但在端到端时代要保持领先,转弯半径比友商大很多。