自动驾驶哪家强?不是华为就是特斯拉!

访客 新能源 2.3K+

我觉得今年汽车行业,最具突破性的进展就是:国内自动驾驶“大模型”落地,陆续出落地的产品了。

自动驾驶哪家强?不是华为就是特斯拉!

https://pic4.zhimg.com/80/v2-ce2307a516e1bd21997ae7298bfe7e34_720w.jpghttps://pic 4 . zhi mg . com/80/v2-ce 2307 a 516 E1 BD 21997 AE 7298 bfe 7 e 34 _ 720 w . jpg

今年8月26日,马斯克亲自启动了FSD Beta V12的现场试驾,吸引了数百万人观看。此次展出的FSD Beta V12是历史上第一个端到端的AI自动驾驶系统,是特斯拉最重要的升级。

经过45分钟的直播,FSD Beta V12系统在整个行驶过程中进展非常顺利,可以轻松绕过障碍物,识别各种路标。45分钟内只有一次人工干预。

马斯克兴奋地说道:

V12系统从头到尾都是通过AI实现的。我们没有编程,也没有程序员写一行识别道路、行人等的代码。,全部交给了神经网络。

自动驾驶哪家强?不是华为就是特斯拉!

https://pic3.zhimg.com/80/v2-4d625a1ce4266156af6e22baa089a272_720w.jpghttps://pic 3 . zhi mg . com/80/v2-4d 625 a1 ce 4266156 af 6 e 22 baa 089 a 272 _ 720 w . jpg

9月12日,华为发布了搭载华为ADS2.0高级智能驾驶系统的M7,拥有27个传感硬件:

由1部远距离高精度激光雷达+3部毫米波雷达+2部800万像素高感知前视摄像头+9部侧视、环视、后视摄像头+12部超声波雷达组成。在高性能计算平台和华为拟人算法的支持下,实现了全国都可以开的高级智能驾驶。

自动驾驶哪家强?不是华为就是特斯拉!

https://pic4.zhimg.com/80/v2-3c0d1eb544e710614afe31468fff77d7_720w.jpghttps://pic 4 . zhi mg . com/80/v2-3c 0 D1 EB 544 e 710614 AFE 31468 fff 77d 7 _ 720 w . jpg

小鹏G9的发布会上,小鹏创始人何肖鹏演示了G9的自动驾驶。根据显示的数据,G9在高速场景下每1000公里可以接管一次,在市区场景下每150公里可以接管一次。这个数据表明小鹏自动驾驶技术取得了显著的进步。

可以看出,如今的自动驾驶已经到了城市NOA智能驾驶的阶段,离L3越来越近了。对于目前的成绩,最重要的是业界已经普遍应用了“大模型”自动驾驶算法。

也就是说,今年最具突破性的进展就是大规模的模型落地。

什么是大模型?为了说明这个问题,我们来看一个简单的等式:y=f(x)

这里有几个x,所以我们说有几个参数。那么什么是大模型呢?就是这样。有几十亿甚至几十亿个X。对,没错,就是:一百亿!

大模型:指的是拥有数十亿甚至数十亿“参数”的深度学习模型。

自动驾驶不同于传统的编程方式,它必须使用“大模型”,这在以前被称为“神经网络”。

1。旧神经网络下的自动驾驶

CNN模型:2011-2016年,CNN模型,又称卷积神经网络,首次被自动驾驶汽车大规模采用。CNN大大提高了自动驾驶车辆的环保意识。

自动驾驶哪家强?不是华为就是特斯拉!

https://pic1.zhimg.com/80/v2-5ac1578b54c72ae17cadbf19903bdbdd_720w.jpghttps://pic 1 . zhi mg . com/80/v2-5ac 1578 b 54 c 72 AE 17 cadbf 19903 bdbdd _ 720 w . jpg

RNN模型:2016-2018,RNN又叫循环神经网络。与CNN相比,RNN更适合处理时间序列数据。它的圆形结构可以对时间上的动态变化进行建模,这对于处理自动驾驶中的轨迹预测和行为分析等时序任务非常有用。例如,在目标跟踪和多智能体交互建模领域,RNN可以预测车辆的未来轨迹,为决策和规划提供支持。

GAN模型:2016-2018年,与RNN同步采用的Gan模型,也被称为“生成对策网”。其生成能力可以缓解自动驾驶系统训练数据不足的问题。GAN可以学习复杂的分布,生成高质量的合成数据,可以用来缓解自动驾驶系统训练数据不足的问题。

自动驾驶哪家强?不是华为就是特斯拉!

https://pic1.zhimg.com/80/v2-d69b7cf048d4e404039732bb13d2d24d_720w.jpghttps://pic 1 . zhi mg . com/80/v2-d 69 b 7 cf 048d 4 e 404039732 bb 13d 2d 24d _ 720 w . jpg

二、新“大模式”下的自动驾驶

BEV模型:2018-2020,BEV又称为“鸟瞰模型”,其核心思想是将车辆周围的三维环境数据(如点云和来自激光雷达和相机的图像)投影到顶面上,生成二维鸟瞰图。这种从3D到2D的降维方式获得了很大的好处:比原始的传感器数据更直观,信息量更大。可以更清晰地观察道路、车辆、行人等要素以及位置关系,增强自动驾驶对复杂环境的感知能力。

Transformer模型:从2021年至今Transformer模型最大的创新是提出了“注意机制”,大大提高了模型学习远距离依赖关系的能力,突破了传统RNN和CNN在处理长序列数据时的局限性。Transformer解决了传统模型的长序列处理问题,给出了一种可无限扩展的结构,为大模型技术的实现奠定了计算基础。也成为了现在大家争相使用的机型之一。

占用模型:2022年至今,BEV+Transformer的缺点:鸟瞰图是2D图像,会缺失空之间的一些高度信息,不能真实反映3D空之间物体的实际占用体积。所以在BEV中,更多的是关注静态物体(比如路边等。).

自动驾驶哪家强?不是华为就是特斯拉!

https://pic3.zhimg.com/80/v2-772464198593ba94bb22f22d4a345af1_720w.jpghttps://pic 3 . zhi mg . com/80/v2-772464198593 ba 94 bb 22 f 22d 4a 345 af 1 _ 720 w . jpg

特斯拉在2023年AI日发布了占位网络模型,该模型基于学习进行三维重建,意图更准确地还原自动驾驶汽车周围的3D环境,可以视为BEV view的一次升华迭代。

占位网络将三维表面表示为基于学习的深度神经网络分类器的连续决策边界,可以在没有激光雷达提供的点云数据的情况下重建三维环境,获得更精确的三维场景信息。

变压器+BEV+占用网络

一方面,BEV可以高效表达围绕自动驾驶系统的丰富空信息;另一方面,Transformer在处理序列数据和复杂上下文方面显示出独特的优势。两者的结合可以充分利用BEV提供的environment 空之间的信息和Transformer对多源异构数据建模的能力,实现更精确的环境感知、更长远的运动规划和更全局的决策。两者结合,可以相辅相成,增强对复杂场景的理解和表达。

【/S2/】2020年以来,变压器+BEV+占领网的组合正在成为自动驾驶领域的重要共识,推动自动驾驶技术进入新的发展阶段。

自动驾驶哪家强?不是华为就是特斯拉!

https://pic4.zhimg.com/80/v2-87414563f658df8ff1d18e1cce44de96_720w.jpghttps://pic 4 . zhi mg . com/80/v2-87414563 f 658 df 8 ff 1d 18 E1 ce 44 de 96 _ 720 w . jpg

标签: 模型

抱歉,评论功能暂时关闭!