"缺乏技能和经验的人不应被忽视。不熟练的理想应该是得到实践的机会,以便进一步提高技能和能力。只有通过实践,人们才能真正掌握所需的知识和技能,最终实现自己的理想。"
摘要
李想并没有出现在本次发布会上,而是展示了他的硬核实力。
随着特斯拉FSD(全自动驾驶)进入中国市场的加速,各大车企纷纷跟进,推出了各自的端到端大型车型方案。
6月,李董事长兼首席执行官李想在2024中国汽车重庆论坛上表示,李将在今年第三季度推出NOA(自动辅助导航驾驶),并在今年年底和明年年初推出基于ideal自研大模型和VLM视觉模型的L3自动驾驶系统。同时,随着这项技术的演进,计算能力的增强,模型的放大,无监督的L4级自动驾驶至少在三年内一定会实现。
7月5日,李召开Ideal 2024智能驾驶夏季发布会。李想没有参加本次大会,但是三位技术专家介绍了理想智能驾驶的现在和未来。
在发布会上,他们以对话的形式介绍了最新的端到端+VLM双系统智能驾驶模型。通过世界模型的学习和思维环境,这套系统将加速自动驾驶技术的迭代。
首批推送OTA 6.0版本的,是AD Max用户 | 图片来源:理想汽车同时,理想OTA 6.0版本智能驾驶升级将引入无高清地图的NOA功能,并覆盖理想MEGA和理想L9、L8、L7、L6 AD Max车型,惠及超过24万用户,实现全国范围的智能驾驶体验。
目前很多厂商都在追求“端到端”,但李是第一家透露技术方案的车企。那么,理想的“端到端”方案有什么特别之处呢?
“追随特斯拉”
作为自动驾驶行业的标杆企业,特斯拉的技术路线一直备受关注。自2023年5月,Elon & middot马斯克首次公开提到“特斯拉FSD v12是端到端的AI”。到2024年3月,特斯拉开始大规模推v12版本。特斯拉端到端技术不断完善的过程,也见证了中国自动驾驶行业逐渐达成共识的过程。
虽然业界对端到端的发展趋势已达成普遍共识,但在具体技术路线上仍存在分歧。比如“模块化端到端”采用监督学习训练方法,而“单模型端到端”可能更喜欢自回归和生成式训练方法。
理想情况下,这次公布的自动驾驶方案有点类似于Momenta的双系统模式。其理论来源是诺贝尔经济学奖获得者丹尼尔&米德多特。卡尼曼的《思维,快慢论》提到了认知心理学中系统1和系统2的概念。其中,系统1是一种基于人过去经验和习惯的直觉,可以快速做出决策。系统2代表思考和推理的能力。面对复杂的问题和未知的场景,人们需要思考和推理来解决。总之,系统1和系统2相互配合,构成了人类认知和理解世界、做出决策的基石。
理想自动驾驶系统 1 的演进路径 | 图片来源:理想【/h/]李的自动驾驶技术架构主要由三部分实现:系统1采用端到端模型(E2E)实现,主要用于快速响应常规驾驶问题。这个系统经历了三个阶段:模块化设计,包含感知、定位、规划、导航、NPN,支持了 100 个城市的 NOA。无图模式。只有感知和规划两个模型,最大的变化是去掉了NPN,不依赖于先验信息类似特斯拉的 One Model的端到端模型,只有一个模型,输入的是传感器,输出的是行驶轨迹。理想智能驾驶系统2的技术架构图 | 图片来源:理想 System 2是视觉语言模型(VLM),具有处理复杂场景的能力。它由Transformer模型组成,通过分词对提示文本进行编码,将摄像头图像和导航地图信息传递给模型进行自回归推理。系统2的输出包括环境理解、驾驶决策和行驶轨迹,然后传输到系统1控制车辆。
与大多数单帧VLM模型不同,流视频编码器是理想设计的,它可以更长时间地缓存视觉信息。此外,系统还增加了记忆库,可以缓存多帧历史信息,解决了时间序列推理延迟长的问题。
可以这样理解,系统2就像一个智能导航和决策专家。它不仅可以看到当前的路况和环境(摄像头图像),还可以根据地图信息和用户的指令(提示文字)进行决策和规划行驶路径。
同时,李介绍了端到端方案的测试和验证方法。一般来说,业内的主流做法是通过3D虚拟环境、重建仿真、生成仿真进行仿真测试。理想情况下,它结合了两种技术路径:重建模拟和生成模拟。
可以用一个例子来说明:假设你正在准备考试,有两种题型需要练习:真题和模拟题。真题是以往考试中实际出现的问题,模拟题是根据考试大纲编制的新题型。真题可以让你熟悉考试的风格和类型,模拟题可以帮助你应对可能出现的新情况。
理想的测试方法类似于这个准备过程。他们首先使用3D高斯溅射(3DGS)技术像模拟问题一样重建真实场景,然后使用生成的模型像模拟问题一样补充新的视角。这样,他们创造的测试环境既真实又多样,可以更全面地评估自动驾驶系统的性能。
此外,他们采用了动静分离的策略,就像分别练习不同类型的题目一样:静态部分是环境重建,动态部分是重建动态对象,生成新的视角。就这样,他们创造了360 & deg可编辑的3D物理世界可以模拟各种驾驶条件,如天气变化、不同时间、交通流量等。,全面测试自动驾驶系统的适应性。
开城战争还在继续。
除了自动驾驶新架构,李还发布了OTA 6.0版智能驾驶升级,带来无高清地图支持的功能。此次升级将涵盖L9、L8、L7和L6的ideal MEGA和ideal ADMax型号,惠及240,000多名用户。
2023年,中国智能驾驶行业的焦点将是“NOA开城大战”。目前,华为和小鹏已经推出了无高清地图的高级驾驶辅助功能,蔚来也推出了全球导航辅助NOP+城市功能。
理想无图NOA的推送节奏 | 图片来源:理想汽车这一次,理想也不远了。据了解,李灿最新发布的NOA(导航辅助驾驶)功能不仅可以在城镇驾驶,还可以适应二级公路。与上一版本相比,新版无地图NOA在BEV(鸟瞰图)、感知能力、调控能力、整体系统能力等方面都有了全面提升,可以应对更复杂的驾驶环境。
在发布会上,李拆解了的四大核心竞争力,其中前两项最值得关注:
哪里都能开。无图NOA无需依赖大量的「先验信息」。理想汽车的智能驾驶系统中有许多「小机器人」在运行,虽然部分「小机器人」可能仍需一些先验信息,但整体能力的提升,使得系统能够更灵活地应对各种路面情况,而无需事先验证。绕行丝滑。该能力结合了时间和空间的双重规划。在实际驾驶中,常常会遇到车辆或行人阻碍通行。这时,「绕行顺畅」能力就显得尤为重要。其背后的时空联合能力,可以同步规划横纵(前后左右)的空间,并持续预测自车与他车之间的空间交互关系。通过规划出「未来一段时间内」的所有可行驶轨迹,筛选出最优、最高效的行驶路径。
此外,李还优化了(自动紧急制动)和AES(自动紧急转向)。日常生活中的低速场景,尤其是地下停车场等复杂环境下,用户可能会遇到立柱、桥墩等障碍物。李的低速可以在这种情况下自动停止,避免摩擦,减少用户的麻烦。
高速行驶时,如果前车突然停车避让,当前车距离前车太近无法及时停车,李的AES功能会自动减速转向避让。此功能在& ldquo消失的前车& rdquo在场景中尤为重要,可以显著提高驾驶安全性。
目前,端到端的自动驾驶已经成为业界的共识。华为、小鹏、荣源亓航、商汤绝影、零一汽车等代工和智能驾驶技术公司纷纷进入这一领域,并在最近半年陆续披露了上车的量产规划。
但是,端到端技术并不是一个新颖的技术,它需要一套完整的支持系统才能真正发挥作用。以特斯拉为例。虽然其他公司也在使用端到端技术,但效果不如特斯拉。特斯拉的成功不仅仅是因为端到端,还因为他们在每个细节上都做得非常好。不过,对于李来说,智能驾驶的布局相对较晚,端到端还是给了它一个追赶的机会。