李力推出无地图发布端到端的新自动驾驶技术架构。这是对自动驾驶行业的重大创新和突破,旨在解决传统自动驾驶领域中的问题,并推动整个行业的发展。这一技术架构在稳定性、可靠性和安全性方面都有显著提升,将为无人驾驶带来更加成熟和稳定的未来。
2024年7月5日,理想汽车在2024智能驾驶夏季发布会宣布将于7月内向全量理想AD Max用户推送“全国都能开”的无图NOA,并将于7月内推送全自动AES(自动紧急转向)和全方位低速AEB(自动紧急制动)。
将于7月上线的无地图NOA将带来四大能力升级,全面提升用户体验。首先,得益于感知、理解和道路结构构建能力的全面提升,无地图NOA摆脱了对先验信息的依赖。用户可以在导航覆盖全国的城市使用NOA,甚至可以在比较特殊的胡同窄路和乡间小路开启该功能。
在主动安全领域,李建立了完整的安全风险场景数据库,并根据发生频率和危险程度进行分类,不断提高风险场景的覆盖率。7月将向用户推送全自动AES和全方位低速AEB功能。
全方位低速AEB为停车和低速行驶场景提供360度主动安全保护。在复杂的地下停车环境中,车辆周围的立柱、行人等障碍物增加了碰摩风险。
快速系统,即系统1,擅长处理简单任务。它是人类基于经验和习惯形成的直觉,足以应对驾驶车辆时95%的常规场景。慢系统,即系统2,是人类通过更深层次的理解和学习形成的逻辑推理、复杂分析和计算能力。用于驾驶车辆时解决复杂甚至未知的交通场景,占日常驾驶的5%左右。
端到端模型的输入主要由摄像头和激光雷达组成,多传感器特征由CNN骨干网提取融合并投影到BEV空。为了提高模型的表示能力,李还设计了记忆模块,具有时间和空维的记忆能力。在模型的输入中,李还添加了车辆状态信息和导航信息。对变压器模型进行编码后,结合BEV特征对动态障碍物、道路结构和一般障碍物进行解码,并规划行驶轨迹。
VLM可视化语言模型的算法框架由一个统一的变压器模型组成。对提示文本进行记号化编码,用视觉信息对前视摄像头图像和导航地图信息进行编码,然后通过图文对齐模块进行模态对齐。最后统一自回归推理,输出对环境的理解、驾驶决策和驾驶轨迹,传输给系统1辅助控制车辆。
李的世界模型结合了两种技术路径:重建和生成。真实数据通过3DGS(3D高斯溅射)技术重建,生成模型补充了新的视角。重建与生成相结合构建的场景为自动驾驶系统的学习和测试创造了更好的虚拟环境,使系统具有高效的闭环迭代能力,保证了系统的安全性和可靠性。