特斯拉 FSD V12 成功实现了大数据、大模型、大算力的融合,成为了真正意义上的端到端学习模式。
5 月 15 日,针对特斯拉 FSD(Full-Self Driving,全自动驾驶)付费选装率仅为 2%的消息,特斯拉 CEO 马斯克在 X 平台上作出回应,表示实际情况远非如此。该回应是对知名特斯拉投资者加里·布莱克对未来 FSD 接受率质疑的回应。据信用卡数据提供商 YipitData 的数据,在美国试用一个月 FSD 的特斯拉车主中,仅有 2%的用户选择继续订阅该服务,这一比例远低于预期的 6%。
布莱克认为,FSD 服务可能因附加值不高或订阅价格(每月 99 美元)过高,导致其接受率较低。他呼吁特斯拉认真评估这些因素,以更好地满足车主需求。
与此同时,马斯克 4 月底的访华之行,引发了关于特斯拉 FSD 在中国落地的讨论。然而,据中国日报报道,尽管特斯拉提出在中国推出“无人驾驶出租车”,但中国政府尚未完全批准 FSD 在中国的全面落地,可能会先支持其在国内进行测试和示范。
那么,处于舆论焦点的特斯拉 FSD 实际体验究竟如何?它是否会再次引发鲶鱼效应呢?
智能驾驶的“ChatGPT 时刻”
在新能源汽车步入智能化下半场的进程中,智能驾驶已然成为行业竞相追逐的技术高峰之一。人们不仅关注驾驶场景的通过率和通勤效率,对智能驾驶的人性化程度也愈发重视。
此前特斯拉 FSD 的 V11 版本,与众多智能驾驶系统相似,在速度控制方面表现生硬,处理突发状况时会突然刹车或加速,机械感较为明显。尤其在狭窄路段或恶劣天气等特殊环境下,这种生硬的速度控制容易让用户产生不安情绪。
然而,特斯拉 FSD V12 的出现扭转了这一局面。体验过该版本的知乎博主“EatElephant”指出,其最大的优势之一在于拟人化能力。V12 版本在速度和转向控制的顺畅度上有了显著提升,即使乘客坐在后排,在红绿灯启停和路口转弯时也几乎感受不到顿挫感。
其次,V12 在处理一些非结构化场景(如缺乏车道线与交通规则约束的情况)时取得了较大进步。例如,在转弯的时机和幅度、减速的具体程度等方面,V12 表现更为出色。在 V11 版本中,当车辆直行时遇到前方远处左转的车辆,智能驾驶系统会明显减速,虽可规避碰撞风险,但减速幅度过大,不仅导致明显的顿挫感,还增加了被后车追尾的风险。而在 V12 版本中,面对类似情况,系统能够更精准地判断前方车辆的行驶路线和速度,从而以更为合适的速度减缓,让车上乘客几乎难以察觉,同时又能留出足够的安全距离,有效避免了不必要的不适感和后方车辆的追尾风险。
再者,V12 应对各种场景的能力大幅提升,显著减少了人工干预的次数。例如,特斯拉 FSD V12 不仅能够识别并绕过路面上的铁皮等障碍物,还能在道路施工时依据引导标识在临时开辟的道路上行驶,其灵活性堪比人类司机。即使需要驶向对向车道,也能够不受逆行标识和中心黄线的限制。在夜间行驶时,它能够像人类一样先右转驶入两辆靠边停车之间,巧妙避让对向来车,待对向来车驶离后再向左打方向盘继续前行,展现出了卓越的驾驶技能。
试驾时的场景,蓝色为导航路线,绿色为 V12 自主变动的路线 | 图片来源:知乎博主“EatElephant”
同时,知乎博主“EatElephant”还提到,FSD V12 展现出了一些类似智慧涌现的能力。在测试中,车辆遇到一个难题:路口前有一个车道,V12 无法使用倒车档完成掉头。在乘客等待时,V12 发现了一个小停车场,果断改变路线绕过,尝试代替标准掉头。尽管最后出口处系统提示接管,但这一行为在自动驾驶技术中具有重大突破意义,因为通常系统会严格遵循导航路线,自行偏离导航的行为几乎是难以想象的。
这些进步也体现在人工干预的次数上。相较于之前的版本,V12.3 版本在城市环境下的无关键接管行驶里程大幅增加,从约 100 多英里(约合 160 公里)提升至 386.7 英里(约合 622 公里)。
相比之下,同济大学教授、汽车学院副院长熊璐曾表示,北京、上海、广州等地的自动驾驶企业,平均每百公里需要接管 3.5 次到 10 次不等,基本上每行驶十几或几十公里就需要人工接管一次。
当前,特斯拉 FSD 或许正在迎来属于自己的“ChatGPT 时刻”,尽管仍存在一些不足之处。例如,系统在驾驶时有时会让人感觉车辆距离路边过近,从而引发担忧;对来车的识别和避让不够及时,如遇到消防车时的反应不够灵敏;对一些特殊路标或车道的识别可能出现错误,对于坑洼的识别和避让也存在一定问题。
不过,这些问题并未阻碍特斯拉加大对智能驾驶的投入。据悉,截至今年年底,特斯拉计划在自动驾驶技术上的累计投入达到 100 亿美元。考虑到 2016 年至 2023 年的总支出约为 20 亿美元,这意味着今年特斯拉在智能驾驶方面的支出将达到 80 亿美元左右。如此巨额的投资,彰显了特斯拉进一步提升 FSD 技术的坚定决心。
FSD V12 是如何炼成的?
特斯拉 FSD V12 体验的显著提升,背后是其技术路径逐渐趋于成熟的结果。
自 2020 年推出 FSD 功能以来,特斯拉一直在智能驾驶技术的发展道路上引领潮流。与传统依赖激光雷达和高精度地图的方法不同,特斯拉坚定地采用了纯视觉技术,使车辆能够更好地感知周围环境。
2022 年特斯拉 AI Day 上的占据栅格技术框架 | 图片来源:特斯拉
在随后的两年间,特斯拉通过诸如 AI Day 等一系列活动,公布了众多关于 FSD 技术的方案。这些方案涵盖了数据闭环、共享主干网络、BEV 感知以及占据网络等概念。尽管这些技术处于行业领先水平,但之前的版本却因用户体验改进不明显而备受诟病。
然而,当 FSD 发展到 V12 阶段时,情况发生了转变。与 FSD 11 相比,FSD V12 最大的变革在于采用了端对端神经网络技术(End-to-End Neural Network, E2E NN)。该技术使系统能够更出色地理解和处理复杂的驾驶环境,减少驾驶员的干预,提高了自动驾驶的精准度和自动化程度。
特斯拉 FSD 车辆变道 | 图片来源:特斯拉
以往,FSD 的基本流程包含感知、决策和执行三个阶段。在早期版本中,感知阶段需要通过视觉或雷达获取周围物体信息,并进行识别和分类,而决策阶段则依赖于预先编写的控制规则。
然而,在 FSD V12 中,由于采用了端对端神经网络技术,这些步骤发生了革命性的变化:感知阶段不再需要手动识别和分类物体,决策阶段也不再依赖预先编写的控制规则。系统只需通过大量视频输入让神经网络进行学习,就能在各种情况下做出正确的决策。这使得特斯拉在 FSD V12 中能够大幅减少代码量,使系统更加轻便、灵活,即便在没有网络连接的情况下,也能在陌生环境中正常运行。
马斯克去年底曾表示,特斯拉的 FSD Beta V12 完全没有编程,没有程序员编写一行代码来识别道路、行人等概念,全部交由神经网络自行思考,C++代码仅有 2000 行,而 V11 则有 30 万行。
实际上,端到端模型并非全新概念,早前就已有人提出。然而,许多人对神经网络的可解释性和可靠性一直存在疑虑。尽管端到端系统提升了模型的能力上限,但也加剧了神经网络作为“黑盒”的不可解释性问题,这给研发迭代和问题解决带来了巨大挑战。因此,许多公司不敢轻易尝试。
特斯拉 FSD 让人们看到了端到端模型的潜力。当然,这一过程并非一帆风顺。特斯拉在自动驾驶技术中,一直强调端到端的“纯度”。从 V10.9 版本开始,他们去除了车道线感知的后处理代码,改为由模型直接输出车道线。在 AI Day 上,特斯拉还展示了如何将学习型轨迹生成和神经网络决策模型引入规划控制模块。
然而,特斯拉的技术更新主要集中在技术栈的中上游,如感知和预测方面,而控制行车功能的决策规划模块却较少改变。这导致用户体验的改善不够显著。
V12 的重大突破在于打通了整个技术栈的最后一环(决策规划),使系统能够实现端到端的数据驱动,最终实现了更为自然、智能的驾驶行为。
随着 V12 采用了端到端技术架构,直接优化了规划控制输出,用户体验的改善也将更为迅速。5 月初,马斯克宣布,特斯拉的 FSD 系统即将迎来三大更新版本,分别为 V12.4、V12.5 和 V12.6。
其中,V12.4 版本预计将在 5 月中旬推出,该版本将全面更新模型训练,以提高系统的准确性和可靠性。其次,针对用户反馈的加速过猛和刹车过急问题,V12.4 及后续版本将着重优化驾驶舒适度,从而提升乘客的驾乘体验。
回到本文开头,马斯克的中国之行,似乎让 FSD“落地中国”这件事变得更具可能性。甚至,外网有传闻称比亚迪和特斯拉将在 FSD 方面展开合作,这进一步释放了 FSD 进入中国的潜力——全球最大的两家新能源汽车公司的合作,将会产生怎样的结果呢?
倘若传言属实,特斯拉 FSD 是否会改变当前智能驾驶领域的格局?中国车企的智能驾驶“故事”又将如何续写呢?
这或许是所有人都会畅想,却又不太敢轻易追问的问题。