当下,一些公司着手打造智能车的“大脑”了。
“一家成功的智能电动汽车企业,必定是一家成功的AI公司。”
此言论在汽车领域近两年颇为流行,近期蔚来CEO李斌也曾这般表述。现今,李斌时常将企业家、投资人等诸多头衔置于一旁,以自媒体人的身份示人,其核心意图在于让更多人知晓真实的蔚来,避免因过往“服务好”的标签,而让人误以为蔚来技术欠佳。
他宣称:“创新才是蔚来的本色。”
有类似表达的并非仅有蔚来。往昔,每家汽车公司都有各自的标签,如操控感、豪华感、动力感、经济性等等。然而当下,大家形成了新的共识:为自己贴上AI的标签。
李斌和秦力洪分享蔚来在科技创新领域的最新思索
使汽车变得更为聪慧,是首要关键问题,也是车企现阶段需尽快向用户展现的重要能力。
但“变聪明”这一表述,本身是一个难以量化的描述。怎样才算一台聪明的机器呢?OpenAI的首席技术官Mira Murati曾在一档播客节目中,以人类的智力水平类比AI模型的能力:GPT - 4相当于聪慧的高中生,而GPT - 5有望达到博士的水准。
此种说法虽浅显易懂,但实际上很难直接应用于汽车。相较于大模型本身,智能汽车作为一个庞大的智能硬件载体,不仅需要有“智力”来理解问题,还需通过具体的“能力”去解决问题。
倘若将智能汽车比作机器人,那么在这个“人”变聪慧的过程中,需要一个“聪慧的大脑”,不仅要具备模型本身的智力,还要负责为“身体”制定一套合理的任务管理与分配体系,以明确不同“器官”在不同时刻应按照怎样的优先级处理一系列不同的任务。
例如:主动悬架是近两年颇为热门的新功能,其核心在于依据记忆和计算,让车辆在行驶过程中对悬架参数进行调整,以应对不同路面的颠簸状况,带来更优的驾乘体验。这涉及到底盘、智驾等不同领域的协同配合。倘若没有一个统一的大脑进行协调,由于带宽、延时等技术问题,配合就容易出现不协调的情况,难以达到期望的体验。
7月27日,在2024 NIO IN蔚来创新科技日上,蔚来推出了“整车大脑”——整车全域操作系统SkyOS。这体现了蔚来对AI时代的思考:据介绍,基于此系统,能够在跨域任务执行、算力分配等方面提供更优质的体验。
而这些努力皆为了同一个目标:让智能汽车变得更加聪明。
世界模型,让智驾“会推理”
智能驾驶是AI应用于汽车中受关注度最高的场景,也是近年来技术路线变化最为迅速的领域之一。
在过去的几年里,智驾经历了数次技术路线的更替,既有从高精地图方案转变为无图模式,也有以特斯拉为代表的部分公司尝试纯视觉(去除激光雷达)路线。
然而,这些路线的转变,本质上只是为了降低成本,并未改变智驾“规则驱动”的实质。该系统仍然需要大量程序员耗费精力编写代码、修复漏洞。换言之,这只是人类通过编程语言,将自身对于驾驶的认知传递给机器的过程,智驾系统本身并未产生智能。
端到端技术的出现,改变了这一规则。规则驱动正在向数据驱动演进,人类试图在大语言模型领域中已被证实成功的Scalling Law进行复制,通过投喂大量视频数据,将智驾系统训练成一个能够涌现出智能的神经网络大模型。
这种模式的最理想结果,是马斯克曾经描述过的人类驾驶思考模式,即:输入视频(看到的路面信息),输出控制(踏板及方向控制)。
端到端的智能驾驶架构图
依据“AI三大基石”的理论,要达成这一目标,需要解决算力、算法、数据三大关键问题。
蔚来在数据方面采用了“群体智能”的方式,即:基于大量预装高算力、高配感知硬件的量产车获取大量真实数据。据介绍,
算力则更是一个外部因素,并非由车企自身所能决定。
所以,下一阶段的重点,是从算法本身着手,提升模型自身的训练效率和推理能力。蔚来给出的下一个答案是:世界模型(Nio World Model,以下简称NWM)。
可以将NWM视作Sora的一种变体,在某种程度上也是一个视频生成的产物。稍有不同的是,Sora主要依然基于“文生视频”,而蔚来的世界模型则是一种“视频生视频”:根据官方介绍,NWM能够将3秒钟的真实驾驶视频作为提示词,生成最长达120秒的视频。
蔚来将NWM的职责描述为“推演万千平行世界”
但视频生成显然并非蔚来的目的,蔚来也并非要用NWM生成的视频作为训练数据。
依然以人类的思维模式作比:在一个人类司机决定超车之前,TA会依据实时路况判断左右不同的变道路线以及选择不同的超车时机。这一决策和推理的过程,NWM通过一段生成的视频,具象地呈现了出来。
根据官方介绍,NWM能在100毫秒内推演出216种可能发生的场景,并找到最优解。
因此,NWM的出现,实际上是通过生成式AI这条技术路线,为智驾系统在新工作方式(端到端)下变得更加聪明找到了新的路径。
挖掘座舱内的“人味”
AI在汽车上的另一个深度应用场景为智能座舱。
倘若你曾分别体验过一台“传统车”和一台“优秀的智能汽车”,你大概不会觉得智能座舱中的诸多功能只是花架子。笔者始终认为,在驾驶过程中,最为安全的人车交互方式应当是通过语音,如此能够确保你的视线和双手持续保持对驾驶的关注。
可以说,在座舱智能化这一方面,具有互联网基因的造车新势力们显然已经领先于许多传统车企。
如今,当AI浪潮来袭时,它们开始面临下一个抉择,正如前阿里董事会主席张勇所说:
运用AI的方法,将所有产品重新打造一遍。
蔚来期望用AI重新定义人车交互的模式
就当下而言,蔚来基本上将目前市场上主流的AI软硬件玩法,都引入到了车上。
例如AI + 音乐,通过AI加持的音质算法提升,为缺乏全景声的音源进行优化,再通过车机自带的硬件进行播放。
在AI的加持下,停车守卫功能变成了一个类似于视频会议纪要的产品。AI会筛选出值得关注的重点瞬间,倘若不幸在停车时遭遇剐蹭等情况,这个产品便可成为一个提高效率的工具。
还有即将推出的旅行回忆功能。发布会现场展示了一段自驾游之后,根据车载摄像头捕捉的沿途风景自动剪辑生成的vlog,其中还对一些标志性山峰进行了地点标注。类似的AI剪辑功能,以往在运动相机等场景中有过应用,如今蔚来也将其引入到了车内。
此外,蔚来此次还展示了NOMI在多模态能力支持下的进化:能够看到“嘘”的手势,自动降低音量;也能够根据不同的环境,表达恰如其分的情感关怀。
蔚来用“情感智能”描述了AI在座舱领域的发展。但在笔者看来,这些单一功能在AI本身的能力上并未有十分巨大的突破,反而是想到这些实际应用场景,并将其落地到车上的决策值得留意。在座舱领域中,或许目前应用场景的挖掘是先于模型能力进化的。
7月27日晚,结束媒体采访的李斌几乎未作停歇,便又投入到了一场线上直播中。与过往多次在网络上发声时一样,他又遇到了一些或尴尬或尖锐的问题,他选择直接念了出来:
“别整天弄抖音了,用心管理公司吧。”
李斌笑着解释这仅是他第5次直播。但正如那些被融入智能座舱中,或许当下使用率尚不高的小巧思一样,他觉得蔚来在创新方面的思考和努力需要向大家介绍,“不然大家每天都说蔚来服务好,就好像我们技术不行似的。”
所幸,这样的表达获得了许多积极的反馈。李斌在媒体沟通会上自我调侃道,以前大家说因为一个人(指李斌自己)不购买一台车,现在也有许多人说要为了一个人购买一台车,他很高兴自己能做到这一点。
一旁的秦力洪补充了一句:以前大家最为期待的是年底的NIO DAY(蔚来日,蔚来车主的重大活动),我们希望今后蔚来NIO IN能够成为媒体和车主最为喜爱的活动。
期待这一天能够早日到来。