极越夏一平:未来汽车的 OS,就是大模型

访客 未命名 1.8K+

摘要

未来真正的智能汽车是机器人。

“电气化不仅带来了能源的变化,这就是为什么现在进入汽车行业还不算晚。」

10月27日,极悦品牌首款车型极悦01正式上市。在一个多月后的极客公园创新大会2024上,和极速悦CEO夏表示,即使特斯拉的自动驾驶即将进入中国,极速悦在智能驾驶体验方面也会比特斯拉做得更好。

在12月16日举行的极客公园创新大会2024上,夏介绍了“极悦”,一个大多数人还不熟悉的汽车品牌。深耕智能驾驶多年的百度,在业内率先提出了“汽车机器人”的概念,其核心是载人机器人。这就是极限越和其他新能源汽车品牌的区别。

夏认为智能汽车是一个可以自然交流、自由移动、自我成长的“机器人”。汽车会从过去冰冷的机器变成有温度的伴侣

在新能源汽车产业“收官”的当下,夏团队的思维又回到了智能汽车本身:与化学能相比,电气化带来的不仅仅是能源的变化,而是范式的转变。未来汽车竞争的底层已经从操控变成了计算能力的竞争。

在比拼续航、供电、控制的时候,我们在思考汽车真正智能化的方向:智能化不只是功能堆栈,也不是把汽车当成大屏手机,而是充分利用高计算芯片,把汽车当成一个完整的代理,连接大模型的应用,像机器人一样调动它的“所有感官”。

当各家都在“开城大战”中比拼智能驾驶的时候,夏认为单看数字意义不大,要看智能驾驶能覆盖的范围。当特斯拉的FSD(全自动智能驾驶)进入中国的消息传来,夏以为在中国,极悦智能驾驶有信心比特斯拉做得更好

以下为夏在极客公园

2024

创新大会上的演讲实录,由极客公园

组织。

智能汽车

是如何进化成“机器人”

极速悦01在极客公园创新大会2024 |极客公园展示

张鹏:极限悦

01

已经上市,很多人对汽车并没有专业的了解。作为产品的创造者,请用极限岳

来解读。

夏:

诞生之初,品牌、服务、产品都是按照一套规范来打造的。

核心是突出它的科技感,所以无论是整车和品牌,还是线下门店和服务,我们都在设计中融入了很多机器人相关的概念。

当我们最初设计汽车时,我们遵循三个方向。首先,这款车是机器人式的,具有未来感。这辆车不是简单的冷机。它如何与人进行情感交流?

二是未来汽车发展的形式。

你得想想一个机器人得具备什么样的能力才能被称为机器人,不管是四轮车、两足、四足还是人形机器人。当它与人类共存时,它必须具备基本的能力,比如自然语言交流。

所以我们强调自然交流。我们认为,无论在任何场景下,所有形式的机器人都必须实现自主行走,本质上就是自动驾驶。

第三点很重要。

必须是基于数据和场景的自我学习和迭代

这三点是我们公司开发产品的三大法则,也是我们产品最底层最核心的定义:自然交流,自由运动,自我成长。

硬件、底层架构、软件的智能化、上层各种模型的集成应用,都是围绕这三个核心逻辑展开的。

张鹏:以前,我们可能不会把汽车和机器人联系在一起。之前都说机器人是扫地机器人。你以为在一个家庭里,汽车其实就是机器人,汽车和人的关系变了。这种关系在哪里变化?

夏:过去,当我们使用汽车时,我们是在驾驶它,操纵它。现在,汽车不再是冷冰冰的机器,它更多的是一个伙伴。

我们的汽车语音助手叫SIMO,很多车主会认为SIMO是人类和情感的伙伴。

张鹏:类似于助手的角色。

夏:对,因为它不仅可以在车内交互,还可以在车外交互,所以它不是一个简单的接收指令的系统,而是可以和人交互的。

张鹏:能够在车外互动是改变人车关系的重要一点。车内互动我会把它当助手,但是人在车外,车能听懂我的话吗?

夏:是的。差不多在2008、2009年的时候,智能汽车开始做语音交互,你会发现第一波车内语音做起来的时候,我们觉得当时已经做得很好了。但是那时候还没有人用语音交互。那时候不像现在,在车上可以随便讲语音指令。现在语音系统可以理解自然语言了。那时候用户要记住每一个语音指令,非常反人类,用户体验不好。现在语音是交互的,而且不是人机交互,而是非常拟人化的交互。

张鹏:能够自由交流将改变并拉近人与车的关系。

:是的,所以我们在三个定义中的自然交流几乎就像是在跟人说话。这也是我们强调沟通速度的原因。在我们车上,你和车载机语音交互的反应速度在500毫秒到700毫秒之间,基本相当于我们两个人现在的反应速度。

张鹏:人车关系的变化是否可以用一些数据和明确的指标来衡量?比如反馈的速度,语言交流的自然度。

夏:是的。

极越夏一平:未来汽车的 OS,就是大模型

杜畿CEO、CEO夏与极客公园创始人兼总裁探讨汽车的智能化转向|极客公园

张鹏:今天智能汽车的发展模式改变了吗?

夏:它分为两个层次。2021年6月,我们正式启动了极月01的项目。当时只有三个人,极速悦01的第一行智能代码是在今天的软件系统中完成的,是我们用两年时间做出来的。

有两个巨大的挑战。首先是我们的内部软件团队每周工作,开发一个版本,测试一个版本,加载一个版本。但并不是所有的下游产业链伙伴都能跟上这个速度。在过去,汽车工业的发展是一个微缩模型。你给他一个需求,这个需求要经过需求的解释、研发、单元测试、集成测试、板上测试,最后软件才能给你。这个周期非常长。

因此,合作伙伴不可能每周向我交付新版本。我们中间有一段时间,整个团队代码的Bug量累积到一万多个,因为很多传统汽车MCU(电机控制单元)在底层的控制逻辑没有解决,导致上游出现很多应用问题。

张鹏:如果你仅仅依靠一个系统来跟随你,你是无法快速上升的。

夏:是啊,我觉得在新时代,要和产业链上的合作伙伴同步造车,真的很有挑战性。

第二个挑战是,现在汽车开发的复杂性比以前高得多。假设我们把过去的整个发展看成一个方程,相对固定,但是在AI的时代,变量的结果可能是各种可能性,可能性可能出现。

因为比如一个左转动作,灯光,天气情况,有没有人,路况,有没有车& hellip& hellip同样一个左转,结果大不一样。

张鹏:那你怎么解决这个问题呢?

夏:第一,我们现在叫广义城市,需要跑很多实车路测。

第二,实现软件快速迭代,我们在车上有一个功能。当你在车上说“SIMO,我想报告一个问题”时,你可以通过语音系统报告驾驶过程中遇到的所有问题。我们会在系统中直接生成一个程序,通过系统自动把这个问题分配给它的故障工程师,中间没有产品经理来分配问题。

张鹏:那你真的是个极客。请随时报告bug

夏:而且用户可以在手机上看到解决Bug的过程。

张鹏:非常古怪。

夏:这个时代必须快速迭代。本月底,我们将发布OTA 1.3版本,光学功能超过400种。这是我们加速软件迭代的方法。我不可能有一天左转,突然发现一个很危险的问题。软件迭代我要等半年。

非但没有迟到,时间刚刚好

张鹏:让我问你另一个你可能关心的问题。你今年年底开始交车会不会晚

10

?汽车工业已经非常拥挤了。分娩有压力吗?

夏:压力肯定是有的,没有压力就不正常。我们有一个很重要的认识,整个汽车工业的发展,从当年的油罐车到电动化,再到电动化初期,大家更加智能化,范式发生了很大的变化。电气化带来的不仅仅是能源变化。

在油罐车时代,我们的很多控制系统,比如液压转向、液压加速,本质上都是靠化学物质控制的。从长远发展来看,化学物质很难控制自动驾驶系统的精度。纯电出来了,全车底层结构都数字化了,化学状态更容易不可控的元素,数字化让它更线性。所以现在的数字化底盘,数字化转向,数控转向,数控制动都是为了解决整车的数字化。

数字化后解决的是供电方式的改变。以前运油车都是靠12伏的小电池供电,发动机没开就不敢开空,因为小电池不能长时间供电。但是电车有大电池,可以提供高电压,所以你可以在不发动汽车的时候在车上听音乐,玩空调,看电影,玩游戏。这是你在油车时代享受不到的体验。除非发动机一直开着,否则你开着发动机很难入睡,而且噪音太大。

当整个电车都数字化了,竞争是什么?这是我们要思考的。我们认为,未来5-10年汽车行业的发展高峰将是无人自动驾驶。未来10年的比赛核心能力[/div]已经从过去的三电和机动性逐渐转变为比赛算法和计算能力。今天,百度对大模型、数据、地图、计算能力的应用,使其在未来智能汽车的全链路中拥有了全部的核心竞争力,这也是为什么我们认为现在进入这个行业还不算晚。

过去很长一段时间,汽车的计算能力很低。2022年底和2023年底,出现了两个芯片,对整个行业影响很大。

一个是(高通)cockpit 8295芯片,这是汽车工业历史上第一次在计算能力上超越手机。8155时代,汽车的计算能力远弱于手机,无法同时支持驾驶舱和智能驾驶的计算能力。另一款(英伟达)Orin芯片的计算能力为254 TOPS。正是这两种芯片的出现,使得过去只能在云中或高计算PC上运行的算法能够在汽车级芯片上着陆。没有这两个芯片,所谓的智能汽车只是功能的叠加,并不能真正称之为智能汽车。正是有了这两个芯片,才有可能从底层软件到上层应用重构整个智能汽车。

张鹏:听你刚才描述的计算能力的变化,有点像我们讲移动互联网到来的时候,4G的出现,解决了从带宽到数据的成本问题,所以移动互联网蓬勃发展。所以下一步汽车智能化会因为这两个关键计算芯片的到位而进一步加速?

夏:肯定会进一步提速。现在ChatGPT背后的逻辑也是因为服务器端的计算能力快速提升,成本快速降低。汽车也是如此。也许今天使用8295和Orin的成本还是比较高的,但是我相信未来一定要靠他们的计算能力(降低成本)。我们刚开始用254 TOPS芯片的时候,英伟达推出了1000 TOPS的计算平台。

我们长期的判断是,当整个行业越来越智能化的时候,芯片迭代速度会很快,所以我们用8295,8795出来。大家对技术发展的理解是一样的,要看行业的发展能不能跟上芯片的发展速度。毕竟车无论多快都还是注重安全的产品,不太可能半年开发一款新车。开发一款新车至少需要两年时间。如何把技术和车辆架构连接起来,我觉得这是整个行业下一步需要解决的问题。

极越夏一平:未来汽车的 OS,就是大模型

夏认为进入车|极客公园正当其时

张鹏:那你来得正是时候,正好赶上一个时代的转变。

夏:我觉得刚刚好。如果早几年让我造一辆这样的车,我不会有这么大的信心。最多我会做一个和其他车差不多的产品。因为当时只有8155芯片,计算能力大概7.5 TOPS,连复杂的3D渲染都做不了。今天我们有能力直接基于Unity的3D引擎做UI开发,3D可视化渲染还原汽车,支持6K大屏全屏游戏,还有今天的智能驾驶,都是因为汽车级芯片能力的极大提升。

张鹏:在以前的技术中,智能只能算是智能功能的叠加,并不具备做机器人的能力。

夏:我觉得有两种思路。一个是让智能成为汽车的一个功能。另一种是积极思考:我应该如何开发智能汽车?这两种产品非常不同。

论智能驾驶,越能赢特斯拉

张鹏:我来说一个更直接的问题,特斯拉的FSD(全自动驾驶计算机。如何用特斯拉测量距离?能和特斯拉抗衡吗?

夏:我们的智能驾驶很大一部分是百度Apollo L4 (level)衍生出来的RoboTaxi(自动驾驶出租车),它在很多方面都有很强的能力。毕竟百度大概是国内唯一能运营大型无人车的。在过去很长一段时间里,百度积累的不仅仅是智能驾驶的技术经验,还有安全经验,也就是怎么做智能驾驶才是最安全的。

同时,为了保证自动驾驶技术的长期普及,我们在车上使用了纯视觉技术方案,目前在国内绝对是第一梯队。目前世界上只有两个智能司机,一个是特斯拉,一个是我们。如果特斯拉FSD进入中国,我们有信心比他们更好。因为我个人也经常去美国尝试他们的产品,而且他们在美国确实比较好。但在中国,最大的挑战是中国的路况& mdash& mdash中国的城市道路结构、道路规则甚至红绿灯识别的语义都和美国不一样。在通用化这件事上,特斯拉需要解决的问题还有很多。特斯拉解决一些常见场景的能力肯定是比较强的,但不代表投入中国后就能马上应用。

所以,我认为特斯拉进入中国后,还需要很长一段时间来提高在中国的推广能力。在高水平的智能驾驶体验方面,我不认为城市能马上达到和我们一样的体验。

张鹏:让我再问你一个问题。最近人们谈论很多关于NOA(飞行员辅助驾驶),以及未来

夏:我认为,从长远来看,一个好的自动驾驶仪一定是以覆盖率为导向的。

但有些企业把它当成营销手段,这是不合适的。我们目前的智能驾驶已经覆盖了中国90%的高速公路和城市高架桥,甚至是高速公路。什么概念?如果智能驾驶能覆盖城市高架桥和城市快速路,就算开一个城市,我们在中国也开了超过[div] 200个城市。

但是,我还是想强调一下智能驾驶的安全性。我们正在拥抱一个非常好的智能时代,但是此时此刻让用户有过高的期望是不合适的,因为智能驾驶还是很有挑战性的。解决自动驾驶的问题是人类AI史上的一颗明珠,几百人的团队想把事情做好并不容易。尤其是在自动驾驶AI的推广上,非常具有挑战性,不可能一蹴而就。

我觉得从长远来看,智能驾驶需要覆盖更多的领域才能成为一项好的服务。为什么我们以后要做日订阅模式?逻辑很简单。你有什么样的能力给你提供智能驾驶,你覆盖什么区域,用户就根据你的能力付费

比如我生活在一个没有智能驾驶覆盖的三四线城市,但是我今天要走高速公路去另一个城市出差。我们的智能驾驶覆盖整个高速高架,可以买一天的服务。当外出进行七天的公路旅行时,用户购买七天套餐。我根据服务能力给大家提供服务。我不会花很多钱买断终身服务,发现各个地方都没有覆盖服务。用户会奇怪为什么要花那么多钱去买一个这么多年都没用过的服务。

张鹏:所以本质上更务实。即使这一段路可以用智能驾驶解决,用户也可以选择用不用,而不是空放一个数字和概念。

夏:是的,我认为这些数字没有任何意义。如果把智能驾驶当成一项服务,我得考虑我能为用户服务多少区域。

未来汽车的OS,是大模型

张鹏:让我再问一个问题。刚才讲了汽车机器人的产品定义概念,在极悦的车上大胆取消了很多物理按键。你担心用户觉得这个设计太激进吗?你如何面对这个问题?

夏:在产品开发的过程中,纠结过很多次。有一段时间我非常怀疑。我经常想我们是不是走得太远了。但是整个团队还是很坚定的。说实话,创新有时候就是这样。你做创新,肯定有违背共识的地方。如果创新是基于共识,那么这个产品一定是平庸的。

就像我们取消方向盘上的很多按键,把转向灯放在方向盘上,选择随屏幕换挡。可能大家都觉得我们是在向别人学习,但是我们要学会思考,而不仅仅是看。我们背后的思路很简单。以前我们所有的应用都是通过手机OS,应用本质上是一种交互模式。很多车企想和手机厂商合作,本质上都是在想能不能把手机应用搬到车上。但我们的观点是未来3-5[div]年应该是大模特的时代,大模特只是[/S2]。

这里剧透一下,明年我们第二款车上市的时候,整个车型会迭代到2.0。语音系统会比现在更强大。当前的语音系统基于四个小型模型。明年第二辆车完全变成大车型,中间的小车型全部直接干掉。不需要识别哪个区域,语音输入后会直接得到结果。明年,将会实现多模式、同步的图像和声音识别。智加明年也会迭代一个版本,逐渐变成机器学习。这里不画饼了,我们直接让app上车。

今天,我们把汽车看成一个机器人,它所有的镜头就是它的眼睛,它的很多传感器就是各种触角,麦克风就是它的耳朵,扬声器就是它的嘴巴,交互的智能核心算法就是大脑。我们在整个区域都使用视觉系统。同时我们将视觉算法系统投入到各种应用中,同一个视觉系统用于大灯和远近光的切换。例如,我们有两个后置摄像头。后面来了电动车,车门打不开。

张鹏:防止开门杀人。

极越夏一平:未来汽车的 OS,就是大模型

夏认为大模型才是未来汽车真正的OS |极客公园。

夏:是的,我们同一个视觉系统已经被分散到很多应用上了。下一个视觉释放是换挡和左右转弯。下一个版本的软件将半自动转弯,视觉系统可以完全识别用户何时左转、右转、左转和右转。

我们是用思考而不是拍脑袋做出这些设计的,这些能力是内嵌的。月底软件发布后,左右转向按钮将实现半自动化。

我们可以识别出,在进入车道前后,车灯是自动关闭的。下一步是自动拨杆。左转还是右转不是通过转向角度来判断,而是通过视觉来判断进入哪条车道,进而判断左转还是右转。未来开车时,用户不需要注意车是左转还是右转,也不需要注意关灯。

我们也可以委派同样的能力来换档。在很多场景下,我们完全可以判断用户是在前进还是后退,完全可以用同一套视觉系统来识别。类似的功能还有很多。很多算法的能力不仅仅是做一件事,而是用同样的视觉算法让汽车实现尽可能多的场景。这才是未来真正的智能汽车,这才是真正的智能机器人。它的愿景不仅仅是做一件事,而是做所有需要视觉实现的事情。

张鹏:归根结底,它是一个代理,汽车是一个智能实体。在这个层面上,确实需要更大胆、更非共识地推进。

:我相信似乎有一种违背现实的非共识,比如自动挡的杆,一旦做出来了肯定会取代升降杆。从交互体验的角度来说,绝对有更好的无需人工操作的体验感受,用户也一定会接受,因为用户永远会为好的体验买单。这也是为什么我们坚信好的技术带来的体验壁垒一定会让产品成为最好的产品。[/s2/]

标签: 汽车 机器人 智能

抱歉,评论功能暂时关闭!