5年之前,资本场的弄潮儿,新势力与老牌厂商的角逐热情激扬。5年之后,端到端蓬勃热烈,自动驾驶、座舱加速重构,热情仍在。
回首过去,眺望未来,这是一个独属于中国自动驾驶产业的浩荡产业故事。
作者|念秋
编辑|皮爷
出品|产业家
2012年4月,硅谷到北京。
在机器学习领域卓有成就的余凯毅然离开美国的NEC实验室,离开他所熟悉的实验室,从人工智能的理论前沿迈向AI应用的第一线。
科学家迈入工业界并不是新鲜事。2年后密苏里大学,已经获得终身教授的韩旭也做出了离开学术界,扎根工业界的转向。
人才与资金的融入,让百度成为了自动驾驶孕育的最合适的温床。除了学术界大名鼎鼎的余凯和韩旭,还有两位谷歌的资深工程师——彭军和楼天城。
2013年,百度自动驾驶车项目正式起步,汇集了中国最顶尖的软件工程师,在过去十年稳扎稳打的推动着中国自动驾驶产业的飞速迈进。
可能连百度自己也没有想到,除了搭建Apollo平台,服务于自动驾驶产业内的多方客户,作为中国自驾的黄埔军校,也播撒了自动驾驶赛道希望的种子。
2015年,余凯离开百度,地平线应运而生,成为中国第一家提出自主研发人工智能芯片与第一个实现量产流片的人工智能公司。
“要真正实现人工智能的普惠,并加快它的效率,仅仅依靠软件是不够的,我们应该更激进一点,为人工智能设计专门的芯片。”
余凯谈及创立地平线时这样描述自己的初衷。在自动驾驶领域深耕3年后,科学家们对于理论与应用又建立了更进一步的理解。
实践者如余凯,他们都选择加速跑入创业的赛道——2016年彭军携手业界声名显赫的楼天城创立小马智行,2017年韩旭创立文远知行,自动驾驶赛道百花齐放。
而如今,殊途同归,过去八年的分叉线最终汇合,地平线、小马智行和文远知行都站上了IPO的舞台。
敲钟在即,觥筹交错背后,这也是中国自动驾驶产业的蜕变史。
一、2024年,自动驾驶“终于结果了”
故事从当下的时间点说起。2024年上半年,搭载ADAS的新车交付量占比超过60%。
这意味着自动驾驶完成了对于汽车行业的渗透,对于大众不再是纸上谈兵。辅助智能驾驶在过去五年爆发式增长,成为了新车评估不可忽略的一维,价格也在国内汽车产业的“内卷”中逐步亲民。
把时间拉到一年前,2023年7月起,文远知行、萝卜快跑和小马智行的Robotaxi陆续亮相广州、上海、武汉等一线城市,无人驾驶出租车也从科幻故事中走入现实。
在市场眼中,自动驾驶终于完成了一个重磅节点的跨越——从0到1的产品验证后,迈向1到10的扩张转型。
头部玩家的日夜奋斗是自动驾驶过去五年飞速发展的「火箭头」,但个中艰辛却并不足外人道。其中,车规级AI芯片是中国自动驾驶企业遇到的「第一关」。
从训练需求上看,自动驾驶技术的研发与测试都是算力上的无底洞。道路环境复杂,多传感器融合,在深度学习上都是算力需求的指数级增长。产品真正落地,需要的是几万次以上的训练和验证,L3级自动驾驶对算力需求为20-30TOPS,L4级需要200TOPS以上,L5级则超过2000TOPS。这对当时的芯片规格而言无疑是巨大的挑战。
地平线是为了这个问题而生,也在这块「硬骨头」面前摸爬滚打的很长时间。
“2015下半年恰好是融资的小冬天,地平线拿到了一笔不错的融资。当时我跟小伙伴开玩笑,这些钱怎么花?后来我们芯片团队开工之后,就发现这些钱远远不够。”余凯在回忆起最初做AI芯片时期,曾这样向媒体描述当时的情况。 余凯可能也没有预料到,车规 AI 芯片每一次流片,研发投入就要超过 5000 万美金。
而地平线的初期,公司还在汽车和物联网两个行业摇摆,一年多后才专注于汽车,把汽车AI芯片作为地平线的「唯一靶心」。在这样的经济压力和内部动荡下,地平线的第一款车规级AI芯片在多轮融资后的2019年才姗姗来迟。
头冠中国AI第一芯的征程2,搭载了自主创新研发的高性能计算架构BPU2.0,提供4TOPS的等效算力,典型功耗仅为2W。即便与同期英伟达推出的Orin仍有差距,但也给了国内新造车势力搭建ADAS的一个希望。
但特斯拉FSD芯片无形中给了地平线一些加速度。
当特斯拉的大屏搭载在民用车的狭小空间时,人们可能会想起乔布斯发布iPhone 4s说出的那句「我们为什么需要键盘」。有了诺基亚被苹果拍在海滩上的例子,头部的车企也没有时间去探究智能系统的合理性。不掉队,成为国内新造车势力的最大目标。即便是新起之秀,作为一家本土供应商,地平线被被动「押宝」。
2020年理想和地平线的合作引发关注。此时的小鹏和蔚来选择牵手英伟达的Orin芯片,理想则是押宝地平线。从当时的时间线,以及两家企业的经营状况来说,这几乎算是一场赌局——“新品牌+新芯片”的组合,对于理想和地平线,都不能输。
回看这次对赌,胜负显而易见。征程系列在理想车型上的表现,认证了国内AI芯片在智能辅助驾驶上的算力不逊色于头部企业。随后的市场动作也验证了这个事实,小鹏和蔚来随后都纷纷将大量资源投入到芯片自研的道路中。
2024年7月27日,蔚来“神玑 NX9031”芯片面世,拥有500亿颗晶体管,号称全球首颗5nm智能驾驶芯片成为蔚来交付给自动驾驶场景的答卷。一个月后,小鹏也迅速跟上队伍。蛰伏四年的“小鹏图灵”芯片成功流片,场景覆盖AI汽车、AI机器人和飞行汽车。这枚面向L4自驾场景的芯片搭载40核处理器,2个独立图像ISP分别用于行车感知于用户可感知图像,并拥有2个处理神经网络数据的NPU,可运行3 0B的大模型数据。
理想则是“两手抓”,在牵手地平线 的同时也没有放弃AI芯片的自研进程。目前理想L9 Pro搭载的征程5芯片,同时能够支持业界的自动驾驶算法(BEV)和高速NOA。另一方面,理想也投入了大量资源在自主研发智能驾驶SoC芯片中,据知情人士透露,这款名为“Shu Ma Ke”的芯片,倾注了理想在Chiplet和RISC-V技术方面的深入研究,预计在今年年底面世。
“蔚小理”在AI芯片上的突破是中国新造车势力在自动驾驶跃进的缩影,可以说,在最底层的“卡脖子”问题上,中国自驾正在走出困境。
除了AI芯片,从传感器到感知算法,从高精地图服务到云图厂商,自动驾驶产业的链路逐步被打通,成本也逐步降低,为自动驾驶服务走向大众铺平道路。
上下游企业一同摸着石头过河,中坚力量在不断的烧钱过程中完成了大逃杀,才能够完成自动驾驶产业过去五年的高歌猛进,站上2024年IPO的舞台。
十年前,手机代替PC,成为了人人触手可及的智能设备。而2024年,也走下神坛,不再神秘,成为触手可及的新兴技术。如今,台上有了新主角——自动驾驶。
二、2000天:看得见的分岔路,隐藏的交汇口
“实现自动驾驶,犹如攀登珠峰。我们要走过的路至少也有南坡、北坡两条路线可供选择,也总会有先行者和后来者之分。虽然山顶只有一个,但攀登者的经历、登山过程中的故事往往层出不穷,精彩纷呈,让人神往。”
这是2023年10月,中国工程院院士、清华大学智能研究院院长张亚勤在一次演讲中描述的自动驾驶现状。
攀登珠峰的困难困不住勇士,反而激发自动驾驶玩家多种解法的灵感。
可以说,过去五年激光雷达与视觉算法的硝烟从未停歇,两种策略的安全性和商业可行性被不断捶打。
难度系数更低的激光雷达解法,将自动驾驶问题转换为成本问题。激光雷达模式结合了高精度地图与场景的实时距离速度测算,通过先验信息和实时信息结合的方式评估自动驾驶的路况。
这类解决方案中,系统会内置城市的高精度地图,记录静态建筑物的形状与距离。激光雷达或毫米波雷达生成实时的3D点云数据,记录当下的动态数据。 再依赖同步定位与建图( SLAM )技术建立环境地图,为车辆提供规划与决策信息。由于高精度地图已经提供了大部分先验信息,这种解决方案被认为更安全可靠,也成为了自动驾驶行业的首选。美国加州的 Waymo ,上海浦东的萝卜快跑都是采用这种解决方案。
国内的价格“卷”下来,激光雷达的方案落地也坐上了火箭。
高德地图、腾讯地图、百度地图等头部五家企业作为主要的高精度地图供应商,占据高精度地图市场超80%份额,涵盖多家头部车企。随着国内无人驾驶市场突破100亿元大关,高精度地图的成本也逐渐下降,头部厂商对于单台车报价达到百元级别,从采集地图、绘制地图到维护的程度连年降低。
价格战为激光雷达方案带来了红利,但这样的产业升级也非一帆风顺。2021年,多个品牌的汽车接连发生事故,致使大众对于激光雷达的自动驾驶安全性的信任节节败退。
2021年8月12日,一辆蔚来ES8汽车在启用NOP领航辅助功能后,在沈海高速发生交通事故。同一天,小鹏汽车G3在ACC功能开启时,以70km/h的速度追尾静止车辆。
黑天鹅事件的发生,让自动驾驶的融资也遭遇寒冬。2022年自动驾驶投资事件125起,涉及金额超过205亿元,尽管事件总数与2021年持平,但累计披露的金额不足2021年的1/3。当安全事故层出不穷,资本市场对自动驾驶的未来抱有戒心。
然而安全性只是自动驾驶糖衣外壳的表层,内核虚空的盈利能力让投资机构也停下烧钱的脚步。
整体而言,激光雷达为核心的产品产业化推进高于视觉算法类的产品,但商业化一公里 的目标遥遥无期。以在美国加州率先运营Robotaxi的Waymo为例,2024年Q2收入3.65亿美元,高于去年同期2.85亿美元,而亏损也从去年同期的8.13亿美元扩大至11.3亿美元。这意味着即便激光雷达产业上下游的企业不断压缩成本,「烧钱」仍然会成为未来的主流。
这种背景下,视觉算法为核心的自动驾驶,成为大厂逐鹿的新舞台。
但视觉算法相较于激光雷达,更像是一场“有钱人”的游戏。想摆脱高精度地图的先验信息,依赖摄像头与传感器完成对于周围事物的全部感知,这对视觉算法而言是超高难度的挑战。选择这条道路,需要十年甚至更长时间的资金投入,招兵买马高精尖人才与设备,其技术难度系数更高于激光雷达。
能清晰看到的是,在这样的资金压力下,在这个赛道能留在牌桌上的只有拥有雄厚资金的大企业。国内自动驾驶基底深厚的百度与华为、海外特斯拉,都是在这个赛道深耕不辍的头部玩家。
从长期来看,视觉算法如果真正实现交付,其维护成本先天低于以激光雷达为核心的产品,因此更有可能快速实现商业化变现。
然而,2024年10月10日特斯拉股价9%的跌幅,展现了资本对于特斯拉答卷的「不买账」。从本质上,资本需要完整清晰的商业模式,细致丰满的技术细节,这是开一场派对无法去传达的价值。这样的诉求不仅仅是面向特斯拉这类在视觉算法深耕的玩家,更是面向自动驾驶赛道的每一个玩家。
正如张亚勤院士所描述的那般,不同路线的自动驾驶玩家在2024奔向同一个山顶。
这个山顶,是经得起推敲的自动驾驶产品,是能够被咀嚼的商业化变现模式。
十年高资金投入,五年超高速发展,谁能率先攀登这座山峰,将持续不断的「烧钱」转为「变现」,谁即能加冕为王。
三、端到端的长期主义,以及自动驾驶的“AI Agent”节点
二十年前,自动驾驶产业的稳扎稳打如同一场马拉松。到如今,五年的飞速成长也不代表最后的冲刺。
GPT的横空出世,让人工智能有了「实体」,让真正的自然语言处理有了「方向」,也让大模型成为可以应用于各行业的生产力工具。
「端到端」,正在悄然成为市场对于自动驾驶新范式的新共识。
过去的模块化部署,围绕感知、预测、规划和控制四个方向发力。对于产业的不同产商而言,只需要在一个方向,甚至一个子方向做到最优,通过协议与接口与其他模块的技术方案链接就可以获得成熟的能够落地的自动驾驶解决方案。这样的产业升级路线容易实现,也提高了技术迭代的开发效率。
但短板也很明显,即模块化的局限性在自动驾驶初期没有引起重视,尽管子任务伴随着信息损失,得出的都是局部最优解从而导致累积误差,这样的系统性问题无法在现有架构中得到解决。
AI Agent的变革是一个转折点。
AI研究者开始意识到数据量和算力的提高能够引发系统的质变,大模型的力量超出预期。同时,在自动驾驶的产业变革中,模块的融合也构建了一些小型的「端到端」的任务,其表现显然比纯模块化方案更优秀。例如用BEV结合Transformer方案代替感知模块,引入了更多的数据但减少了工程量,同样获得了更优异的表现。
「端到端」究竟有何魅力?
要实现L4级别的无人驾驶,针对所有可能场景进行推理和处理是不现实的。然而如果将感知-预测-决策-控制作为一个完整模块,利用传感器获取原始数据,直接输出车辆驾驶动作,那么所谓的一步步推理便不是必须。在大量数据样本的前提下,整个神经网络将又数据驱动,由算子对于各类情况进行计算,在没有数据损失的前提下也拥有更好的泛化性。
具象的看,过往几万行的代码,在大模型的加持下,只需要几百行却有更好的效果。
这样的产品架构,得到了自动驾驶行业内的共识,也称为许多AI产品的模版。例如机器人、人机交互等行业目前都认同端到端的处理模式,这是当下最流行的技术方向。
构建这样一套自动驾驶解决方案,也让自动驾驶公司不再受交付形式所困。无论是Robotaxi或者是民用车的自动驾驶方案,在「端到端」的技术模型下,只要收集到足够的真实数据,就可以跑通整个链路,实现在各种场景下的交付。
这也是今年国内汽车厂商的核心步伐——小鹏在2024年发布了面向自动驾驶的端到端大模型——XNet感知神经网络,XPlanner规划控制大模型,XBrain大预言模型。分别执掌感知、规划和决策三个方面,协同工作处理自动驾驶内的复杂场景。除了 小鹏,华为、商汤和元戎启行也分别交出了他们对于自动驾驶端到端解决方案的答卷。
然而回顾现行的端到端解决方案,都仍然潜伏着模块化的影子——小鹏的三方协同工作方式并没有实现端到端一体化的初衷,商汤的理论模型缺少真实数据的加持。这样的解决方案更接近于国内厂商对于端到端应用的表态,距离可以落地的服务仍有差距。
另一方面,端到端的最大痛点就是数据量。
本质上,端到端的大模型是通过数据和算力去和工程难度置换。如果是算力是可以用资金解决的,那么数据量却是需要实实在在积累的。 构建一个面向各类自动驾驶场景的大模型,所需要的数据量过于庞大,如果积累到足够量的数据,会成为自动驾驶厂商探索端到端的下一个命题。
回顾整个自动驾驶产业的成长,交汇口之后,成熟的商业化变现模式还需要与长期主义相结合,展现自动驾驶解决方案的普适性,实现自动驾驶技术持续进步。
2023年,自动驾驶中上游的禾赛科技、黑芝麻智能接连上市。现在上市的交接棒来到了产业中下游的地平线、小马智行和文远知行手上,标志着自动驾驶产业的又一个重要转折点。
5年之前,资本场的弄潮儿,新势力与老牌厂商的角逐热情激扬。5年之后,端到端蓬勃热烈,自动驾驶、座舱加速重构,热情仍在。
回首过去,眺望未来,这是一个独属于中国自动驾驶产业的浩荡产业故事。