2022年秋天的GTC大会上,NVIDIA发布了新一代车载计算平台「DRIVE Thor」,最高可提供每秒2000万亿次浮点运算,即大家常说的「AI算力」高达2000 Tops。
Thor的目标是大幅加速智能汽车和自动驾驶的进程,成为汽车的中央计算机。
相比于前一代的OrinX,它足有8倍性能提升,这也说明了NVIDIA「挤爆牙膏,加速一切」的决心。
在Thor推出后,关于自动驾驶是否真的需要那么「大力出奇迹」的讨论,持续了相当长一段时间。
这样的局面,直到2024年的北京车展后出现了明显的变化,一些Tier 1在车展后收到了主机厂针对Thor开发的密集咨询,NVIDIA也在这次车展上官宣了多家客户的合作。
出现这样的局面主要来自2方面的原因:
2024年上半年,基于「端到端」数据驱动的开发方式成为智驾业界共识,主机厂纷纷寻求更大算力的平台推动大模型上车;
领先的主机厂希望借助Thor这样的平台卡位先机,而传统主机厂譬如比亚迪则希望尽快追平或者赶超,这完美构建了军备赛的逻辑。
据HiEV不完全统计,到目前为止理想、小鹏、极氪、比亚迪、极越等主机厂都已经与NVIDIA达成合作,正在开发基于Thor的智驾计算平台;而供应商中,联想车计算、德赛西威、卓驭科技也在基于Thor开发域控制器或智驾方案。
在这块智驾最强芯量产前夕,我们跟联想车计算、德赛等主要Tier 1以及智驾上下游公司聊了聊:
700T算力的Thor,逐渐明确成为乘用车主机厂们最感兴趣的版型;
最快搭载Thor量产的车型,可能在明年第一季度发布;
即使在千T算力级别,Thor依然不是完全的舱驾一体计算平台;
Thor X可能对Robotaxi商业化有重大的推动作用。
端到端+大模型,
主机厂的焦虑与希望
大模型席卷智能驾驶和智能座舱,这种新的开发方式加速了AI算力的消耗,并且大幅刺激了主机厂对智能化进程的焦虑。
大模型到底有多吃算力呢?
2021年,曾经有一家新品牌主机厂率先使用高通8295进行座舱的开发,彼时开放了单个AI核的8295算力已经有30 Tops。
由于充沛的算力供给,这家主机厂在座舱功能之外,还计划在8295上开发一项单车道的行车功能,作为智驾系统的冗余备份。
但到了2022年下半年,基于单AI核来做核心的语音模型的开发,8295的算力已经吃紧。这家主机厂最后从高通获取了双AI核的授权,将8295的AI算力提升到60 Tops,但冗余的智驾功能量产被搁置。
2023年对于智驾计算平台也是一样。
国内大部分主机厂在高阶方案中使用的双OrinX的配置,一定程度参考了特斯拉HW3.0 双FSD芯片的设计,其中一个芯片最初作为冗余备份。但到后半段,双OrinX的算力变得十分紧张。
以理想汽车为例,理想在OTA 6.1.0开启端到端智驾方案的内测,其采用了「系统1 + 系统2」的双系统设计。其中系统2主要是一个VLM视觉语言模型,参数规模达到22亿(2.2B),而VLM运行的频率大概在3 - 4赫兹。
光是VLM视觉语言模型在OrinX上的部署,理想就花费了大量精力进行模型压缩和运行优化,而这只是智驾大模型上车的初级阶段。
一位AI从业者告诉我们,真正意义的大模型参数规模在10B以上,智驾系统对实时性的要求高,系统运行的频率至少要保证至少10 - 20赫兹。
智能驾驶和智能座舱在围绕大模型的开发方式上达成共识,而这都指向了更强的、为AI大模型优化的下一代计算平台。
在高算力的车载计算平台高度稀缺的背景下,Thor成为大模型上车「全村的希望」。
从L2+到L4,Thor的野心
尽管Thor在2022年已经发布,但关于这颗强悍的计算芯片,公开信息仍然寥寥。这与汽车行业的开发规律也密切相关。
2022年,NVIDIA最早推出的Thor 算力为2000 Tops。
但随着其开发进度的推进以及来自主要客户的需求推动,Thor逐渐衍生出4个主要版型:
Thor X,1000T 算力;
Thor S,700T 算力;
Thor U,500T 算力;
Thor Z,300T 算力。
其中700T算力的Thor S,成为乘用车主机厂们最为关注的配置。
与大家通常认知的Thor非常昂贵不同,由于单芯片算力比双OrinX算力更大,并且减少了片间通信问题,降低了系统复杂度。多位接近NVIDIA的人士向HiEV透露:Thor S的域控系统成本,相比于双OrinX成本更低,性能更好。
而1000T的Thor X,目前最主要的需求来自L4自动驾驶公司。
无论是Waymo、Cruise还是中国的小马智行、文远知行,都在寻求在更大的区域拓展Robotaxi车队的运营。
而大规模车队运营,需要解决的核心问题是如何降低单车成本,以及保障长期运营系统的稳定性。
Thor X是目前整个市面上最为贴近这一需求的车规级、大算力计算平台。
联想车计算在前不久下线了基于Thor X打造域控制器AD1,就是为包括文远知行在内的Robotaxi前装量产而开发的。AD1包含了2片Thor X,算力高达 2000T。
除了Robotaxi公司之外,一小部分瞄准了L3智驾系统开发的车企,也在考虑使用Thor X。
千T级的算力,除了跑智驾,也可以考虑运行一部分智能座舱的大语言模型。
联想集团副总裁、联想车计算业务负责人唐心悦告诉HiEV:
「我们认为700T版本(Thor S)一定是最先得到应用的,它可以满足30万以上的高端车型对智驾、座舱体验的要求,并且能进行跨域的计算。
而500T(Thor U)、300T(Thor Z)版本则是面向下沉市场车型的需求,对于ADAS的表现(相比于现有方案)有极大的提升,与过去Orin的版本不可同日而语。
即使是Thor的最低版本,300T也要比双OrinX要出色。」
在NVIDIA的智驾计算产品序列中,相比于Orin主要聚焦在乘用车L2+的高端市场,Thor的野心更大,覆盖更全面。
无论是面向未来的L4大规模部署,还是现有的城市NOA和高速NOA系统的体验升级,还是即将到来的L3量产,都在其射程范围内。
但与NVIDIA的预期有一点不同的是,Thor并非像其初始计划的那样,成为智能汽车的中央计算机。
随着「端到端+大模型」的到来,人们发现智驾系统上限的增长速度依然飞快。
当智驾问题本身还没有很好地被解决,1000T不会成为汽车算力的终点,至少在最高端、旗舰级的车型上是这样。
联想、德赛,大模型时代的军火商
联想车计算的负责人唐心悦,早年曾在Intel与伟创力负责汽车计算相关的业务。
2017 - 2018年前后,他所在的业务线为当时顶流的Robotaxi公司,如Cruise、Argo等提供车载计算机。
2022年,当联想组建团队,进入到汽车计算产品的业务时,联想内部很快决策瞄准了DRIVE Thor这一代产品,并且与NVIDIA签署了授权。
今年8月份,联想车计算基于Thor X的车规级域控制器产品AD1已经在合肥产业基地下线。这大概率意味着明年,全行业探索了近10年的Robotaxi将进入初步的规模商业化运营阶段。
唐心悦预估,未来5年,Robotaxi将进入10万台级的部署规模。
而除了针对Robotaxi/无人驾驶的AD1产品线之外,联想车计算基于Thor其他版型的域控制器AH1也在开发之中。AH1面向乘用车L2+的量产需求,其预计下半年和明年上半年将迎来陆续定点。
在另外一条线上,德赛西威从2017 - 2018开始,通过与小鹏、英伟达的三方合作,帮助小鹏量产了行业最早的基于NVIDIA DRIVE Xavier的域控制器。
在Xavier一代产品上积累经验之后,近两年,德赛几乎包揽了国内大部分主机厂DRIVE Orin域控制器的定点。
前不久在德赛科技节上,德赛高层披露,其已经获得至少2家主机厂基于Thor的定点,并已在6月份完成基于Thor的A样开发。
上游的军火商摩拳擦掌,下游的智驾竞赛一触即发。
据HiEV了解,理想汽车可能在明年上半年最早推出搭载Thor的车型;
极氪汽车已经官宣,明年3季度将发布搭载Thor的中大型旗舰SUV;
其他取得授权的厂商,如比亚迪也已经拿到Thor的样片,正由新技术院旗下的IDC智能驾驶研发中心牵头推进域控制器的开发。
同时,与OrinX一代产品不同的是,主机厂介入自研的深度更深,不光理想、小鹏开始深度自研域控制器,比亚迪、极氪、零跑等厂商也在加快控制器的自研。
NVIDIA方面在提供纯粹开放的计算硬件之外,由吴新宙带领,内部团队也在基于DRIVE平台开发全栈的智驾软件方案。HiEV获悉,德赛也已经组建团队在进行智驾软件的研发。
无论是开放协作,还是软硬一体,在最强智驾芯片量产前也,智能驾驶的技术比拼远远没有停歇。
本文来源:HiEV大蒜粒车研所