尽管在2025年上半年辅助驾驶行业经历了一番风波,但到了下半年,在技术上头部公司的辅助驾驶系统明显地要开始迈入下一阶段。
理想、小鹏、元戎这些玩家们都霍霍欲试,以VLA为代表基于新一代模型的辅助驾驶系统呼之欲出。
理想已经在一季度的财报会上预告:7月理想将发布纯电SUV i8,并同步推出基于VLA模型的辅助驾驶系统。i8将是理想继MEGA之后在纯电上的关键一战,理想的前期宣传将不少的卖点都寄托在了新的辅助驾驶上。
小鹏也在6月11日刚刚揭幕了全新的G7,G7首发了自研的图灵芯片,并且一次就搭载3颗,拥有超过2200 Tops的算力。基于这个级别的算力,小鹏正在云端训练超大规模的VLA模型,称之为VLA-OL(Online Reenforcement Learning);接下来,小鹏将通过蒸馏的方式将VLA部署到车端。
除了新势力自研的阵营,传统厂商一侧其对VLA技术也有强烈的兴趣。供应商中,元戎启行可能是对VLA推进得最早、最快的一家公司,其在去年6月份第一次对外公开谈到在开发VLA,其预计今年将有至少5款车搭载元戎启行提供的VLA模型上市,其中最早的车型预计在三季度量产并上线功能。
智能辅助驾驶已经成为新车销售中的关键配置,今年伴随着英伟达DRIVE Thor等新一代芯片上车,整个行业正经历技术换代。
以VLA为代表的新模型能带来什么样的变化,这不仅是当下时下汽车行业的开发者们翘首以待的,甚至有准备购车的车主都在密切关注——毕竟动辄30万元级的购车决策,谁也不想刚买的新车在关键配置上很快落后。
关于新一代的VLA模型有什么功能,理想在今年3月份的GTC上已经给了一些小小的剧透;而最近一周内,元戎启行的CEO周光在火山引擎Force大会上披露了更多细节。元戎重点展示了基于VLA 4个主要的能力:
这些功能目前都已经有demo展示,元戎还预告了接下来还会有新的功能陆续会上线,包括豪车识别功能以及在园区里找充电桩等。
其实在过去几个月里,我们已经初步体验了一些新一代的系统,包括蔚来基于世界模型NWM的新版本,以及理想在新版AD Max(基于NVIDIA Drive Thor U平台)上部署的初代Agent能力。
其中最大的感受是新的模型对场景的认知大幅提升,系统不再是执行一个简单的「A点移动到B点」的指令,而是会根据语音下达的需求,认识、思考、执行,从而提高增加辅助驾驶功能的便利性。比如在停车场,能根据需要找到地库的电梯口;能主动理解掉头的需求,并且找到合适的点位掉头。
不过目前我们已经体验过的demo都限于封闭地库或者园区场景,元戎给出的新功能则更多针对开放场景,看起来组合更加丰富。
基于更大算力和先进架构的模型,显然还会有更多的功能推出。在G7上怼了3颗图灵芯片的小鹏也给了这个预期,「G7出来的时候,后面每个月都会增加新的有趣的功能,会有很多新的行业没有的功能出来,这是算力带来的想象空间。」
在过去一年,几乎所有主流的车企在辅助驾驶上都更新成了端到端大模型驱动的系统,在短时间内性能和体验提升都比较明显。但端到端黑盒的研发模式,导致了部分Corner Case无法追溯产生的原因,这也导致一部分车企很快地从「热恋期」进入到了「瓶颈期」。
即使是当前TOP级别的端到端系统,在面临复杂道路结构叠加复杂车流博弈时大多数情况也会崩溃。行业普遍面临瓶颈,所以很自然地有公司开始探寻上限更高的新架构。
而VLA通过语言模型的引入,很好地解决了研发和用户两端黑盒的问题。