缝缝补补没出路,小鹏第二代VLA直接掀桌开新局

文/周雄飞

“小鹏第二代VLA比行业第一流的选手领先接近5倍。”

春节还没过完,智驾圈就因小鹏汽车CEO何小鹏的这句话为之轰动。因为当前行业其他玩家们都在以“第一梯队”来证明自身的领先性,但像这样高调挑明领先多大差距的,只有何小鹏一人。

何小鹏会这样自信,也不是没有原因。按照他介绍,第二代VLA的实测表现可以做到安心丝滑的体验、全场景的智能辅助驾驶能力以及安全且高效的通行效率。

飞说智行在这两天也体验试驾了小鹏的第二代VLA,从三个多小时的体验来看,无论是面对城区道路、还是高架路段,甚至是没有车道线的乡村小道,都做到了丝滑且安全的通行,怪不得何小鹏之前敢带小鹏妈妈食堂的爸爸妈妈们直接上车。

小鹏第二代VLA的领先性,还体现在技术范式上。相较于传统VLA架构间的两次转译所带来的模型延时,小鹏率先行业提出了第二代VLA架构,使整个模型变得更加简洁。

更重要的是,小鹏他们还准备用第二代VLA这一套算法架构,从L2智能辅助驾驶直通L4自动驾驶,甚至打造具身机器人和飞行汽车等智能产品。放眼整个行业,这样的战略布局也是少有的创新。

飞说智行, 缝缝补补没出路,小鹏第二代VLA直接掀桌开新局

之所以能做到这点,或许正像小鹏通用智能中心负责人刘先明说的那样:“自动驾驶本质上是物理AI问题”。而在何小鹏看来,机器人和飞行汽车同样属于物理AI,要从算法层面打通这些物理AI,则需要基座模型以及一整套AI基础设施支撑。

对于基座模型,小鹏从去年就开始研发,目前已拥有一个720亿超大参数规模的世界基座模型,按照刘先明介绍,依靠该模型他们不仅解决了大量信号输入输出连续性差和反馈评价难两大行业问题。

除了基座模型之外,小鹏他们还打造了算力+数据一整套AI基础设施,通过大量高质量数据驱动和强化学习,来提升芯片-编译器-模型的联合优化效率,从而让小鹏实现了仅4个月迭代468版模型的成绩。

当下,整个行业已经打响物理AI的落地竞速赛,玩家们都在为了赢得最终胜利摩拳擦掌,而小鹏汽车已经给出了它的答案。

1、第二代VLA,打破物理AI边界的新范式

仅用4个月,小鹏第二代VLA就从亮相走到大规模量产。

去年11月的小鹏科技日上,小鹏正式推出了第二代VLA,彼时,整个智驾行业正处于世界模型和VLA哪个模型更好的争论之中。

但小鹏率先在模型架构范式上进行了创新,不仅通过世界基座模型更深度地理解现实世界的环境和规律,同时还降低了VLA模型的延时,由此第二代VLA的性能排到了行业前列。

对于第二代VLA的能力,何小鹏很早就提出希望做成妈妈都觉得安心的智驾,因此在开启专业媒体试驾评测之前,他就邀请小鹏总部“妈妈食堂”的各位妈妈们先上车体验该模型的能力,最后得到了“妈妈都爱用”的评价。

具体到性能上,重刹和急加速都减少了99%、安全接管也减少了,路面障碍物识别能力以及夜间决策准确性都得到了大幅提升。就像在面对人多复杂的夜市环境和路边乱七八糟的违停场景时,第二代VLA可以做到丝滑和安全的穿行。

飞说智行, 缝缝补补没出路,小鹏第二代VLA直接掀桌开新局

何小鹏口中的“智能涌现”还在持续涌现。就像在行车时遇到后面驶来救护车,第二代VLA准确识别,能像人类司机一样让出“生命通道”;甚至在面对交警查酒驾时,第二代VLA还停在交警边上让主驾司机吹气,当交警示意可以离开时,又很聪明地及时驶离。

第二代VLA作为原生多模态物理世界大模型,能像人一样能直接“看、听、读”,让感知与决策无缝连接。由此,何小鹏才有自信在会后的采访中说出了文章开头的那句结论。

但何小鹏并不满足,在他看来第二代VLA就是自动驾驶的“DeepSeek时刻”。

这个观点,何小鹏最早在今年的小鹏内部开工信中提出,在他看来第二代VLA是面向完全自动驾驶的第一个版本,换句话说他想用一套算法模型,跳过L3直接从L2通向L4自动驾驶。

这就意味着,以Waymo、萝卜快跑为代表的Robotaxi玩家可能会受到小鹏第二代VLA的挑战,毕竟后者是通过更低成本的技术方案,来做到比激光雷达混合感知方案上限更高的自动驾驶。

按照何小鹏透露,他们的Robotaxi将在今年开启试运营,飞说智行这两天凑巧在小鹏总部也看到了他们正在进行L4测试的Robotaxi车辆。

飞说智行, 缝缝补补没出路,小鹏第二代VLA直接掀桌开新局

小鹏Robotaxi测试车,飞说智行摄

在何小鹏的计划中,第二代VLA模型还会被应用到其他物理AI的打造上。据了解,分体式飞行汽车“陆地航母”和IRON人形机器人都将在今年量产落地。

这就意味着,小鹏用第二代VLA同一套算法架构,打破了智能汽车、机器人和飞行汽车等智能产品的算法边界和传统范式,让这些物理AI产品体内流淌着同样的“算法血液”,从而帮助AI更快地从数字世界进入现实世界。

小鹏能做到这些的背后,得益于他们很早就为此开始搭建物理AI的“地基”。

2、要应对现实世界问题,世界基座模型成为关键“地基”

打造物理AI需要一套怎样的算法模型?

首先现实世界中无时无刻存在大量且多模态的信息,依靠单一模态模型无法连续输入输出这些信息;其次,智能体在现实世界中的交互反馈难以预测和评价。

相较于在原有架构上缝缝补补,在刘先明看来,要解决以上这些物理世界问题则需要重新设计和打造一个基座模型。

除了刘先明,何小鹏此前也多次在公开场合表达过基座模型的重要性。“基座模型会成为物理AI世界的‘操作系统’,也是一切物理AI应用的基础。”

正因这样,于去年4月或更早,小鹏他们就开始研发参数量为720亿的世界基座模型,并且为该基座模型搭载了原生多模态Tokenizer模型和32倍超密视觉思维链(CoT)等能力。

飞说智行, 缝缝补补没出路,小鹏第二代VLA直接掀桌开新局

基于原生多模态Tokenizer模型,小鹏的基座模型就能把收集到的多模态信息,进行更早的前融合处理和编码,保证信息连续性输入和输出的同时,还避免了单一模态模型带来的信息损失和偏差。

而对于真实世界的反馈评价上,小鹏通过引入视觉思维链,可以做到高度实时的推理和给出最优的路径规划,就以遭遇慢行大车场景为例,基座模型会通过视觉思维链列举几种不同处理方案,最后通过评价体系打分选出最优解让车辆执行。

“正是基于这些底层的能力,就可以让基座模型具备很强的泛用能力,不会只针对智能辅助驾驶或者自动驾驶,其他的物理AI智能体复用能力已经在持续探索中。”刘先明这样对飞说智行说道。

飞说智行, 缝缝补补没出路,小鹏第二代VLA直接掀桌开新局

小鹏通用智能中心负责人刘先明

放眼整个行业,虽然之前也有其他一些玩家表达过要打造类似基座模型的计划,但就目前来看,小鹏的世界基座模型无论在参数量规模,还是性能上都应该处于行业前列位置。

并且,小鹏他们还打造了一个“云端模型工厂”。翻译下官方介绍,就是该“工厂”能通过强化学习把基座模型中好的能力留下、不好的能力进行优化矫正,再基于模型蒸馏技术把这些能力蒸馏生成性能少打折、但参数量更小的端侧模型,以便满足车端算力的要求完成上车部署。

正因云端模型工厂在智能辅助驾驶方面能做到这样的能力,由此让小鹏用一套VLA模型打通不同物理AI底层算法成为可能。

但小鹏想要打赢这场物理AI落地竞速赛,只有基座模型这一枚“弹药”可不够。

3、物理AI落地竞速赛,就是AI基础设施的“军备竞赛”

冲击L4,一直都是智驾行业的终极目标。

针对这个目标,目前整个行业中却出现了渐进派和跨越派两大阵营,前者阵营以**和长安等玩家为代表,认为要通往L4自动驾驶之前,L3有条件自动驾驶是必经的过渡阶段。

而小鹏则属于跨越派阵营的代表玩家,因为在他们看来可以直接从L2智能辅助驾驶阶段跨越到L4自动驾驶阶段,L3阶段虽然属于自动驾驶,但仍需驾驶员随时接管,实际使用中易因响应不及时引发安全隐患,这对硬件、软件、法律法规都是挑战。

何小鹏在近日召开的2026全国“两会”上,也提出了“我国自动驾驶政策应跳过L3阶段,直接从L2迈向L4”的建议。

何小鹏在前面提议,刘先明则是将其实现的架构师。为此,刘先明提出了一个“公式”——L4=模型x算力x数据x本体。其中的“模型”指的就是前述的第二代VLA以及基座模型,在此不再赘述。

飞说智行, 缝缝补补没出路,小鹏第二代VLA直接掀桌开新局

再来看算力方面,小鹏早在2024年8月就公开披露了以NPU为核心的自研芯片——图灵AI芯片,实现了全栈自研和软硬一体的模型开发体系,并且针对第二代VLA模型做了芯片-编译器-模型的全链路优化。

结果就是不仅把芯片的算力利用率进一步提升,按照刘先明介绍,目前单颗图灵AI芯片的有效算力已接近于10颗英伟达Orin-X的有效算力。同时还能让模型推理时延相比开源模型+通用芯片的组合降低超过60%,模型能力提升超20倍。

除了车端算力之外,小鹏他们很早就已建立起三万卡规模的智能算力集群,运行效率常年保持在90%以上,从而保证模型迭代效率。

不止是小鹏,目前**、阿里、腾讯、以及特斯拉和理想等玩家,都已加入这场“堆算力”的军备竞赛。

算力之外,数据也是重中之重。

像训练智能辅助驾驶或者自动驾驶模型,需要大量的高质量数据作为“养料”。以小鹏为例,他们单次训练模型所需的高质量数据规模已达到50PB,对应到第二代VLA整体的训练Token数量在4万亿左右,与训练的ChatGPT级别的模型规模相当。

对于这些数据的来源,何小鹏认为人类驾驶的数据是无限的,但要从这其中收集大量高质量的数据,变得更加重要。此外,按照刘先明介绍,小鹏除了采用人驾数据的同时,也会通过云端生成数据来做仿真训练,两者相辅相成。

基于以上这些AI基础设施和数据闭环的能力,小鹏让第二代VLA模型正保持着快速的迭代效率。

按照何小鹏介绍,自去年科技日以来,该模型已更新了468个版本,平均每天接近4版模型,就连过年期间模型的迭代也在进行着,来为VLA的持续优化提供保障。

飞说智行, 缝缝补补没出路,小鹏第二代VLA直接掀桌开新局

可以预见的是,基于第二代VLA模型的快速迭代,也能让小鹏的智能辅助驾驶、自动驾驶、机器人和飞行汽车等物理AI产品的能力持续进化,从而推动尽快应用落地。

从去年开始,已有越来越多车企把自身的发展战略设定为向AI公司转型,玩家们对于模型、算力和数据等AI基础设施的投入一定会加快布局,以便形成竞争优势。

正因这样在飞说智行看来,智能汽车行业中打响一场AI基础设施的“军备竞赛”已无法避免。

但就上文所分析的,在AI基础设施的体系化和完整度两方面来看,小鹏汽车应该已经处于行业领先位置。由此刘先明才会说:“因为我们在构建底层通用能力体系,这才是真正的代际差优势”。

基于此,有了加速度的小鹏汽车在之后的征程中,应该会越跑越快。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论