文/周雄飞 时隔两年多,特斯拉再次“开麦”。 与此前不同,这次特斯拉对于自家智能辅助驾驶算法进展的分享,并不是在AI Day的舞台上,而是在近日举办的计算机视觉顶会ICCV(International Conference on Computer Vision)期间。 特斯拉自动驾驶副总裁阿肖克·埃鲁斯瓦米(Ashok Elluswamy)作为嘉宾,在大会上发表了主题演讲。 有可能为了接上2023年6月他们提出端到端架构之后的“闭麦”,阿肖克从“特斯拉为何会选择端到端?”开始分享,但经过多年实践,他们也发现仅通过端到端想要做好智能辅助驾驶,存在一些挑战。 图源Tesla AI 首先就是端到端系统需要解决从极高维到极低维的映射问题,这种映射往往是多对一,因此要保证输出的正确性,训练难度可想而知。阿肖克的言外之意,或许是在强调端到端模型的“黑箱”问题。 基于特斯拉庞大的用户规模,每日可为他们产生相当于500年驾驶时长的数据,但其中多数是没有太多价值的常规场景数据,对于算法的长远泛化没有太大帮助。 为了解决这两个问题,特斯拉在架构和算法层面做了一些优化和调整,比如在输出决策控制指令前,还会输出OCC占用网络和3D高斯特征等视觉信息,以及思维链COT自然语言信息。 与此同时,基于庞大的真实数据基础,特斯拉还建立了名为“神经世界模拟器”的闭环仿真系统。通过这套系统,不仅可以训练算法,并且还能验证算法的正确性,好比同时是“训练场”和“考试场地”。 看到这里,是不是闻到有股熟悉的味道,这不就是国内车企们和自动驾驶企业布局的VLA模型和世界模型。换句话说,特斯拉已从之前站在讲台上的“老师”,变成了与理想、小鹏、吉利、**、地平线和Momenta一起探索智驾最终答案的“同学”。 或许正因这样,小鹏汽车CEO何小鹏曾表示:“实际上,国内任何一家有实力AI玩家,早就不care马斯克在做什么了”。