智能驾驶和具身智能领域正加速转向端到端神经网络架构,以替代传统分模块规则系统。该范式转变使研发重心从算法设计转向数据驱动的闭环体系构建,对数据规模、算力强度及工程稳定性提出指数级要求。
卓驭AI首席技术官陈晓智指出,传统‘打地鼠’式应对极端场景的方法已触达天花板,而端到端模型通过传感器输入直接映射驾驶动作,具备更强泛化能力。自变量机器人CEO王潜强调,机器人与物理世界交互复杂度远超车辆,模块化系统误差易累积放大,必须依赖统一模型学习物理共性规律,端到端成为具身智能唯一可行路径。
转向数据密集型研发带来三重现实挑战:其一,数据量达PB至EB级,部分客户算力需求达万卡规模;其二,长周期分布式训练任务对基础设施稳定性极为敏感,早期自建平台常因细小波动导致整轮失败;其三,数据质量与分布重要性远超数量,一条高质量真实世界数据对模型训练的有效性可达普通数据的数千倍乃至数万倍。行业由此建立精细化数据运营指标,如‘数据效率比’与‘TTE’(Time to Experience)评估模型。
为应对上述挑战,阿里云在2025云栖大会上推出‘Data+AI’一体化平台。该平台包含三层能力:一是稳定可靠的算力底座,依托ODPS平台十余年高并发实战经验,结合自研交换机、Serverless架构与自愈运维体系,实现硬件故障对上层无感替换;二是高度智能化的数据流水线,通过MaxFrame等加速技术及极致弹性并发能力,显著压缩PB级数据处理周期;三是开放前沿的工具生态,集成NVIDIA Physical AI软件栈与世界模型,在PAI平台提供覆盖数据管理、模型开发、训练、部署全链路的专用优化能力。
目前,超过80%的中国车企及多家头部机器人企业已将其数据处理与模型训推链路部署于阿里云大数据AI平台。阿里巴巴集团CEO吴泳铭指出,AI从‘辅助人’迈向‘超越人’的前提是连接并理解真实世界的全量原始数据,新一代自动驾驶正是基于海量原始摄像头数据实现能力跃升。阿里云所构建的已不仅是IT基础设施,而是承载AI时代核心生产力的‘超级AI云’——以数据为养料、以一体化数字地基为运行前提,支撑更高阶自动驾驶与更通用机器人落地,最终服务于出行安全提升与人类劳动解放的实际目标。


