阿里巴巴正加速推进人工智能基础设施的自主化进程,已开始使用自研芯片训练AI模型。
据知情人士透露,阿里巴巴在今年年初已逐步将自主研发的“玄铁”系列Zhenwu处理单元(Zhenwu Processing Unit)投入实际生产环境,用于训练中低参数规模的AI模型,标志着其在大模型算力自主化道路上迈出关键一步。
与此前依赖英伟达GPU进行大规模训练不同,Zhenwu芯片是阿里达摩院联合平头哥半导体团队专为AI推理与轻量级训练场景设计的专用加速器。该芯片基于RISC-V架构深度优化,采用异构计算架构,在能效比和成本控制方面具有显著优势,尤其适用于模型微调、数据预处理、多模态小模型训练等对算力密度要求较高但无需极致并行的环节。
目前,Zhenwu芯片已在阿里内部多个业务线试运行,包括通义千问(Qwen)的轻量级版本训练、淘宝推荐系统的实时增量学习、菜鸟智能分单模型迭代等场景。据内部测试数据显示,在同等任务下,Zhenwu芯片集群相较传统GPU方案可降低约35%的训练能耗,并减少20%以上的单位算力成本,同时规避了国际供应链波动带来的交付风险。
阿里云智能集团CTO周靖人曾公开表示:“我们不追求‘所有芯片都自研’,但必须掌握核心能力。”Zhenwu的落地,正是这种务实路径的体现——不盲目追求最高算力,而是用最适合的芯片解决最实际的问题。