全国首个千卡国产工科智算集群,为什么非海光不可?
导语:
从北京到上海,从综合性大学到顶尖科研院所,过去的一两年内,AI算力基础设施的建设浪潮席卷了整个教育界。
其中最为瞩目的,莫过于上海交大的“致远一号”,覆盖理工人文全学科的“通用”智算平台,早已成为业内教科书式的标杆。
然而,同处上海的另一所百年工科强校同济大学,在刚过119周年校庆之际,独家携手海光信息达成战略签约,并启动全国首个国产千卡工科智算集群。
工科强校的“仿真之痛”,国产算力真的能治吗?当别人都在卷大模型,谁来解决工程落地的真问题?全国那么多国产算力厂商,同济为什么独家选择海光?桃李财经带来独家视角解读。
主笔/ 佳佳;文章架构师/ 拓拔野;出品/ 桃李财经
01 工科强校的“仿真之痛”
同济大学土木工程学科稳居全球第一,建筑、机械、海洋等学科实力同样身处第一梯队。
但鲜少有人意识到一个问题:这些全球顶尖的工科,每天在实验室里跑的不是大模型,而是ANSYS、ABAQUS、流体力学、结构仿真。一台摩天大楼的结构受力分析、一座跨海大桥的抗风稳定性计算、一艘深海潜水器的耐压壳体设计,这些需要的不是“理解一句话”,而是“算准一个值”。
偏偏在这个领域,全国高校普遍陷入一个尴尬的矛盾。
市面上NPU架构为AI训练推理而设计,在大模型场景中表现出色,但面对工程仿真所需的FP64双精度浮点计算和高端混合计算,并非其设计目标。这类场景是通用GPGPU的天然领地,而传统CPU跑工程仿真又太慢,一个数万网格的流体力学模型,用单台工作站跑下来,少则数小时,多则数天。
更要命的是,很多高校的教学科研代码,都是在CUDA生态下写成的。一旦换成国产算力,要么推倒重写,要么耗费大量精力做平台适配。
而从政策导向来看,人工智能与教育的融合早已不是锦上添花,而是刚性需求,不能停留在少数学科的浅层应用中,必须加速向多学科场景下沉,让AI真正成为工程、医学、农业等各领域教学科研的基础能力。算力、数据、算法和人才的协同供给,正在成为教育数智化转型的核心命题。
同济需要的,不是一个仅用于训练大模型的“通用平台”,而是一个“既懂工程、又能国产、还能无感迁移”的算力定制底座。这种工科专用的差异化需求,需要算力方案在兼容性、工程计算能力和自主可控三个维度上同时给出答案。
谁来支撑,成了同济必须回答的问题。
02 海光凭什么成为“唯一解”?
事实上,市场上并非没有备选项。
目前主流的AI算力路线大致可分为两类:一类是NPU架构的AI专用计算路线,为AI训练推理而设计,在通用大模型场景中表现出色;另一类则是基于GPGPU架构的高端计算路线,既面向AI计算,也兼顾更广泛的科学计算与工程仿真场景。
海光DCU正是后一条路线的代表。
GPGPU本身就是通用图形处理器的延伸,天然具备更广泛的通用计算能力。如果说NPU是为AI“量身定做”的专用赛道,那么GPGPU就是一条“既跑得了AI、也跑得了工程仿真”的通用大道。
而海光DCU的关键在于,它走的是“CUDA”原生兼容+全精度原生高端计算的技术路线。这套方案的核心价值体现在几个层面:
· 兼容性层面:海光DCU全面兼容CUDA生态,算子覆盖度超过99%。正如海光信息总裁沙超群所言,海光始终致力于“为国产芯片注入高性能、高通用、高安全的基因”。同济现有的工程软件代码,从ANSYS、ABAQUS等商业软件到自主开发的土木工程模型,无需重写、无需二次开发,即可直接迁移。双方团队通力协作,让“存量代码迁移更加平滑无感,模型应用能够实时适配、快速上线”。
· 工程场景层面:海光DCU基于GPGPU架构和全精度计算能力,原生支持高端计算与AI的混合计算。海光DCU全面覆盖FP64、FP32、FP16、BF16、IN8、IN4等多种精度算力,使得同一套基于海光CPU+DCU的集群,既能高效支撑AI训练与推理,也能胜任对双精度算力有严苛要求的工程仿真、科学计算等任务。沙超群强调,这座集群“不只在于算力规模有多大、精度覆盖有多广,而是它能聚焦一些关键性、垂直性、实际性的应用场景,给出与之相匹配的系统化解决方案”。
· 安全可控层面:这座千卡集群基于海光DCU,可全面支撑大模型安全护栏应用,在关键数据保护和模型输出管控等环节,形成对国际主流方案的可替代能力,为涉及重大工程数据的科研任务筑起自主可控的安全防线。
市面上做国产芯片的不止海光一家。但能同时做到“GPGPU通用架构+CUDA生态兼容+AI计算+高端计算+纯国产”这几个维度的,海光是那个“最大公约数”。同济的“唯一解”,是在“工程刚需”这个窄门里,它是唯一能同时满足所有条件的那个选项。
03 同济×海光模式 = 一个可复制的“工科智算样板间”
要理解同济为什么选择海光,还需要把视野拉到更高维度。
当前国产算力赛道,正面临一场深刻的路线之争。一条是“封闭重建”路线,即自研指令集,生态从零开始。这条路的长期战略价值毋庸置疑,但短期内工科应用“等不起”。
另一条是“兼容进化”路线,即海光“兼容x86生态+自主研发迭代”,既保生态无缝迁移,又实现自主可控。这条路更难,因为它需要技术突破和商业验证“双线并行”。但正因为它难,所以壁垒更高、护城河更深。
同济的选择,本质上是对后一条路线的战略投票。
而海光为同济做的,远不止建一个千卡集群。光合组织副秘书长王圣勇指出,这座集群实现了“三个跨越”:技术生态向应用生态的跨越、产业力量与教育力量的协同跨越、从‘可用’到‘好用’的跨越。他还特别强调,光合组织将继续做好产业生态的“连接器”和“助推器”,“期待这座集群成为国产算力赋能工程教育的一面旗帜,为更多高校和关键行业领域提供可参考、可复制的范本”。
为什么说这是“可复制的范本”?因为同济的需求并非孤例。每一所有土木、机械、船舶、航空航天学科的工科强校,都面临着同样的“仿真之痛”,通用算力不适用、封闭生态等不起。海光在同济跑通的这套“GPGPU通用架构+工程场景深度优化”模式,具备向全国工科院校复制的潜力。
海光为同济提供的是一套完整的算力底座:从芯片到板卡、从整机到软件栈的一站式交付,让科研团队无需在底层基础设施上耗费精力。同时,双方在产教融合、联合培养高层次创新人才等方面持续深化合作,让这座集群既是科研工具,也是国产算力生态的“孵化器”。正如沙超群所说,海光要提供的是“懂教育、懂工程”的算力,让师生们“算得好、算得快,算得安全又省心”。
而这背后,是国家战略的强力支撑。八部门联合印发的《“人工智能+制造”专项行动实施意见》明确提出,到2027年推出1000个高水平工业智能体,推广500个典型应用场景。国务院《关于深入实施“人工智能+”行动的意见》则进一步要求推动AI与实体经济深度融合。
海光×同济的模式,恰好踩在了“人工智能+教育”和“人工智能+制造”的交汇点上。
04 桃李财经的思考
国运,更是每个关键赛道上的“唯一选择”堆出来的
119年前,同济大学在上海建校,校名取自德文“Deutsch”的谐音,寓意“同舟共济”,立志“工程救国”。彼时的中国,近代工业刚刚起步,最缺的就是精通现代工程技术的中国人。
119年后,同济再次站到一个历史节点上。校园里,上海自主智能无人系统科学中心的师生们正在攻关:人形机器人在复杂地形中的自主适应与全身动作生成,需要大规模并行仿真和强化学习训练;无人机群在弱通联场景中的自主通信与协同增强,需要高保真仿真环境支撑;水空跨介质无人机“同济飞鱼”的跨域协同,需要强大的算力支撑复杂协同算法运行。这些来自一线工科场景的需求,精准地指向同一个答案,一座真正“懂工程”的算力集群。
从工程救国到工程强国,中国用了近一百二十年。这条路从来不是规划出来的,而是一代代工程人用代码、图纸、实验数据堆出来的。海光走了一条更难的路,不是封闭重建,而是兼容进化。这条路让顶尖工科的教授们不用重写代码、不用等待适配、不用牺牲性能,就能用上纯国产的算力底座。
国运从来不是偶然的礼物,而是每一个关键赛道上“唯一选择”堆出来的必然。同济选择了海光,本质上是为中国的工程强国梦,投下了关键一票。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


