10月24日消息,以色列初创公司 NextSilicon 表示,将挑战英伟达在HPC/AI计算领域的主导地位,同时在CPU层面对标英特尔和AMD。
其即将推出的Maverick-2 号称为全球首款智能计算加速器芯片,并已正式投入生产。
据介绍,该芯片能执行部分与英伟达GPU相同的工作负责,以750W功耗实现 600 GFLOPS 的计算表现,其性能可对标高端 GPU,且功耗仅为英伟达产品的一半,使用过程中无需重写软件。
图源:economictimes
与此同时,NextSilicon 首次对外披露其自主研发的 RISC-V 处理器 Arbel,预计将与 Maverick-2 搭载形成类似英伟达“Superchip”的组合形态。
Arbel 的单核性能据称可与英特尔“LionCove” Xeon 和 AMD “Zen5” Epyc 核心相媲美。
NextSilicon 成立于2017年,目前共完成三轮融资,累计筹集资金2.026亿美元。
图源:NextSilicon
那么,Maverick-2 的硬件配置到底如何?
据现有资料,Maverick-2采用台积电5nm工艺制造,晶体管数量达540亿颗,提供单芯片和双芯片版本,主频为1.5GHz。其支持 PCIe Gen5 x16,配备 96GB HBM3E 显存,带宽可达每秒3.2TB,拥有128MB 一级缓存以及100GbE 网卡。
单芯片 TDP 为400W,可风冷散热;双芯片版本要求OAM(OCP加速器模块)接口,热设计功耗为750W,支持风冷和液冷两种方案。
在架构层面,Maverick-2 包含224个计算块,每块拥有数百个ALU,总量达到数万级接近十万个ALU,可轻松执行成千上万线程,并保持1.5GHz的运行频率。
计算区域分为4个区域,两侧边缘带有32个RISC-V E核用于辅助控制。
图源:NextSilicon
对比英伟达现有高端GPU产品:
A100(台积电7nm工艺):542亿晶体管,6912 FP32核心;
H100 / H200(台积电4nm):800亿晶体管,18432 FP32核心;
Blackwell B200:每芯片1040亿晶体管,16896 CUDA核心,采用双芯片封装。
业内推测,Maverick-2 将通过“大量ALU+高效调度”方式,在部分计算类型中对标或者在特定任务中超过GPU效率。
性能指标方面,在每秒千兆次更新(GUPS)测试中,Maverick-2 在460W功耗下实现32.6 GUPS,较CPU快22倍,较GPU快近6倍。
在HPCG(高性能共轭梯度)测试中,以750W功耗实现600 GFLOPS,性能可对标行业领先GPU,但能耗约为对手的一半。
图源:NextSilicon
再来看 Arbel 的RISC-V 处理器。
Arbel 采用台积电5nm工艺,最高主频达2.5GHz,拥有10宽发射管线、480条重排序缓冲区,以及4个128位向量单元支持SIMD工作负载。
单核包括6个整数ALU、4个128位FPU,可并行处理16条标量指令,编解码宽度达10路。缓存架构为64KB指令缓存 + 64KB数据缓存 + 1MB L2缓存,核心配有2MB缓存,但总核数尚未公布。
图源:NextSilicon
从目前公布的信息来看,NextSilicon试图通过“定制化架构+RISC-V CPU+智能调度”挑战英伟达在HPC/AI计算领域的主导地位,同时在CPU层面对标英特尔和AMD。
如果 Maverick-2 能真正在无代码迁移前提下替代GPU处理特定任务,并实现功耗优势,其在高性能计算市场有望获得一席之地。
立创商城开展“2025中国电子工程师年度调研”
扫下方二维码完成问卷,送30采购晶!
全程匿名,请放心填写
消息数据来源:路透社、NextSilicon、economictimes
、、
*文章内容仅为分享与讨论,不代表我方赞成或认同。部分图文素材源于网络,侵权请联系删除!
End
_
_
文章精选
_
芯片告急!汽车巨头或将停产
9.5亿,国产芯片龙头成功收购!
欧美车企集体恐慌,荷兰:将与中方寻求化解安世半导体僵局
盘点国产56家MCU公司!
阅读原文注册享8元运费券
“在看”、“点赞”
精彩评论