(以下内容从华福证券《传媒行业动态跟踪:英伟达:Groq赋能推理算力》研报附件原文摘录)
投资要点:
一、事件背景:英伟达与AI推理芯片公司Groq战略合作
12月24日,AI芯片初创公司Groq宣布与英伟达就推理技术达成非独家许可协议。根据协议,Groq创始人JonathanRoss、总裁SunnyMadra及核心团队将加入英伟达,共同推进授权技术的升级与规模化应用。Groq将继续作为独立公司运营,SimonEdwards接任CEO职务,GroqCloud云服务保持正常运行。
Groq商业化在2024年突破,已与Meta、主权AI达成合作。Groq创立于2016年,2024年8月、2025年2月和9月,Groq分别完成三轮融资,引入思科、三星、德国电信等产投。截至2024年9月,Groq已吸引超过200万开发者用户,并拿下多个重量级客户:与Meta合作运行Llama大模型,与沙特阿美达成15亿美元协议建设全球最大AI推理数据中心,成为加拿大贝尔主权AI网络的独家推理提供商。
二、行业趋势:推理市场整体高速扩张
推理算力需求高速增长。当前全球AI产业正从模型训练阶段迈入规模化推理落地的关键期,低延迟、高能效的推理算力成为核心刚需。
国内外推理Tokens增长共振。海外侧,截至今年7月,谷歌月度处理Tokens达980万亿,相较5月翻倍;国内侧,截至今年12月豆包大模型日均调用量已经突破50万亿Tokens,较去年同期增长超过10倍。
三、Groq技术价值:LPU+SRAM架构优化推理效果
GroqLPU设计纲领为“为速度和精确度而生”。LPU采用编译期静态调度与确定性执行架构,从而在运行大型语言模型等推理任务时实现逐token的可预测、低延迟执行。据官网,LPU运行大型语言模型及其他主流模型的速度显著更快。
Groq选择以片上SRAM作为核心存储。片上SRAM作为主要权重存储,显著降低了访问延迟,允许计算单元以全速拉入权重,通过将单层拆分到多个芯片实现张量并行。这种架构成为部署快速且可扩展推理的优势。
Groq第二代LPU采用三星4nm工艺节点。Groq第一代LPU芯片采用GlobalFoundries14nm制程工艺节点,Groq第二代LPU采用三
星(SF4X)制程工艺节点,在三星德州泰勒工厂制造。Groq两代芯片均未绑定台积电先进制程需求。
四、投资建议
看好国内外推理算力需求增长和相关产业链。国内端,建议关注晶圆厂和上游设备扩产需求。海外端,建议关注推理算力需求增长下带动的光模块、机柜组装代工需求增长。
风险提示:
大模型竞争激烈,大模型推理竞争激烈


