• 点赞
  • 评论
  • 收藏

A推理狂潮来袭 英伟达(NVDA.US)全力迎战TPU! 拿下Groq核心团队后瞄准AI21 Labs

智通财经07:48

智通财经APP获悉,有媒体援引知情人士透露的消息报道称,“AI芯片超级霸主”兼全球最高市值公司英伟达(NVDA.US)在此前豪掷200亿美元拿下Groq核心团队后不久,正在就以20亿美元至30亿美元收购总部位于以色列的人工智能领军者AI21 Labs进行深入收购谈判。

英伟达此次欲拿下AI21 Labs,加之前不久与AI芯片初创公司Groq达成的200亿美元非独家授权合作协议,将其AI推理技术授权给英伟达,并且在交易完成后Groq创始人及核心研发团队将加入英伟达,可谓共同凸显出随着“全球AI推理大浪潮”全面来袭,叠加谷歌TPU AI算力集群带来的越来越大竞争压力,英伟达力争通过“多架构AI算力+巩固CUDA生态+引进更多AI芯片设计人才”来维持其在AI芯片领域高达80%市场份额的绝对主导权,并且英伟达欲以Groq+AI21连下关键两子锁住AI全栈话语权。

据了解,以色列AI初创公司AI21 Labs聚焦于开发大语言模型(即LLM),并使企业能够快速构建类似ChatGPT的定制化企业级生成式AI应用,在企业AI生态具备重要地位。该公司于2017年由Amnon Shashua共同创立,Shashua同时也是自动驾驶领域主导者Mobileye(MBLY.US)的联合创始人兼首席执行官。

据媒体报道称,这家AI初创公司在2023年的一轮由英伟达(NVDA.US)和谷歌(GOOGL.US)领投的融资之后,经历最近一次的融资后的整体估值约为14亿美元。该公司约有200名员工,其中许多人拥有高等理工科学位并在AI应用开发方面具备非常丰富的经验。这意味着英伟达可能更看重AI21顶尖员工们的综合AI技能组合,而不仅仅是该公司的技术本身。

黄仁勋越来越青睐以色列科技公司

过去几年里,英伟达一直在积极收购总部位于以色列的那些最顶级科技公司。比如在去年12月,英伟达正式完成对Run:ai的收购;Run:ai的独家技术可大幅提升英伟达AI芯片综合能效,并能大幅减少完成任务所需的具体GPU数量。交易条款从未披露,但此前有媒体报道称英伟达为该项收购支付了大约7亿美元。

同一年,英伟达还收购了Deci,该公司对AI大模型进行基于独家技术的深度改造以确保其以更低成本高效率运行。而在2019年,英伟达以69亿美元收购了当时以色列最热门科技公司Mellanox——一家端到端以太网与InfiniBand高速智能互连解决方案与网络服务的领先综合供应商,面向服务器与存储,Mellanox的核心技术可谓是英伟达当前所主导的“InfiniBand + Spectrum-X/以太网”高性能网络基础架构的最基础底座。

据媒体报道,英伟达当前正在Kiryat Tivon建设一座大型研发中心,该地位于以色列海法以南。曾有媒体报道称,英伟达首席执行官兼联合创始人黄仁勋曾将以色列称为其领导的这家芯片公司的“第二故乡”。

英伟达曾表示,大型研发园区建成后,将包括高达160000平方米(大约170万平方英尺)的办公空间、公园和公共区域,占地90德南(22英亩),其设计灵感来自英伟达位于加利福尼亚州圣克拉拉的全球总部。英伟达预计,该项目将于2027年开工,预计2031年投入使用。

AI推理大浪潮来袭,英伟达感受到谷歌TPU带来的愈发强大竞争压力

英伟达AI GPU几乎垄断的AI训练侧需要更加强大的AI算力集群通用性以及整个算力体系的快速迭代能力,而AI推理侧则在前沿AI技术规模化落地后更看重单位token成本、延迟与能效。谷歌明确把Ironwood定位为“为AI推理时代而生”的TPU代际,并强调性能/能效/算力集群性价比与可扩展性。

当AI推理算力体系成为全球科技企业长期现金成本中心,客户们更愿意在云上选择更划算更具性价比的AI ASIC加速器。有媒体曾报道OpenAI通过谷歌云平台Google Cloud大规模租用TPU(谷歌TPU属于AI ASIC技术路线),核心动机之一就是降低AI推理成本——这是来自TPU竞争压力上升的最典型案例。

根据Semianalysis测算数据,谷歌最新的TPU v7 (Ironwood) 展现出了惊人的代际跨越,TPU v7的BF16算力高达4614 TFLOPS,而上一代被广泛使用的TPU v5p仅为459 TFLOPS,这堪称是整整一个数量级的提升。此外,TPU v7显存直接对标英伟达Blackwell架构的 B200,针对特定AI应用场景,架构上更具性价比与能效比优势的AI ASIC可以更容易地吃下主流推理端算力负载,比如TPU甚至能提供比英伟达Blackwell高出1.4倍的每美元性能。

过去TPU AI算力集群的核心约束之一是开发者栈与工程惯性(CUDA/PyTorch),而当谷歌大举推进TorchTPU并获得关键生态参与者们纷纷协作时,谷歌TPU对外部开发者的可达性提高,TPU对于英伟达AI GPU算力体系/NVIDIA CUDA生态的竞争优势就会在海量推理场景更快且更全面、深度地扩散与释放。

全球AI推理浪潮把竞争焦点从“谁能训练最强大的大语言模型”转向“谁能以最低成本、最低延迟把AI大模型规模化部署”,而TPU在“推理专用硬件 + 云交付 + 降低软件摩擦”上正在同时发力;英伟达通过Groq(推理专用能力与人才)与AI21(模型/企业应用栈与人才)同步补强,正是对这条竞争主线的直接回应。

当前超大规模AI推理需求正呈现每六个月翻一番的极速增长趋势,因此在AI推理大浪潮席卷而来以及谷歌TPU带来的愈发强大竞争压力的算力需求背景下,英伟达通过Groq拿到推理芯片思路与顶尖人才、并通过AI21补软件与模型侧能力,属于典型的“硬件技术路线多元化 + AI应用生态端到端绑定”防守/反击。

英伟达与AI芯片初创公司Groq的交易本质是非独占推理类AI芯片技术授权 + 吸纳Groq创始人/CEO Jonathan Ross等高管与部分核心工程团队,一些半导体行业分析师也强调Groq的独家芯片技术专注推理并用片上SRAM等方式降低数据搬运瓶颈,可谓直指推理阶段的成本/延迟痛点。

英伟达就20亿美元至30亿美元收购AI21 Labs进入深入谈判,且媒体最新报道点明英伟达可能更看重其约200人的高端AI人才与企业级生成式AI能力;英伟达若成功将AI21 Labs的大模型开发与企业应用能力纳入麾下,非常有利于英伟达在全球推理大爆发时期把客户更深地锁定在自家的“软件/平台/方案/NVIDIA生态系统”里,而不是单纯只做AI GPU供货商,有望更深层次嵌入企业客户们的“模型—应用—部署”AI生态链,进而能够巩固CUDA护城河以及大幅提升英伟达AI算力集群的粘性与议价权(避免未来推理端算力被更多自研AI ASIC芯片或者类似TPU的替代算力分流)。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

举报

评论

empty
暂无评论
 
 
 
 

热议股票

 
 
 
 
 

7x24