社区
首页
集团介绍
社区
资讯
行情
学堂
TigerAI
登录
注册
点赞
1
回复
评论
收藏
编组 21备份 2
分享
矩形
源自
02-28
讲故事已经不行了!AI不赚钱只有芯片赚钱!
报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计
据华尔街日报援引消息人士称,英伟达正准备推出一款专用芯片,以撼动人工智能计算领域的竞争格局。OpenAI即将成为英伟达新款处理器的最大客户之一。
报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
形状备份
1
举报
登录后可参与评论
评论
推荐
最新
暂无评论
热议股票
{"i18n":{"language":"zh_CN"},"data":{"magic":2,"id":537507841831312,"tweetId":"537507841831312","gmtCreate":1772248457347,"gmtModify":1772248460080,"author":{"id":3439498180568292,"idStr":"3439498180568292","authorId":3439498180568292,"authorIdStr":"3439498180568292","name":"源自","avatar":"https://static.tigerbbs.com/adf8535711666c83bb51b225d892a9b9","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":9,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":20,"starInvestorFlag":false},"themes":[],"images":[],"coverImages":[],"title":"","html":"<html><head></head><body><p>讲故事已经不行了!AI不赚钱只有芯片赚钱!</p></body></html>","htmlText":"<html><head></head><body><p>讲故事已经不行了!AI不赚钱只有芯片赚钱!</p></body></html>","text":"讲故事已经不行了!AI不赚钱只有芯片赚钱!","highlighted":1,"essential":1,"paper":1,"likeSize":1,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/537507841831312","repostId":1174813257,"repostType":2,"repost":{"id":"1174813257","kind":"news","pubTimestamp":1772248210,"share":"https://www.laohu8.com/m/news/1174813257?lang=zh_CN&edition=full","pubTime":"2026-02-28 11:10","market":"us","language":"zh","title":"报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计","url":"https://stock-news.laohu8.com/highlight/detail?id=1174813257","media":"华尔街见闻","summary":"据华尔街日报援引消息人士称,英伟达正准备推出一款专用芯片,以撼动人工智能计算领域的竞争格局。OpenAI即将成为英伟达新款处理器的最大客户之一。","content":"<html><head></head><body><blockquote><p>英伟达即将推出的推理芯片系统整合了Groq的“语言处理单元”(LPU)技术,采用与传统GPU截然不同的架构,通过更广泛的SRAM集成和3D堆叠技术,专门针对大模型推理中的延迟和内存带宽瓶颈进行优化。该新品可能基于下一代Feynman架构设计,从而大幅降低AI智能体运行的能耗与成本。OpenAI承诺采购并投资300亿美元。</p></blockquote><p style=\"text-align: justify;\">英伟达计划在下个月的GTC开发者大会上发布一款整合了Groq“语言处理单元”(LPU)技术的全新推理芯片,代表着英伟达正加速向推理计算领域转型,以应对客户对高效能、低成本计算方案的迫切需求。</p><p style=\"text-align: justify;\">据华尔街日报报道,这款被英伟达首席执行官黄仁勋称为“世界从未见过”的全新系统,专为加速AI模型的查询响应而设计。该产品的推出预计将重塑当前的AI算力市场格局,直接影响正在寻找更具成本效益替代方案的云服务提供商和企业级投资者。</p><p style=\"text-align: justify;\">作为市场对该技术初步认可的重要标志,ChatGPT开发商OpenAI已同意成为该新处理器的最大客户之一,并宣布将向英伟达购买大规模的“专用推理产能”。这一举动不仅稳固了英伟达的核心客户盘,也向市场发出了明确信号:<strong>支持自主AI智能体的底层基础设施正从大规模预训练转向高效推理。</strong></p><p style=\"text-align: justify;\">在面临谷歌、亚马逊以及众多初创公司激烈竞争的背景下,英伟达正在突破传统图形处理器(GPU)的单一依赖。通过引入新的技术架构以及探索纯中央处理器(CPU)的部署模式,该公司试图在AI产业演进的下一阶段继续巩固其市场统治地位。</p><h2 id=\"id_1839684853\">整合LPU设计,直击大模型推理瓶颈</h2><p style=\"text-align: justify;\">随着AI行业从模型训练向实际应用部署转移,推理计算成为核心焦点。AI推理主要分为预填充(pre-fill)和解码(decode)两个阶段,其中大型AI模型的解码过程尤其缓慢。针对这一技术瓶颈,英伟达选择通过外部技术整合来突破物理极限。</p><p style=\"text-align: justify;\">据华尔街日报报道,英伟达去年底斥资200亿美元获得了初创公司Groq的关键技术许可,并在一场大规模的“核心聘用”交易中吸纳了包括创始人Jonathan Ross在内的高管团队。<strong>Groq所设计的“语言处理单元”(LPU)采用了与传统GPU截然不同的架构,在处理推理功能时表现出极高的效率。</strong></p><p style=\"text-align: justify;\">业内分析认为<strong>,即将发布的新品可能涉及具备颠覆性的下一代Feynman架构。</strong>据华尔街见闻此前文章,Feynman架构可能采用更广泛的SRAM集成方案,甚至通过3D堆叠技术将LPU深度整合其中,专门针对延迟和内存带宽这两大推理瓶颈进行优化,从而大幅降低AI智能体运行的能耗与成本。</p><h2 id=\"id_381830009\">拓展纯CPU部署,提供多元化计算选择</h2><p style=\"text-align: justify;\">在引入LPU架构的同时,英伟达也在灵活调整其传统处理器的使用方式。英伟达以往的标准做法是将Vera CPU与其强大的Rubin GPU捆绑在数据中心服务器中,但在处理某些特定的AI智能体工作负载时,这种配置被证明成本过高且能效不足。</p><p style=\"text-align: justify;\">部分大型企业客户发现,纯CPU环境在运行特定AI任务时更为高效。顺应这一趋势,英伟达本月宣布扩大与Meta Platforms的合作,进行了首次大规模的纯CPU部署,以支持Meta的广告定向AI智能体。这一合作被市场视为英伟达战略调整的早期窗口,<strong>表明公司正超越单一的GPU销售模式,试图通过多元化的硬件组合来锁定AI市场的不同细分领域。</strong></p><h2 id=\"id_105325306\">市场需求换挡,竞争态势持续升级</h2><p style=\"text-align: justify;\">这种底层硬件设计的演进,直接源于科技行业对AI代理应用需求的爆发。<strong>许多构建和运营AI智能体的公司发现,传统的GPU成本过于昂贵,且在实际运行模型时并非最佳选择。</strong></p><p style=\"text-align: justify;\">OpenAI的动向凸显了这一趋势。<strong>除了承诺采购英伟达的新系统以改进其快速增长的Codex工具外,OpenAI上个月还与初创公司Cerebras达成了一项价值数十亿美元的计算合作。</strong>据Cerebras首席执行官Andrew Feldman称,其专注于推理的芯片在速度上超越了英伟达的GPU。此外,OpenAI还签署了使用亚马逊Trainium芯片的重大协议。</p><p style=\"text-align: justify;\"><strong>不仅是初创公司,主要云服务商也在加紧自研芯片步伐。</strong>被广泛视为自动编码市场领导者的Anthropic Claude Code,目前主要依赖亚马逊AWS和Alphabet旗下谷歌云设计的芯片,而非英伟达的产品。面对竞争对手的围剿,黄仁勋在接受wccftech采访时强调,英伟达正从单纯的芯片供应商向涵盖半导体、数据中心、云和应用的完整AI生态系统构建者转型。对于投资者而言,下个月的GTC大会将是检验英伟达能否在推理时代延续其90%市场份额神话的关键节点。</p></body></html>","source":"lsy1762389672944","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n报道:英伟达在下月GTC大会推出“新推理芯片”,融入Groq LPU设计\n</h2>\n\n<h4 class=\"meta\">\n\n\n2026-02-28 11:10 北京时间 <a href=https://wallstreetcn.com/articles/3766417><strong>华尔街见闻</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>英伟达即将推出的推理芯片系统整合了Groq的“语言处理单元”(LPU)技术,采用与传统GPU截然不同的架构,通过更广泛的SRAM集成和3D堆叠技术,专门针对大模型推理中的延迟和内存带宽瓶颈进行优化。该新品可能基于下一代Feynman架构设计,从而大幅降低AI智能体运行的能耗与成本。OpenAI承诺采购并投资300亿美元。英伟达计划在下个月的GTC开发者大会上发布一款整合了Groq“语言处理单元”(...</p>\n\n<a href=\"https://wallstreetcn.com/articles/3766417\">网页链接</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/3f1c866c487eb9e101f73a62d4495ce9","relate_stocks":{"NVDA":"英伟达"},"source_url":"https://wallstreetcn.com/articles/3766417","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1174813257","content_text":"英伟达即将推出的推理芯片系统整合了Groq的“语言处理单元”(LPU)技术,采用与传统GPU截然不同的架构,通过更广泛的SRAM集成和3D堆叠技术,专门针对大模型推理中的延迟和内存带宽瓶颈进行优化。该新品可能基于下一代Feynman架构设计,从而大幅降低AI智能体运行的能耗与成本。OpenAI承诺采购并投资300亿美元。英伟达计划在下个月的GTC开发者大会上发布一款整合了Groq“语言处理单元”(LPU)技术的全新推理芯片,代表着英伟达正加速向推理计算领域转型,以应对客户对高效能、低成本计算方案的迫切需求。据华尔街日报报道,这款被英伟达首席执行官黄仁勋称为“世界从未见过”的全新系统,专为加速AI模型的查询响应而设计。该产品的推出预计将重塑当前的AI算力市场格局,直接影响正在寻找更具成本效益替代方案的云服务提供商和企业级投资者。作为市场对该技术初步认可的重要标志,ChatGPT开发商OpenAI已同意成为该新处理器的最大客户之一,并宣布将向英伟达购买大规模的“专用推理产能”。这一举动不仅稳固了英伟达的核心客户盘,也向市场发出了明确信号:支持自主AI智能体的底层基础设施正从大规模预训练转向高效推理。在面临谷歌、亚马逊以及众多初创公司激烈竞争的背景下,英伟达正在突破传统图形处理器(GPU)的单一依赖。通过引入新的技术架构以及探索纯中央处理器(CPU)的部署模式,该公司试图在AI产业演进的下一阶段继续巩固其市场统治地位。整合LPU设计,直击大模型推理瓶颈随着AI行业从模型训练向实际应用部署转移,推理计算成为核心焦点。AI推理主要分为预填充(pre-fill)和解码(decode)两个阶段,其中大型AI模型的解码过程尤其缓慢。针对这一技术瓶颈,英伟达选择通过外部技术整合来突破物理极限。据华尔街日报报道,英伟达去年底斥资200亿美元获得了初创公司Groq的关键技术许可,并在一场大规模的“核心聘用”交易中吸纳了包括创始人Jonathan Ross在内的高管团队。Groq所设计的“语言处理单元”(LPU)采用了与传统GPU截然不同的架构,在处理推理功能时表现出极高的效率。业内分析认为,即将发布的新品可能涉及具备颠覆性的下一代Feynman架构。据华尔街见闻此前文章,Feynman架构可能采用更广泛的SRAM集成方案,甚至通过3D堆叠技术将LPU深度整合其中,专门针对延迟和内存带宽这两大推理瓶颈进行优化,从而大幅降低AI智能体运行的能耗与成本。拓展纯CPU部署,提供多元化计算选择在引入LPU架构的同时,英伟达也在灵活调整其传统处理器的使用方式。英伟达以往的标准做法是将Vera CPU与其强大的Rubin GPU捆绑在数据中心服务器中,但在处理某些特定的AI智能体工作负载时,这种配置被证明成本过高且能效不足。部分大型企业客户发现,纯CPU环境在运行特定AI任务时更为高效。顺应这一趋势,英伟达本月宣布扩大与Meta Platforms的合作,进行了首次大规模的纯CPU部署,以支持Meta的广告定向AI智能体。这一合作被市场视为英伟达战略调整的早期窗口,表明公司正超越单一的GPU销售模式,试图通过多元化的硬件组合来锁定AI市场的不同细分领域。市场需求换挡,竞争态势持续升级这种底层硬件设计的演进,直接源于科技行业对AI代理应用需求的爆发。许多构建和运营AI智能体的公司发现,传统的GPU成本过于昂贵,且在实际运行模型时并非最佳选择。OpenAI的动向凸显了这一趋势。除了承诺采购英伟达的新系统以改进其快速增长的Codex工具外,OpenAI上个月还与初创公司Cerebras达成了一项价值数十亿美元的计算合作。据Cerebras首席执行官Andrew Feldman称,其专注于推理的芯片在速度上超越了英伟达的GPU。此外,OpenAI还签署了使用亚马逊Trainium芯片的重大协议。不仅是初创公司,主要云服务商也在加紧自研芯片步伐。被广泛视为自动编码市场领导者的Anthropic Claude Code,目前主要依赖亚马逊AWS和Alphabet旗下谷歌云设计的芯片,而非英伟达的产品。面对竞争对手的围剿,黄仁勋在接受wccftech采访时强调,英伟达正从单纯的芯片供应商向涵盖半导体、数据中心、云和应用的完整AI生态系统构建者转型。对于投资者而言,下个月的GTC大会将是检验英伟达能否在推理时代延续其90%市场份额神话的关键节点。","news_type":1,"symbols_score_info":{"NVDA":2}},"isVote":1,"tweetType":1,"viewCount":371,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":38,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"hasMoreComment":false,"orderType":2}