方舟投研在上周五就做了 GTC 大会的前瞻,提前布局,想必一定会有收获。
2025 NVIDIA GTC 大会前瞻,定义 AI 的下一站
昨晚(10月28日)在华盛顿特区的GTC大会上,NVIDIA创始人兼CEO黄仁勋向整个行业描绘了一幅通向新工业革命的详尽蓝图。
在一个多小时的演讲中,他系统性地阐述了AI如何从根本上重塑计算范式,并发布了革命性的Blackwell平台,定义了“AI工厂”这一全新基础设施概念。这是不仅是英伟达的一次产品迭代,也是一场关于未来生产力、AI 行业发展的竞争力宣言。
对AI的狂热情绪推动美股三大指数再度创下新高,英伟达的市值也来到了5万亿的关口。
本文是对此次 GTC 大会的核心观点总结与演讲全文回顾, 演讲内容超 2 万字,信息密度很大。不能一定完整阅读。
你可先关注我们,将文章转发给自己,优先阅读方舟投研总结的演讲核心观点总结部分,再查看对应演讲部分,或点击文末阅读原文可查看完整演讲视频。
我们在《方舟全球产业研究》中也对AI时代下的核心行业进行了系统性跟踪。
团队持续追踪国产算力、有色金属、全球机器人、智能驾驶、半导体、AI算力、创新药、固态电池、光刻机、脑机接口等关键赛道, 从产业链结构、核心公司竞争力到资本流向与政策趋势,提供深度行业研究与每日简报。
如果你希望在投资决策中比别人更早一步洞察趋势,这会是你获取第一手研究视角的高质量知识社区。
老虎社区只能发布万字长文,全文内容可搜【方舟投研】查看。
演讲视频时间章节:
-
• 0:00:03 美国科技创新发展历程回顾
-
• 0:04:18 黄仁勋GTC主题演讲开场
-
• 0:06:03 英伟达加速计算及CUDA生态系统
-
• 0:15:06 英伟达与诺基亚合作及6G技术展望
-
• 0:21:33 量子计算技术突破及NVQ Link发布
-
• 0:30:35 人工智能的定义与计算堆栈的变革
-
• 0:37:56 人工智能应用与商业模式的演变
-
• 0:47:14 摩尔定律终结与协同设计的重要性
-
• 1:00:50 英伟达业务增长及Blackwell芯片介绍
-
• 1:15:25 NVIDIA Omniverse DSX:构建AI工厂的蓝图
-
• 1:26:35 物理人工智能与机器人技术应用
-
• 1:35:56 轮式机器人与无人驾驶技术进展
演讲核心观点总结
摩尔定律的终结
演讲的开篇,黄仁勋直指当前计算行业面临的根本性挑战:摩尔定律的终结。
他指出,晶体管数量的增长已无法带来同等的性能与功耗优化。在这个物理定律的瓶颈期,传统CPU的顺序处理模式已难以为继。
英伟达的答案,是其耗费三十年心血构建的“加速计算”范式。
黄仁勋称,GPU本身固然重要,但其真正的护城河在于庞大而成熟的CUDA生态系统。
这构成了一个强大的软件壁垒,使得各行各业的开发者能够无缝利用GPU的并行计算能力,解决通用计算无法触及的复杂问题。这不仅仅是硬件的胜利,更是生态的胜利。
新工业革命的核心基础设施——AI工厂
黄仁勋此前提出的最颠覆性的概念,无疑是“AI工厂”。他彻底重塑了我们对数据中心的认知。传统数据中心是信息存储和多种应用运行的通用设施,而AI工厂的目标则极为专一:生产智能。
黄仁勋认为,随着AI模型从简单的预训练发展到需要大量计算进行“后训练”和实时“思考推理”,对计算资源的需求正在经历双重指数增长:一是模型本身复杂度带来的计算需求;二是模型越智能、应用越广泛,用户越多,从而产生的计算需求。
我们需要做的是大幅降低成本,因此,“AI工厂”的终极目标,就是以最低的成本、最快的速度,生产出最智能的Token。
Blackwell平台:极限协同设计
为了实现AI工厂的极致效率,英伟达推出了革命性的Blackwell平台。黄仁勋将之称为“极限协同设计”的产物,其重要性被类比为“自IBM System 360以来最彻底的计算机重塑”。
协同设计意味着英伟达不再仅仅设计芯片,而是将芯片、系统、高速互联(NVLink)、网络(Spectrum-X)乃至整个机架作为一个单一的、完整的计算单元进行设计。
更关键的商业逻辑在于成本。虽然GB200很贵,但它的Token生成能力非常强大,以至于它以最低的成本生成令牌。
这种极致的性价比,确保了AI“良性循环”得以持续,也让Blackwell成为全球云服务商和AI公司建设下一代AI工厂的核心引擎。
物理AI
黄仁勋还提出了“物理AI”的概念,即让AI理解并与物理世界互动,这标志着人工智能应用的下一个巨大浪潮。
实现物理AI,需要一个全新的计算架构。物理AI需要三台计算机。
这三台计算机分别是:用于训练的Blackwell超级计算机、用于在数字孪生环境中模拟和验证的Omniverse计算机,以及部署在机器人或自动驾驶汽车中的Jetson Thor机器人计算机。
这一战略构想已经催生了庞大的生态系统。
在工业领域,英伟达通过Omniverse DSX平台,与西门子、富士康等企业合作,在数字孪生中设计、建造和运营机器人化工厂。在人形机器人领域,与Figure、Agility Robotics等前沿公司合作,为其提供从训练、模拟到端侧部署的全栈支持。
而在自动驾驶领域,通过发布Drive Hyperion标准平台,并与Uber等巨头合作,英伟达正试图构建一个全球性的“轮式机器人”网络。这标志着AI正从云端走向现实,成为驱动实体经济变革的核心力量。
从Blackwell到Rubin
演讲还有一个重要主题是“美国制造”。
黄仁勋详细展示了Blackwell从亚利桑那州的晶圆制造,到德克萨斯州的系统组装的全过程,并强调这是对美国制造业回归和再工业化的贡献。这不仅是地缘政治考量下的供应链重塑,也彰显了英伟达掌控从设计到生产全链条的雄心。
而当世界还在惊叹于Blackwell的强大性能时,黄仁勋已经揭开了下一代平台——Rubin的面纱。他展示了完全无线缆、100%液冷设计的Rubin机架,并承诺将以“每年一次”的节奏进行极限协同设计系统的迭代。
从超越摩尔定律的加速计算,到定义新生产模式的“AI工厂”,再到连接数字与现实的物理AI,黄仁勋为英伟达乃至整个科技行业规划了一条清晰而激进的路线图。这不再是一个关于芯片的故事,而是一个关于构建新世界基础设施的宏大叙事。新工业革命的引擎已经轰鸣,而英伟达正手握方向盘。
以下为方舟投研整理演讲全文
开场
美国,创新之地,在这里,发明塑造命运,技术助力梦想腾飞。在贝尔实验室,晶体管诞生,开启了半导体时代,并催生了硅谷。海蒂·拉玛重新构想了通信,为无线连接铺平了道路。IBM的System 360将通用计算机置于工业的核心地位。英特尔的微处理器推动了数字时代的发展。克雷的超级计算机拓展了科学的边界。所以我们认为我们正处于这项技术的开端,我们将尽可能快地前进。
苹果使计算个人化。“你好,我是Macintosh。”微软打开了通往软件新世界的窗口。早在网络出现之前,美国政府研究人员构建了阿帕网(ARPANET),连接了第一批计算机,这是互联网的基础。“一个iPod。一部电话。你明白了吗?”然后又是苹果。将一千首歌放进你的口袋,将互联网握在你的手中。
每个时代,一次飞跃。“我们选择在这个十年内登上月球并做其他的事情。不是因为它们容易,而是因为它们困难。”每次飞跃,美国领先。现在,下一个时代来临了。由一项革命性的新计算模型启动。“这很可能成为我们对计算机行业做出的最重要的贡献。”“它很可能会被认为是一场革命。”机器学习是人工智能的一个分支。几乎看起来会思考的计算机。“计算资源的数量最终将推动这个领域。”
人工智能。新的工业革命。其核心是英伟达GPU。在美国发明。就像电力和互联网一样,人工智能是必不可少的基础设施。每家公司都会使用它。每个国家都会构建它。赢得这场竞争将是对我们能力的考验,与太空时代曙光以来的一切都不同。而今天,人工智能工厂正在崛起。在美国建造。为了科学家、工程师和梦想家。横跨大学、初创企业和工业界。“我认为我们想要努力达到文明的新高度。”探索宇宙的本质。
现在,美国的创新者正在为富足扫清道路。拯救生命。将愿景塑造成现实。伸出援手。并交付未来。我们很快将用无限的清洁能源为其提供动力。我们将把人类的足迹延伸到星辰。这是美国下一个阿波罗时刻。齐心协力,我们迈出下一个伟大飞跃。大胆地去往无人之境。一切都从这里开始。
欢迎来到舞台,英伟达创始人兼首席执行官,黄仁勋。
华盛顿特区!华盛顿特区,欢迎来到GTC。很难不对美国感到感伤和自豪,我得告诉你。刚才那个视频很棒,对吧?谢谢。英伟达的创意团队做得非常出色。欢迎来到GTC,今天我们有很多内容要和大家分享。GTC是我们讨论行业、科学、计算、当下和未来的地方。所以今天我有很多内容要和大家分享。
但在开始之前,我想感谢所有帮助赞助这次盛会的合作伙伴。你会在展会上看到他们所有人。他们来这里是为了与你见面。而且非常棒的是,如果没有我们所有的生态系统合作伙伴,我们就无法完成我们所做的事情。人们说,这是人工智能的超级碗。因此,每一个超级碗都应该有一个精彩的赛前表演。你们觉得这个赛前表演怎么样?以及我们全明星的运动员和全明星阵容。看看这些人。不知何故,我变成了最健壮的。你们觉得怎么样?我不知道这是否与我有关。
加速计算:超越摩尔定律
正如你在视频中看到的,英伟达在60年来首次发明了一种新的计算模型。一种新的计算模型很少出现。这需要大量的时间和一系列的条件。我们观察到,我们发明了这个计算模型,因为我们想要解决通用计算机,即普通计算机无法解决的问题。我们还观察到,总有一天,晶体管的数量会继续增长,但是晶体管的性能和功率将会下降。摩尔定律将不会继续有效。受物理定律的限制。
那个时刻现在已经到来了。登纳德缩放定律在大约十年前就已经停止了。事实上,晶体管的性能及其相关的功率已经大幅下降。然而,晶体管的数量仍在继续增加。我们很久以前就观察到了这一点。30年来,我们一直在推进这种我们称之为加速计算的计算形式。我们发明了GPU,我们发明了名为CUDA的编程模型,并且我们观察到,如果我们能够添加一个处理器,该处理器可以利用越来越多的晶体管,应用并行计算,并将其添加到顺序处理CPU中,那么我们可以将计算能力扩展到远远超出现在的水平。
那个时刻真的到来了。我们现在已经看到了那个转折点。加速计算的时代已经到来。然而,加速计算是一种完全不同的编程模型。你不能只是把CPU软件,也就是手工编写的、顺序执行的软件,放到GPU上,然后让它正常运行。事实上,如果你只是那样做,它实际上会运行得更慢。所以你必须重新发明新的算法。你必须创建新的库。事实上,你必须重写应用程序,这也是为什么它花了这么长时间的原因。我们花了将近30年的时间才走到今天。但我们一次只处理一个领域。
这是我们公司的财富。大多数人谈论的是GPU。GPU很重要。但是如果没有一个位于其之上的编程模型,以及对该编程模型的专注,并保持其在各个世代之间的兼容性。我们现在即将推出CUDA 13,CUDA 14。数亿个GPU,运行在每一台计算机中,完全兼容。如果我们没有做到这一点,那么开发者就不会以这个计算平台为目标。如果我们没有创建这些库,那么开发者就不知道如何使用该算法,以及如何最大限度地利用该架构。一个又一个的应用。我的意思是,这确实是我们公司的宝藏。
CuLitho,计算光刻。我们花了近7年时间才用CuLitho走到今天,现在台积电使用它,三星使用它,阿斯麦使用它。这是一个令人难以置信的计算光刻库。制造芯片的第一步。用于CAE应用的稀疏求解器。CuOpt,一种打破了几乎所有记录的数值优化。旅行推销员问题。如何在供应链中将数百万种产品与数百万客户连接起来。Warp,用于CUDA的Python求解器,用于模拟。CuDF,一种DataFrame方法。基本上,加速SQL。DataFrame数据库。这个库是完全启动AI的那个。CuDNN。其上的名为Megatron Core的库使我们能够模拟和训练极其大型的语言模型。
这样的例子还有很多。MONAI,真的,真的非常重要。世界上排名第一的医学影像AI框架。顺便说一句,我们今天不会过多地谈论医疗保健,但请务必观看金伯利的主题演讲。她将会大量谈论我们在医疗保健领域所做的工作。这样的例子不胜枚举。基因组学处理。艾瑞尔,注意听讲。今天我们要在这里做一件非常重要的事情。CuQuantum,量子计算。这只是我们公司350个不同库的代表。这些库中的每一个都重新设计了加速计算所需的算法。这些库中的每一个都使所有生态系统合作伙伴能够利用加速计算。这些库中的每一个都为我们开辟了新的市场。
让我们来看看CUDA X能做什么。是不是很棒?你所看到的一切都是模拟。没有艺术,没有动画。这就是数学之美。这是深度的计算机科学,深度的数学,它令人难以置信的美妙。涵盖了每个行业。从医疗保健和生命科学到制造业、机器人技术、自动驾驶汽车、计算机图形,甚至是视频游戏。你看到的第一张照片是英伟达运行的第一个应用程序。这就是我们在1993年开始的地方。我们一直坚信我们所尝试做的事情。这花费了……很难想象你能看到第一个虚拟格斗场景变得栩栩如生,而同一家公司相信我们今天会在这里。这真是一段非常非常不可思议的旅程。我想感谢所有英伟达的员工为你们所做的一切。这真是太不可思议了。
今天我们有很多行业要介绍。我将介绍人工智能、6G、量子、模型、企业计算、机器人和工厂。让我们开始吧。我们有很多内容要介绍。有很多重大消息要宣布。很多新的合作伙伴会让你非常惊讶。
拓展新边界:从6G通信到量子计算
电信是我们经济、我们产业、我们国家安全的支柱和命脉。然而,自从无线技术诞生之初,我们定义了这项技术,我们定义了全球标准,我们将美国技术出口到世界各地,以便世界可以在美国技术和标准之上进行建设。这种情况已经很久没有发生过了。如今,世界各地的无线技术,很大程度上是建立在外国技术之上。我们建立在外国技术之上的基本通信结构。这种情况必须停止。我们有机会做到这一点。尤其是在这个根本性的平台转变时期。
如你所知,计算机技术是几乎每一个行业的基础。它是科学最重要的工具。它是工业最重要的工具。我刚才说,我们正在经历一个平台转变。那个平台转变应该是一生一次的机会,让我们重返赛场。让我们开始用美国技术进行创新。今天,我们宣布我们将这样做。我们与诺基亚建立了大型合作伙伴关系。诺基亚是世界第二大电信设备制造商。这是一个3万亿美元的产业。基础设施价值数千亿美元。世界各地有数百万个基站。如果我们能合作,我们就能在这个令人难以置信的新技术之上进行构建,它从根本上基于加速计算和人工智能。并且为了美国,为了让美国成为6G下一场革命的中心。
因此今天,我们宣布英伟达推出了一条新的产品线。它被称为英伟达ARC。空中无线电网络计算机。空中无线电接入网计算机,ARC。ARC由三项根本性的新技术构建而成。Gray CPU、Blackwell GPU,以及我们专为该应用设计的ConnectX Mellanox ConnectX网络。所有这些使得我们能够运行这个库,我之前提到的这个名为Aerial的CUDAX库。Aerial本质上是一个运行在CUDAX之上的无线通信系统。我们将首次创造一台软件定义的、可编程的计算机,它能够同时进行无线通信和人工智能处理。这是完全革命性的。我们称之为英伟达ARC。
诺基亚将与我们合作,整合我们的技术,重写他们的协议栈。这是一家拥有7000项基本必要5G专利的公司。很难想象在电信领域有比这更伟大的领导者了。所以我们将与诺基亚合作。他们将把英伟达ARC作为他们未来的基站。英伟达ARC也与AirScale兼容,AirScale是诺基亚目前的基站。这意味着我们将采用这项新技术,并能够用6G和人工智能升级全球数百万个基站。
现在,6G和人工智能非常重要,因为我们将首次能够使用人工智能技术,用于RAM的人工智能,以使无线通信的频谱效率更高。使用人工智能、强化学习,根据周围环境、交通、移动性、天气等情况,实时、有针对性地调整波束成形,所有这些都可以被考虑进来,从而提高频谱效率。频谱效率消耗了全球约1.5%到2%的电力。因此,提高频谱效率不仅可以提高我们通过无线网络传输的数据量,而无需增加必要的能量。
我们可以做的另一件事是,用于RAM的人工智能是RAM上的人工智能。这是一个全新的机会。记住,互联网实现了通信,但令人惊讶的是,像AWS这样的智能公司在互联网之上构建了一个云计算系统。我们现在将在无线电信网络之上做同样的事情。这个新的云将是一个边缘工业机器人云。这是RAM上的人工智能,第一个是用于RAM的人工智能,以提高无线电频谱效率,第二个是RAM上的人工智能,本质上是用于无线电信的云计算。云计算将能够直接延伸到边缘,即没有数据中心的地方,因为我们在世界各地都有基站。这个公告真是令人兴奋。首席执行官贾斯汀·霍达,我想他就在房间里的某个地方,感谢你们的合作。感谢你们帮助美国将电信技术带回美国。这真是一次很棒的合作。非常感谢。这是庆祝诺基亚的最佳方式。
让我们来谈谈量子计算。1981年,粒子物理学家、量子物理学家理查德·费曼设想了一种可以直接模拟自然的新型计算机。直接模拟自然,因为自然是量子的。他称之为量子计算机。40年后,该行业取得了根本性的突破。40年后,就在去年,一个根本性的突破。现在制造一个逻辑量子比特是可能的。一个逻辑量子比特。一个相干、稳定且经过纠错的逻辑量子比特。
现在,一个逻辑量子比特有时由10个,有时由数百个物理量子比特共同协作构成。正如你所知,量子比特,这些粒子非常脆弱。它们很容易变得不稳定。任何观察,任何采样,任何环境条件都会导致它失去相干性。因此,它需要极佳的可控环境,并且现在还需要许多不同的物理量子比特协同工作,以便我们对这些所谓的辅助量子比特或辛德罗姆量子比特进行误差校正,从而纠正误差并推断出逻辑量子比特的状态。有各种不同类型的量子计算机。超导、光子、囚禁离子、稳定原子,各种不同的方式来创建量子计算机。
实际上,我们现在意识到,对于我们来说,将量子计算机直接连接到GPU超级计算机至关重要,这样我们才能进行误差校正,才能对量子计算机进行人工智能校准和控制,才能共同进行模拟。正确的算法在GPU上运行,正确的算法在QPU上运行,这两个处理器,两台计算机并肩工作。这就是量子计算的未来。
有许多方法可以构建量子计算机。每种方法都使用量子比特(量子位)作为其核心构建块。但无论采用何种方法,所有量子比特,无论是超导量子比特、囚禁离子、中性原子还是光子,都面临着相同的挑战。它们很脆弱,并且对噪声极其敏感。今天的量子比特只能在几百次操作中保持稳定。但解决有意义的问题需要数万亿次操作。答案是量子纠错。测量会干扰量子比特,从而破坏其中的信息。诀窍是添加额外的纠缠量子比特,这样测量它们就能给我们足够的信息来计算出错误发生的位置,而不会损坏我们关心的量子比特。这很棒,但需要超越当前最先进的传统计算。这就是我们构建NVQ Link的原因,这是一种新的互连架构,可将量子处理器与NVIDIA GPU直接连接。量子纠错需要从量子比特中读取信息,计算出错误发生的位置,并将数据发回以纠正它们。NVQ Link能够每秒数千次地将太字节的数据发送到量子硬件并从中接收,这是量子纠错所必需的。其核心是CUDAQ,我们用于量子GPU计算的开放平台。利用NVQ Link和CUDAQ,研究人员将能够做的不仅仅是纠错。他们还将能够协调量子设备和人工智能超级计算机来运行量子GPU应用程序。量子计算不会取代经典系统。它们将融合在一起,成为一个加速的量子超级计算平台。
哇,这真是一个很长的阶段。你知道,首席执行官们,我们不仅仅是坐在办公桌前打字。这是一项体力活。所以今天,我们宣布NVQ Link。而这由两件事促成。当然,这种互连可以进行量子计算机控制和校准、量子纠错,以及连接两台计算机,即QPU和我们的GPU超级计算机,以进行混合模拟。它也完全可扩展。它不仅仅为今天少量量子比特的数量进行纠错。它为未来进行纠错,在未来,我们将从今天拥有的数百个量子比特,扩展到未来的数万个量子比特,数十万个量子比特。因此,我们现在有了一个可以进行控制、协同模拟、量子纠错并扩展到未来的架构。
在 CUDA Q 发明之后,行业支持令人难以置信。请记住,CUDA 是为 GPU、CPU、加速计算而设计的。基本上,使用两个处理器来使用正确的工具来完成正确的工作。现在,CUDA Q 已经扩展到 CUDA 之外,以便我们可以支持 QPU,并让两个处理器,QPU 和 GPU,协同工作,并在几微秒内来回移动计算。这是与量子计算机合作的必要延迟。因此,现在,CUDA Q 是一个令人难以置信的突破,被许多不同的开发者采用。我们今天宣布有 17 家不同的量子计算机行业公司支持 NVQ 链路。而且,我对此感到非常兴奋,有 8 个不同的美国能源部 (DOE) 实验室。伯克利、布鲁克海文、芝加哥费米实验室、林肯实验室、洛斯阿拉莫斯、橡树岭、太平洋西北、圣地亚哥国家实验室。几乎每一个能源部实验室都与我们合作,与我们的量子计算机公司和这些量子控制器生态系统合作,以便我们可以将量子计算整合到科学的未来中。
好的,我还有一个额外的声明要宣布。今天,我们宣布能源部正在与英伟达合作,建造7台新的AI超级计算机,以推进我们国家的科学发展。我必须向克里斯·赖特部长致敬。他为能源部带来了如此多的活力。一股能量的涌动,一股热情的涌动,以确保美国再次引领科学。正如我所提到的,计算是科学的基本工具,我们正在经历几个平台转变。一方面,我们将加速计算,这就是为什么未来每一台超级计算机都将是基于GPU的超级计算机。我们将走向人工智能,这样人工智能和基于原理的求解器、基于原理的模拟、基于原理的物理模拟不会消失,但它可以被增强、强化、扩展,使用替代模型、人工智能模型协同工作。我们也知道,基于原理的求解器,经典计算,可以被增强,以使用量子计算来理解自然状态。我们也知道,在未来,我们有如此多的信号,如此多的数据需要从世界中采样,遥感比以往任何时候都更加重要。这些实验室不可能以我们需要的规模和速度进行实验,除非它们是机器人工厂,机器人实验室。所以所有这些不同的技术都在完全相同的时间进入科学领域。赖特部长理解这一点,他希望能源部抓住这个机会,增强自身能力,并确保美国保持在科学的最前沿。我想感谢你们所有人。谢谢。
老虎社区只能发布万字长文,全文内容可搜【方舟投研】查看。
精彩评论