熊猫校长 Ming

熊猫校长Ming(MingPanda)| 过去20年研究IT基础设施,今天研究AI基础设施。投资是认知的最终考试。|CCIE#9748

IP属地:广东
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-23 09:05

      英特尔涨近 6 倍,但 CEO 最新这期播客里,最值钱的不是英特尔

      这两天打开任何一个财经页面,绕不开同一个名字——英特尔。它刚创了历史新高。 导火索是一条大新闻:苹果传出,要把一部分入门款芯片交给英特尔代工。同时,CEO 陈立武和和No Priors的播客对谈火遍全网,节目中他的透露让英特尔在未来五到十年实现10倍回报的目标。一家一年多前还被很多人写进"掉队名单"的老公司,一年股价涨了近 500% ——它的 CEO 陈立武自己说,上任以来给股东带来了大约 6 倍回报。突然之间,它成了全市场最热的翻身故事。 所有人都在问同一个问题:还能不能追? 我没急着回答这个问题。我把陈立武那篇访谈,从头到尾读了一遍。 读完第一感觉是——他几乎没在推销英特尔。 他在画一张地图。 而这张地图,比"英特尔还能不能涨"值钱得多。 先说英特尔自己——它确实翻身了,但翻的是哪一身? 英特尔、x86、数据中心、服务器,这是我盯了二十年的地方。所以这轮反弹,我没把它当成一个突然冒出来的奇迹,我想看清楚:它到底翻了哪一身? 陈立武反复讲一句话:先学会爬,再学会走,最后才是跑。过去一年他做的,其实是最不性感的那部分——精简产品线、把工程团队直接收到自己手下、改掉那套层层开会的官僚文化。 真正让数字好看的,是一件他自己都说"没想到"的事:CPU 在 AI 时代重新变重要了。 过去大家默认,AI 时代是 GPU 的天下,CPU 靠边站。陈立武给了一个细节:训练阶段,CPU 和 GPU 的配比大概 1:8;但到了今天这种满世界跑 AI 智能体(Agent)的推理阶段,他看到的比例变成了 1:4,甚至可能 1:2。智能体越多,越需要 CPU 去调度。 换句话说——不是英特尔重新夺回了王座,而是它脚下那块一度被 GPU 挤到墙角的地(CPU),边界又往回扩了一点。 这就是它翻身的真相:不是回到中心,而是它那块旧地盘,意外地在 AI 推理时代重新值钱了。 至于代工,陈立武自己说得很白
      6,496评论
      举报
      英特尔涨近 6 倍,但 CEO 最新这期播客里,最值钱的不是英特尔
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-22 09:47

      我以为碳化硅是特斯拉的故事,结果它跑去了英伟达的电网里

      前一段时间我写过一篇关于AI电力的文章“NBIS营收暴涨684%后,我开始重新理解AI电力”,这次我顺着AI电力这条线继续往下挖,挖到一个数字。 英伟达下一代AI机柜,单柜功耗已经逼近1兆瓦。 这个数字我查到的时候,第一反应是不太信。家用空调大概2千瓦,一栋普通写字楼的总用电量也就几百千瓦——换句话说,半栋写字楼的电,现在要塞进一个机柜里。 我本来以为这背后的答案会是某种变压器,或者某种我没听过的配电设备——毕竟GPU再贵,它终究还是个用电器,无非是供电规模大一点。 结果越查越不对劲。配电方案里反复出现一个我很熟的名字 —— 碳化硅(SiC) 这名字我不陌生,但语境完全对不上。我对它的全部印象,停留在六年前的一台车上。 2018年,马斯克干了一件让供应商肉疼的事。Model 3的主驱逆变器,他没有用整个汽车行业都在用的硅基IGBT,而是换上了碳化硅——意法半导体专门定制了24颗碳化硅功率模块,塞进逆变器里,价格是硅基方案的5到6倍。 代价换来了什么:逆变器效率从八成出头冲到将近九成,同样一块电池,车能多跑5%到10%,省下来的电池容量和冷却系统成本,早就把贵出来的芯片钱赚回来了。这是碳化硅第一次被请上牌桌,它后来成了"车规黄金",2020年光特斯拉一家,就吃掉了全球碳化硅龙头Wolfspeed六成的产能。 我本来以为这就是它的归宿——一个电动车的省电零件,故事讲完了。它怎么会出现在英伟达的电网方案里? 同样是碳化硅,两份完全不同的工作单 我把两边的逻辑摆在一起看,发现这其实是两个问题,不是一个问题。 特斯拉的问题是:用不用都能开。换不换碳化硅,车都能跑,只是续航多几公里、电池小一点——这是一道优化题,做了更划算,不做也凑合。 英伟达的问题是:不用根本开不了。电网送过来的是几万伏的中压交流电,要一步转成数据中心要的800伏直流,这个电压等级,普通硅基功率器件会被直接击穿、烧穿
      313评论
      举报
      我以为碳化硅是特斯拉的故事,结果它跑去了英伟达的电网里
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-18
      $博通(AVGO)$  的To­m­a­h­a­wk/Je­r­i­c­ho 这两个芯片分别是什么,用在什么场景,如图所示[可爱]  
      460评论
      举报
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-16
      在上升期是这样,回撤时也一样。

      光,根本不是一个东西

      @熊猫校长 Ming
      最近老有人问我同一个问题:AI 要用光,那买光模块不就行了吗? 我以前也是这么想的。直到把整条产业链拆开,才撞见一个挺反直觉的事实 —— 光,根本不是一个东西。 就像存储也不是一个东西。DDR、HBM、NAND 都叫存储,赚的钱却完全不一样。光,是一模一样的故事。 也难怪大家会停在"光模块"这一站——这两年涨得最凶的就是它。光模块龙头从低点起来,一年翻了好几倍(具体多少倍,看你从哪天开始算,口径不同差很远)。 但你买到的,可能恰恰是"光"里最容易被替代的那一段。 我把"光"摊开,它其实是一条从外到里、利润越来越厚的链子。 最外面,是光纤光缆。 就是那根玻璃丝,数据在里面跑。卖光纤的(康宁、长飞这种)干的是"卖水管"的生意——AI 要建数据中心,一个机柜用的光纤是过去的十几倍,需求实打实。但它技术含量不算高、走量、利润薄。稳,但不性感。 往里一层,是光模块。 把激光器、芯片、镜头拼成一个能插进交换机的"插头",你听到的 800G、1.6T 说的就是它。这就是大家最熟、涨得最猛的中际旭创、新易盛那一段。但它的本质是"组装"——拼的是良率和规模。现在最赚钱,可也最容易被人追上、被商品化。 再往里,才是真正发光的那颗芯片:光芯片 / 激光器(EML、CW 激光器)。 这是整个"光"里卡脖子的核心,全球高端就五家攥着(Lumentum、Coherent、博通,加上日本的三菱、住友),国产在追的是源杰、仕佳这些。它像发动机里的喷油嘴——一颗不行,整个模块就废了。这一段,才真有定价权。 最里面,是光引擎和共封装光学(CPO)。 说人话,就是干脆不做"插头"了,直接把发光芯片焊进封装、贴到 GPU 旁边。天孚、博通、台积电在抢的就是这块。它是价值正在往里迁的方向。 看出问题了吗。 同样一个"光"字,从外到里是四门生意:卖水管的、拼插头的、造喷油嘴的、把喷油嘴焊进发动机的。利润一段比一段厚,
      光,根本不是一个东西
      106评论
      举报
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-15

      光,根本不是一个东西

      最近老有人问我同一个问题:AI 要用光,那买光模块不就行了吗? 我以前也是这么想的。直到把整条产业链拆开,才撞见一个挺反直觉的事实 —— 光,根本不是一个东西。 就像存储也不是一个东西。DDR、HBM、NAND 都叫存储,赚的钱却完全不一样。光,是一模一样的故事。 也难怪大家会停在"光模块"这一站——这两年涨得最凶的就是它。光模块龙头从低点起来,一年翻了好几倍(具体多少倍,看你从哪天开始算,口径不同差很远)。 但你买到的,可能恰恰是"光"里最容易被替代的那一段。 我把"光"摊开,它其实是一条从外到里、利润越来越厚的链子。 最外面,是光纤光缆。 就是那根玻璃丝,数据在里面跑。卖光纤的(康宁、长飞这种)干的是"卖水管"的生意——AI 要建数据中心,一个机柜用的光纤是过去的十几倍,需求实打实。但它技术含量不算高、走量、利润薄。稳,但不性感。 往里一层,是光模块。 把激光器、芯片、镜头拼成一个能插进交换机的"插头",你听到的 800G、1.6T 说的就是它。这就是大家最熟、涨得最猛的中际旭创、新易盛那一段。但它的本质是"组装"——拼的是良率和规模。现在最赚钱,可也最容易被人追上、被商品化。 再往里,才是真正发光的那颗芯片:光芯片 / 激光器(EML、CW 激光器)。 这是整个"光"里卡脖子的核心,全球高端就五家攥着(Lumentum、Coherent、博通,加上日本的三菱、住友),国产在追的是源杰、仕佳这些。它像发动机里的喷油嘴——一颗不行,整个模块就废了。这一段,才真有定价权。 最里面,是光引擎和共封装光学(CPO)。 说人话,就是干脆不做"插头"了,直接把发光芯片焊进封装、贴到 GPU 旁边。天孚、博通、台积电在抢的就是这块。它是价值正在往里迁的方向。 看出问题了吗。 同样一个"光"字,从外到里是四门生意:卖水管的、拼插头的、造喷油嘴的、把喷油嘴焊进发动机的。利润一段比一段厚,
      3,7445
      举报
      光,根本不是一个东西
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-14

      涨了 60 倍的光模块龙头,还能赚下一轮的钱吗?

      光产业链里,谁是 HBM,谁又会变成 DDR? 中际旭创,从 2023 年初的 19 块钱,涨到了现在的 1100 多块。 接近 60 倍。 如果你今天才第一次看到这家公司,大概率会有两个反应: 第一,涨了这么多,还能买吗? 第二,要是追不动了,还有没有「下一只」? 这其实是同一个问题 —— AI 产业链里最值钱的环节,到底在哪一段? 存储篇我们找了一路,最后的答案叫 HBM。那光这条链呢?涨疯了的光模块,是光里的 HBM,还是会变成光里的 DDR? 先说为什么涨:它们确实是这轮真正赚到钱的赢家 光模块这一轮涨疯,不是炒作,是真赚到钱了。 中际旭创在 800G 和 1.6T 高速光模块上都处于全球第一梯队,2025 年全年归母净利润 107.97 亿元、同比翻倍,2026 年一季度再同比大增 262%,是不少公募基金的重仓股;新易盛、天孚通信也都翻了几十倍。AI 数据中心每堆一台机器,就要插上成百上千个光模块——这一轮 AI 基建的钱,实打实砸进了它们口袋。 所以现在说「光模块是薄利大宗的 DDR」,一眼就被打脸。 但问题从来不是"谁涨得多",是"谁能接着赚"。 同一条链,有人是 HBM,有人是 DDR 存储篇最狠的一课:同一个存储产业,HBM 吃掉大部分利润,普通 DDR 只能赚辛苦钱。同一条链,不同环节,命运天差地别。 光这条链,迟早也要这么分。而催化剂,就是上一篇说的 CPO——英伟达把光焊进芯片,会把价值从「可插拔模块」往更上游迁: 模块组装(中际旭创、新易盛) 现在最赚钱的环节之一,但也是 CPO 时代最可能被商品化的一段。 光芯片 / 激光器(源杰科技;海外 Lumentum、Coherent) 光器件成本里光芯片占了约一半,卡脖子、价值核心,最像「光里的 HBM」。 光引擎 / CPO 封装(天孚通信;台积电) CPO 把价值往这里集中。 看上去结论很清楚:买
      1,5761
      举报
      涨了 60 倍的光模块龙头,还能赚下一轮的钱吗?
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-13

      最爱铜的英伟达,为什么突然开始做光?

      那场发布会,黄仁勋掏出来的不是 GPU。 是两台交换机——而且是两台光交换机:Quantum-X 和 Spectrum-X Photonics,把光直接焊进了交换芯片里(行话叫共封装光学,CPO)。 时间是 2025 年的 GTC。那一刻,我脑子里只有一句话: 卖铲子的人,开始自己挖矿了。 一年多过去,这事没有过气——它才刚开始加速,真正的重头戏还在后面。 这事得接着上一篇那条分界线说。大多数人当时没把它当回事,因为大家以为英伟达只是「做显卡的」。 重点不是「英伟达多了条产品线」 这事真正的分量,得放回③那条线里看才懂。 上一篇我们说过:那个一直往机柜里塞5000根铜缆、还公开讲「铜是最好的连接方式」的英伟达——它是铜的头号铁杆用户。 现在,这个铜的头号铁杆用户,自己下场做光了。 这才是拐点。不是某篇分析师报告预测「未来会换光」,是定义这条产业链的那个人,把光写进了自己的产品路线图。 但它先砍哪一段,很有讲究 英伟达没有一上来就把机柜里的铜全拆了。它很克制——第一刀,先砍「机柜之间」。 机柜里那条5000根铜缆的NVLink背板,暂时一根没动。 为什么?正好就是③那条分界线: 铜还够得着的地方(机柜内那一小段),继续用铜,便宜、省电、皮实;铜已经够不着的地方(机柜与机柜之间、机房与机房之间),才轮到光上场。 往后看它的路线图也是这个节奏:再下一代(Rubin)才开始在部分机型上谈「机柜内也上光」;更远的那一代(Feynman,2028年前后),干脆给客户「铜或光」两条路自己选。 铜不是被一刀砍死的。是这条分界线,一代一代往机柜里头挪。 为什么偏偏是现在 三个躲不掉的力,一起把英伟达推过了这条线。 够不着。 它要连的已经不是72颗GPU,是「百万颗、跨机房」。这个尺度上,铜在机柜外面根本没戏,只能上光。 太费电。 满机房插满传统光模块,烧的电惊人。把光焊进交换芯片,英伟达自己
      1,636评论
      举报
      最爱铜的英伟达,为什么突然开始做光?
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-12
      前两篇发完,有个朋友问了我一句很实在的话: “你天天说AI要换光、光模块多重要——可英伟达最强的那台机柜里,不是塞了5000多根铜缆吗?铜到底是要完了,还是没完?” 这个问题问得好。因为它正好戳中一个看起来自相矛盾的事实。 一边,英伟达最新的NVL72机柜,背后是一捆超过2英里长、5000多根的铜缆,把72颗GPU拧成「一颗巨型GPU」。铜不但没被淘汰,还是这台百万级机器的命根子。 另一边,整个行业都在喊:铜不行了,AI要换光。 这两件事,怎么会同时成立。 你盯错了地方 大部分人讨论「铜还是光」,盯的是铜本身——好像铜哪天突然变差了。 铜没变差。这几十年它一直是那个铜。 真正在变的,是另外两个字:速度。 铜传信号躲不掉一条物理规律:速度越快,它能跑的距离越短。 频率一高,信号在铜里衰减得越来越狠(行话叫趋肤效应、串扰、码间干扰,名词不重要,结果重要)——同一根铜缆,跑慢一点能拉好几米,跑快了可能连一米都撑不住。 而AI干的事,恰恰是把速度往死里拉。 一代一代,把铜逼退 看英伟达自己这几代机器,这条线就很清楚。 早几代速率还低的时候,铜缆轻松覆盖服务器内部、甚至机柜里的大部分连接。 到了Blackwell这一代,单通道速率又翻一倍,铜能稳稳覆盖的距离明显缩短——基本只够机柜里那一小段。 再往上,进入224G、1.6T这一档,铜就快撞墙了:还够得着的距离,被压到只剩机柜背板里那几步路。 规律就这么简单:速度每翻一倍,铜能跑的距离就被砍掉一截。 所以「铜不行了」的真相,不是铜坏了,是AI把它一步步往后逼: 从一整排机柜,逼到一个机柜;从一个机柜,逼进机柜背后那块背板里。 退到退无可退的地方,光,就接手了。 那NVL72里那5000根铜缆呢 正因为如此,英伟达才把72颗GPU死死塞进同一个机柜——它要的就是让每一根铜缆都短到铜还扛得住的范围内。 只要距离够短,铜依然是第一选择,而且
      2,028评论
      举报
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-11
      上一篇我们说,GPU 有两种死法:吃不饱(饿死),和跑不动(堵车)。 HBM 解决了第一种。而第二种——成千上万颗 GPU 之间"跑不动"的问题——要靠光互联。 但在讲光之前,得先搞清楚一件事:这些 GPU 到底是怎么连在一起的? 因为大多数人对"AI 算力"的想象是错的。 很多人以为,一个 AI 数据中心,就是"一大堆 GPU 堆在一起"。芯片越多,算力越强。 这个想象,少了最关键的一半。 真实的 AI 集群,不是一堆 GPU,而是一张网——一张让这些 GPU 互相传数据的"带宽网络"。 打个比方。一个万人工厂,光招一万个工人是没用的。如果工人之间没有通道、没有传送带、没法互相递东西,那这一万人不是一个工厂,只是一万个各干各的人。 GPU 也一样。把一万颗 GPU 摆在机房里,如果它们之间传不动数据,那它们就不是"一台超级计算机",只是一万颗互相不说话的芯片。 让它们变成"一台机器"的,不是 GPU 本身,是连接它们的那张网。 那这张网长什么样? 它其实是四层,按"数据要传多远"一层层往外扩。距离越远,带宽越稀缺,也越贵。 第一层,芯片内——最短的距离,最高的带宽。 数据在一颗 GPU 内部流动,从计算单元到它自己的内存。这一层的带宽,主要靠 HBM 提供——就是上一篇说的,让 GPU 吃得饱的那条超宽传送带。这是带宽最充裕的一层,因为距离最短。 第二层,芯片间——GPU 和 GPU 之间。 同一台服务器里,几颗、几十颗 GPU 要互相交换数据。这一层靠的是高速互联(比如英伟达的 NVLink)。距离一拉远,带宽就开始变得金贵。 第三层,机柜间——一个机柜和另一个机柜之间。 成百上千颗 GPU,装在不同的机柜里,机柜之间要连起来。到这一层,电信号已经传不动了,必须开始用光——这就是光模块的主战场。 第四层,数据中心间——一栋楼和另一栋楼,甚至一个城市和另一个城市之间。 当
      1.68万评论
      举报
    • 熊猫校长 Ming熊猫校长 Ming
      ·06-10

      AI 时代,GPU 有两种死法

      如果给英伟达最先进的 GPU,配上十年前的内存和网络,会发生什么? 答案很简单:它几乎跑不起来。 这听起来很反直觉。大多数人觉得,AI 时代最重要的是 GPU。但研究越久我越发现——GPU 只是发动机。真正决定这台机器能不能跑起来的,是带宽。 先接上上一篇。 我在《存储,根本不是一个东西》里讲过一个判断:HBM 这种内存,表面上是在卖存储,本质上是在卖带宽。它值钱,不是因为能存多少,是因为能多快地把数据喂给 GPU。 当时这个判断,是存储篇的终点。但我后来发现,它其实是另一件事的起点。 因为"把数据快速喂给 GPU"这件事,HBM 只解决了一半。 为什么这么说? 你可以把一颗 GPU,想象成一个饭量大得惊人的大胃王。它一秒钟能吃下的数据,多到普通内存根本来不及端上桌。 如果数据喂得太慢,GPU 会饿死——算力再强,喂不饱,就是空转。你买了最贵的芯片,它却有一大半时间在干等着上菜。 这就是 HBM 要解决的问题:它是一条超宽的传送带,拼命把数据快速塞给 GPU,让它吃得饱。 而今天,这第一种死法,其实已经基本被解决了。 HBM 已经让 GPU 越来越吃得饱。 但一个新问题冒出来了:一颗 GPU,不够用了。 今天训练一个大模型,要成千上万颗 GPU 一起干活。这些 GPU 不是各吃各的,它们必须时时刻刻互相交换数据、对齐进度——像一个几万人的工厂,每个工位都要和其他工位实时同步。 于是第二种死法出现了。  GPU 的第二种死法,叫堵车。 就算每一颗 GPU 都喂饱了,可它们之间如果连不动、传不快,整个集群照样跑不起来——几万颗最贵的芯片,卡在"互相传数据"这一步上,集体堵在路上。算力再多,连不动,就是浪费。 所以 GPU 其实有两种死法: 一种是吃不饱——饿死。一种是跑不动——堵车。 这两个问题,本质上是同一个东西在作怪:带宽不够。 只不过: * 饿死,是喂数据的带
      1,739评论
      举报
      AI 时代,GPU 有两种死法
       
       
       
       

      热议股票