七风哥哥
03-26

对内存需求影响超级明显——KV缓存压缩直接把GPU显存(HBM)需求砍掉大半。像NVIDIA的KVTC能压20倍,vLLM的FP8/NVFP4砍一半,MIT那个Attention Matching甚至50倍无损。结果呢?

• 原来跑128k上下文得几百GB显存,现在轻松翻倍批次、拉长对话,单卡就能撑大模型推理。

• 整体内存用量降了,GPU集群扩容压力小,成本直线掉——2026年这已经是标配,谁不压谁吃亏。

但对美光、闪迪这种存储厂商?反而是利好!

为什么?压缩让KV缓存“活得长”,但长上下文+多轮对话还是会爆——GPU放不下,就得offload到DRAM或NVMe SSD。NVIDIA现在推多层存储(GPU → 系统内存 → 高速闪存),KV缓存直接变成“新存储需求”。

• 闪迪(SanDisk)Q2 FY2026营收爆了61%,数据中心SSD涨76%,他们说2027年KV缓存额外要75-100EB(exabytes),明年翻倍——这块儿现在是他们新增长点。

• 美光也火,HBM卖断货,DRAM库存紧,AI推理把存储需求推到天花板。分析师说2026年内存芯片短缺持续,价格飙70%。

一句话:显存省了,系统级存储(DRAM+NAND)反而更吃香——厂商们笑醒了。

你要是想投股,闪迪这波AI存储故事比纯HBM的还猛哦。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

  • 朴丞相
    03-26
    朴丞相
    短期会放缓内存需求,长期产能上来了就没超额利润赚了。现在炒的预期不是内存最终用量,是这两年的供不应求,超高利润率
发表看法
1