总结一句话,对储存厂商来说还是利好!!!没影响!没必要恐慌!

KV缓存压缩直接把GPU显存(HBM)需求砍掉大半。像NVIDIA的KVTC能压20倍,vLLM的FP8/NVFP4砍一半,MIT那个Attention Matching甚至50倍无损。结果呢?

• 原来跑128k上下文得几百GB显存,现在轻松翻倍批次、拉长对话,单卡就能撑大模型推理。

• 整体内存用量降了,GPU集群扩容压力小,成本直线掉——2026年这已经是标配,谁不压谁吃亏。

但对美光、闪迪这种存储厂商?反而是利好!

为什么?压缩让KV缓存“活得长”,但长上下文+多轮对话还是会爆——GPU放不下,就得offload到DRAM或NVMe SSD。NVIDIA现在推多层存储(GPU → 系统内存 → 高速闪存),KV缓存直接变成“新存储需求”。

• 闪迪(SanDisk)Q2 FY2026营收爆了61%,数据中心SSD涨76%,他们说2027年KV缓存额外要75-100EB(exabytes),明年翻倍——这块儿现在是他们新增长点。

• 美光也火,HBM卖断货,DRAM库存紧,AI推理把存储需求推到天花板。分析师说2026年内存芯片短缺持续,价格飙70%。

一句话:显存省了,系统级存储(DRAM+NAND)反而更吃香——厂商们笑醒了。

你要是想投股,闪迪这波AI存储故事比纯HBM的还猛哦。

谷歌发布KV缓存压缩技术,存储需求预期遭冲击,美股存储板块集体下挫

Google Research近日推出全新的KV缓存压缩方法TurboQuant。据称,该技术可在不损失准确性的前提下,将大语言模型的缓存内存占用至少减少6倍,并实现最高8倍的加速,旨在解决AI推理与向量搜索中的内存瓶颈问题。受此消息影响,美股存储板块集体走低。截至收盘,闪迪跌6.5%,美光科技跌超4%,西部数据跌超4%,希捷科技跌超5%。
谷歌发布KV缓存压缩技术,存储需求预期遭冲击,美股存储板块集体下挫

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论