$闪迪(SNDK)$ 看多!!!

这个技术又不新鲜,对储存厂商来说反而是好事!!!没必要过度紧张

KV缓存压缩直接把GPU显存(HBM)需求砍掉大半。像NVIDIA的KVTC能压20倍,vLLM的FP8/NVFP4砍一半,MIT那个Attention Matching甚至50倍无损。结果呢?

• 原来跑128k上下文得几百GB显存,现在轻松翻倍批次、拉长对话,单卡就能撑大模型推理。

• 整体内存用量降了,GPU集群扩容压力小,成本直线掉——2026年这已经是标配,谁不压谁吃亏。

但对美光、闪迪这种存储厂商?反而是利好!

为什么?压缩让KV缓存“活得长”,但长上下文+多轮对话还是会爆——GPU放不下,就得offload到DRAM或NVMe SSD。NVIDIA现在推多层存储(GPU → 系统内存 → 高速闪存),KV缓存直接变成“新存储需求”。

• 闪迪(SanDisk)Q2 FY2026营收爆了61%,数据中心SSD涨76%,他们说2027年KV缓存额外要75-100EB(exabytes),明年翻倍——这块儿现在是他们新增长点。

• 美光也火,HBM卖断货,DRAM库存紧,AI推理把存储需求推到天花板。分析师说2026年内存芯片短缺持续,价格飙70%。

一句话:显存省了,系统级存储(DRAM+NAND)反而更吃香——厂商们笑醒了。

你要是想投股,闪迪这波AI存储故事比纯HBM的还猛哦。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论