$闪迪(SNDK)$ 看多!!!
这个技术又不新鲜,对储存厂商来说反而是好事!!!没必要过度紧张
KV缓存压缩直接把GPU显存(HBM)需求砍掉大半。像NVIDIA的KVTC能压20倍,vLLM的FP8/NVFP4砍一半,MIT那个Attention Matching甚至50倍无损。结果呢?
• 原来跑128k上下文得几百GB显存,现在轻松翻倍批次、拉长对话,单卡就能撑大模型推理。
• 整体内存用量降了,GPU集群扩容压力小,成本直线掉——2026年这已经是标配,谁不压谁吃亏。
但对美光、闪迪这种存储厂商?反而是利好!
为什么?压缩让KV缓存“活得长”,但长上下文+多轮对话还是会爆——GPU放不下,就得offload到DRAM或NVMe SSD。NVIDIA现在推多层存储(GPU → 系统内存 → 高速闪存),KV缓存直接变成“新存储需求”。
• 闪迪(SanDisk)Q2 FY2026营收爆了61%,数据中心SSD涨76%,他们说2027年KV缓存额外要75-100EB(exabytes),明年翻倍——这块儿现在是他们新增长点。
• 美光也火,HBM卖断货,DRAM库存紧,AI推理把存储需求推到天花板。分析师说2026年内存芯片短缺持续,价格飙70%。
一句话:显存省了,系统级存储(DRAM+NAND)反而更吃香——厂商们笑醒了。
你要是想投股,闪迪这波AI存储故事比纯HBM的还猛哦。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
7
举报
登录后可参与评论

暂无评论

