Google Research近日推出全新的KV缓存压缩方法TurboQuant。据称,该技术可在不损失准确性的前提下,将大语言模型的缓存内存占用至少减少6倍,并实现最高8倍的加速,旨在解决AI推理与向量搜索中的内存瓶颈问题。受此消息影响,美股存储板块集体走低。截至收盘,闪迪跌6.5%,美光科技跌超4%,西部数据跌超4%,希捷科技跌超5%。
Google Research近日推出全新的KV缓存压缩方法TurboQuant。据称,该技术可在不损失准确性的前提下,将大语言模型的缓存内存占用至少减少6倍,并实现最高8倍的加速,旨在解决AI推理与向量搜索中的内存瓶颈问题。受此消息影响,美股存储板块集体走低。截至收盘,闪迪跌6.5%,美光科技跌超4%,西部数据跌超4%,希捷科技跌超5%。