• 3
  • 4
  • 3

报道:DeepSeek加速推出新AI模型R2,或早于之前计划的五月

老虎资讯综合02-25

DeepSeek原计划于5月初发布R2模型,但据路透社援引知情人士透露,公司正寻求尽快推出。R2预计将在编程和多语言推理方面实现更优性能。

25日,据路透社报道,DeepSeek计划提前发布其新一代AI模型R2。

报道知情人士透露,R2原定于5月初发布,但现在公司希望尽快推出。DeepSeek表示,新模型将在编程能力和多语言推理方面有所提升。

印度科技服务提供商Zensar的首席运营官Vijayasimha Alilughatta认为,"DeepSeek R2模型的发布可能成为AI行业的转折点",其成本效益高的AI模型开发方式"可能会激发全球企业加速自身努力,打破行业巨头的垄断"。

分析认为,DeepSeek的成功得益于幻方投资十多年来在研究和计算力方面的大量投入。幻方于2020年和2021年斥资12亿元人民币建立了两个AI超级计算集群,其中包括约1万片英伟达A100芯片。

DeepSeek前员工表示,公司的成功主要归功于梁文锋专注于更具成本效益的AI架构。DeepSeek采用了混合专家(MoE)和多头潜在注意力(MLA)等技术,大大降低了计算成本。

报道还称,DeepSeek采用扁平化管理模式,营造协作氛围。创始人梁文锋被前雇主描述为"低调内向",他倾向于与年轻员工一起深入技术细节。

报道援引一位前前员工表示:"梁给了我们掌控权,把我们当专家对待。他不断提问,与我们一起学习。"

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

举报

评论4

  • Mediator
    ·02-26
    马上要给他写梁文峰传了🤣中国人造神孜孜不倦,通篇废话,只有标题有用
    回复
    举报
  • 谋远
    ·02-25
    把人家的发现活用了一下,前景有限
    回复
    举报
  • 让美国知道拿你东西还不给钱,美国佬气哭了[开心]  
    回复
    举报
  • JulyJuly
    ·02-25
    这个翻译好搞笑啊
    回复
    举报
 
 
 
 

热议股票

 
 
 
 
 

7x24