• 2
  • 6
  • 1

DeepSeek首次回应“蒸馏OpenAI”质疑

老虎资讯综合09-18 12:47

9月18日,DeepSeek再次引发轰动。由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文,登上了国际权威期刊《Nature》的封面。今年1月,DeepSeek曾在arxiv公布了初版预印本论文,相较而言,此次发布在《Nature》的版本补充了更多模型细节,减少了描述中的拟人化说明。在补充材料中,DeepSeek提到了R1模型的训练成本仅29.4万美元,以及回应了模型发布之初关于蒸馏OpenAI的质疑。

今年1月,有报道提到,OpenAI研究人员认为,DeepSeek可能使用了OpenAI模型的输出来训练R1,这种方法可以在使用较少资源的情况下加速模型能力提升。在论文的补充资料部分,DeepSeek回应了关于DeepSeek-V3-Base训练数据来源的问题。“DeepSeek-V3-Base的训练数据仅来自普通网页和电子书,不包含任何合成数据。在预训练冷却阶段,我们没有故意加入OpenAI生成的合成数据,此阶段使用的所有数据都是通过网页抓取的。”DeepSeek表示。(一财)

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

举报

评论6

  • Mediator
    ·09-18 19:22
    那就是不否认含咯
    回复
    举报
  • NOVASPARK
    ·09-18 16:14
    加了又怎样,OpenAI训练数据就干净吗
    回复
    举报
  • 老猫88
    ·09-18 15:14
    如有蒸馏,纯属意外[捂脸]  
    回复
    举报
  • YanphetX
    ·09-18 13:10
    这不就变相承认用了别人的数据了吗?😂😂😂
    回复
    举报
  • 媛媛08
    ·09-18 13:05
    懂了是大模型私自越界收集[捂脸]  
    回复
    举报
  • LAOFENG
    ·09-18 12:53
    嗯,不小心的
    回复
    举报
 
 
 
 

热议股票

 
 
 
 
 

7x24