DeepSeek首次回应“蒸馏OpenAI”质疑

老虎资讯综合09-18

9月18日,DeepSeek再次引发轰动。由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1研究论文,登上了国际权威期刊《Nature》的封面。今年1月,DeepSeek曾在arxiv公布了初版预印本论文,相较而言,此次发布在《Nature》的版本补充了更多模型细节,减少了描述中的拟人化说明。在补充材料中,DeepSeek提到了R1模型的训练成本仅29.4万美元,以及回应了模型发布之初关于蒸馏OpenAI的质疑。

今年1月,有报道提到,OpenAI研究人员认为,DeepSeek可能使用了OpenAI模型的输出来训练R1,这种方法可以在使用较少资源的情况下加速模型能力提升。在论文的补充资料部分,DeepSeek回应了关于DeepSeek-V3-Base训练数据来源的问题。“DeepSeek-V3-Base的训练数据仅来自普通网页和电子书,不包含任何合成数据。在预训练冷却阶段,我们没有故意加入OpenAI生成的合成数据,此阶段使用的所有数据都是通过网页抓取的。”DeepSeek表示。(一财)

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

  • Mediator
    09-18
    Mediator
    那就是不否认含咯
  • NOVASPARK
    09-18
    NOVASPARK
    加了又怎样,OpenAI训练数据就干净吗
  • 老猫88
    09-18
    老猫88
    如有蒸馏,纯属意外[捂脸]  
  • YanphetX
    09-18
    YanphetX
    这不就变相承认用了别人的数据了吗?😂😂😂
  • 媛媛08
    09-18
    媛媛08
    懂了是大模型私自越界收集[捂脸]  
发表看法
6
6