DeepSeek宣布V3 模型更新,各项能力全面升级

新浪科技2025-03-25

  3月25日晚间消息,DeepSeek宣布V3 模型已完成小版本升级,目前版本号 DeepSeek-V3-0324,用户登录官方网页、APP、小程序进入对话界面后,关闭深度思考即可体验。

  据悉,DeepSeek-V3-0324 API 接口和使用方式保持不变。如非复杂推理任务,建议使用新版本 V3 模型,即刻享受速度更加流畅、效果全面提升的对话体验。

  模型推理任务表现提高,新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

  DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型,仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相关变动)。模型参数约 660B,开源版本上下文长度为 128K(网页端、App 和 API 提供 64K 上下文)。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

  • 只做空
    2025-03-25
    只做空
    想故技重施,想多了。
  • 吴佰旺
    2025-03-25
    吴佰旺
    呵呵呵又开始催牛逼。
  • 海熊
    2025-03-25
    海熊
    great news
发表看法
3
3