• 9
  • 4
  • 2

阿里推出全新推理模型,仅1/20参数媲美DeepSeek R1

老虎资讯综合03-06

3月6日,阿里Qwen团队正式发布他们最新的研究成果 —— QwQ-32B大语言模型!QwQ-32B在仅有DeepSeek-R1约1/20参数量的情况下, 用强化学习,实现了性能上的惊人跨越!

官方给出基准评测结果,涵盖了数学推理、代码能力和通用问题解决等多个方面。从数据中我们可以清晰地看到,在 AIME24 和 IFEval 等关键基准测试中,QwQ-32B 的表现甚至略微超过了参数量巨大的 DeepSeek-R1! 而在其他基准测试中,也基本与 DeepSeek-R1 持平,远超其他对比模型。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

举报

评论4

  • plantegg
    ·03-06
    试了一下,效果确实很赞
    回复
    举报
  • Mediator
    ·03-06
    难绷
    回复
    举报
  • 那肯定是抄袭了代码
    回复
    举报
  • 早干嘛去了?
    回复
    举报
 
 
 
 

热议股票

 
 
 
 
 

7x24