阿里推出全新推理模型,仅1/20参数媲美DeepSeek R1

老虎资讯综合03-06

3月6日,阿里Qwen团队正式发布他们最新的研究成果 —— QwQ-32B大语言模型!QwQ-32B在仅有DeepSeek-R1约1/20参数量的情况下, 用强化学习,实现了性能上的惊人跨越!

官方给出基准评测结果,涵盖了数学推理、代码能力和通用问题解决等多个方面。从数据中我们可以清晰地看到,在 AIME24 和 IFEval 等关键基准测试中,QwQ-32B 的表现甚至略微超过了参数量巨大的 DeepSeek-R1! 而在其他基准测试中,也基本与 DeepSeek-R1 持平,远超其他对比模型。

免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

发表看法
4
4