【阿里巴巴(09988.HK)开源新架构Qwen3-Next 训练成本大幅下降 引入混合注意力机制】智通财经APP获悉,9月12日,阿里巴巴(09988.HK)通义发布下一代基础模型架构Qwen3-Next,并开源了基于该架构的 Qwen3-Next-80B-A3B
系列模型。该模型包含两个版本:更擅长理解和执行指令的指令(Insctruct)模型,以及更擅长多步推理和深度思考的推理(Thinking)模型。
智通财经09-12 14:05
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。