阿里千问3发布，参数仅为DeepSeek-R1三分之一

新识研究所

阿里发布上半年最重要大模型Qwen 3，成为第一个开源混合推理模型

据南方都市报报道，4月29日，阿里巴巴发布了今年上半年最重要的AI大模型Qwen3。

同DeepSeek-R1相比，Qwen3采用混合专家（MoE）架构，总参数量235B，激活仅需22B，参数量缩减了三分之二，但性能表现却全面超越R1及OpenAI-o1等主流模型。

而在参数较少之外，Qwen3也是国内首款同时整合“快思考”和“慢思考”的混合推理模型，大幅降低了推理成本和算力消耗，在进行推理前可进行选择，对简单需求可低算力「秒回」答案，对复杂问题可多步骤「深度思考」，大大节省算力消耗。

性能方面，千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。在奥数水平的AIME25测评中，千问3斩获81.5分，刷新开源纪录；在考察代码能力的LiveCodeBench评测中，千问3突破70分大关，表现甚至超过Grok3；在评估模型人类偏好对齐的ArenaHard测评中，千问3以95.6分超越OpenAI-o1及DeepSeek-R1。

性能大幅提升的同时，千问3的部署成本还大幅下降，仅需4张H20即可部署千问3满血版。同时，其还还提供了丰富的模型版本，包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型，每款模型均斩获同尺寸开源模型SOTA（最佳性能）。

而在应用上，千问3原生支持MCP协议，大大降低编码复杂性，实现高效的手机及电脑Agent操作等任务，首次支持119种语言和方言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用。

作者：杨启隆

编辑：丁力

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白

发表看法

{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":429894233686184,"tweetId":"429894233686184","gmtCreate":1745925086691,"gmtModify":1745932734638,"author":{"id":3572079433999630,"idStr":"3572079433999630","authorId":3572079433999630,"authorIdStr":"3572079433999630","name":"新识研究所","avatar":"https://static.tigerbbs.com/f973b3be4669225f4f91e9ea30eec726","vip":6,"userType":6,"introduction":"奇偶之于无界，产业、公司、数据、产品、我们求客观表达","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":902,"starInvestorFlag":false},"themes":[],"images":[{"img":"https://static.tigerbbs.com/5edafdb016e741bb78fad85e7345e45c","width":"612","height":"408"}],"coverImages":[{"img":"https://static.tigerbbs.com/5edafdb016e741bb78fad85e7345e45c","width":"612","height":"408"}],"title":"阿里千问3发布，参数仅为DeepSeek-R1三分之一","html":"<html><head></head><body><p>阿里发布上半年最重要大模型Qwen 3，成为第一个开源混合推理模型</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/5edafdb016e741bb78fad85e7345e45c\" tg-width=\"612\" tg-height=\"408\"></p>\n<p>&nbsp;</p>\n<p>据南方都市报报道，4月29日，阿里巴巴发布了今年上半年最重要的AI大模型Qwen3。</p>\n<p>&nbsp;</p>\n<p>同DeepSeek-R1相比，Qwen3采用混合专家（MoE）架构，总参数量235B，激活仅需22B，参数量缩减了三分之二，但性能表现却全面超越R1及OpenAI-o1等主流模型。</p>\n<p>&nbsp;</p>\n<p>而在参数较少之外，Qwen3也是国内首款同时整合“快思考”和“慢思考”的混合推理模型，大幅降低了推理成本和算力消耗，在进行推理前可进行选择，对简单需求可低算力「秒回」答案，对复杂问题可多步骤「深度思考」，大大节省算力消耗。</p>\n<p>&nbsp;</p>\n<p>性能方面，千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。在奥数水平的AIME25测评中，千问3斩获81.5分，刷新开源纪录；在考察代码能力的LiveCodeBench评测中，千问3突破70分大关，表现甚至超过Grok3；在评估模型人类偏好对齐的ArenaHard测评中，千问3以95.6分超越OpenAI-o1及DeepSeek-R1。</p>\n<p>&nbsp;</p>\n<p>性能大幅提升的同时，千问3的部署成本还大幅下降，仅需4张H20即可部署千问3满血版。同时，其还还提供了丰富的模型版本，包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型，每款模型均斩获同尺寸开源模型SOTA（最佳性能）。</p>\n<p>&nbsp;</p>\n<p>而在应用上，千问3原生支持MCP协议，大大降低编码复杂性，实现高效的手机及电脑Agent操作等任务，首次支持119种语言和方言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用。</p>\n<p>&nbsp;</p>\n<p>作者：杨启隆</p>\n<p>编辑：丁力</p>\n<p>&nbsp;</p>\n<p>&nbsp;</p></body></html>","htmlText":"<html><head></head><body><p>阿里发布上半年最重要大模型Qwen 3，成为第一个开源混合推理模型</p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/5edafdb016e741bb78fad85e7345e45c\" tg-width=\"612\" tg-height=\"408\"></p>\n<p>&nbsp;</p>\n<p>据南方都市报报道，4月29日，阿里巴巴发布了今年上半年最重要的AI大模型Qwen3。</p>\n<p>&nbsp;</p>\n<p>同DeepSeek-R1相比，Qwen3采用混合专家（MoE）架构，总参数量235B，激活仅需22B，参数量缩减了三分之二，但性能表现却全面超越R1及OpenAI-o1等主流模型。</p>\n<p>&nbsp;</p>\n<p>而在参数较少之外，Qwen3也是国内首款同时整合“快思考”和“慢思考”的混合推理模型，大幅降低了推理成本和算力消耗，在进行推理前可进行选择，对简单需求可低算力「秒回」答案，对复杂问题可多步骤「深度思考」，大大节省算力消耗。</p>\n<p>&nbsp;</p>\n<p>性能方面，千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。在奥数水平的AIME25测评中，千问3斩获81.5分，刷新开源纪录；在考察代码能力的LiveCodeBench评测中，千问3突破70分大关，表现甚至超过Grok3；在评估模型人类偏好对齐的ArenaHard测评中，千问3以95.6分超越OpenAI-o1及DeepSeek-R1。</p>\n<p>&nbsp;</p>\n<p>性能大幅提升的同时，千问3的部署成本还大幅下降，仅需4张H20即可部署千问3满血版。同时，其还还提供了丰富的模型版本，包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型，每款模型均斩获同尺寸开源模型SOTA（最佳性能）。</p>\n<p>&nbsp;</p>\n<p>而在应用上，千问3原生支持MCP协议，大大降低编码复杂性，实现高效的手机及电脑Agent操作等任务，首次支持119种语言和方言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用。</p>\n<p>&nbsp;</p>\n<p>作者：杨启隆</p>\n<p>编辑：丁力</p>\n<p>&nbsp;</p>\n<p>&nbsp;</p></body></html>","text":"阿里发布上半年最重要大模型Qwen 3，成为第一个开源混合推理模型 据南方都市报报道，4月29日，阿里巴巴发布了今年上半年最重要的AI大模型Qwen3。 同DeepSeek-R1相比，Qwen3采用混合专家（MoE）架构，总参数量235B，激活仅需22B，参数量缩减了三分之二，但性能表现却全面超越R1及OpenAI-o1等主流模型。 而在参数较少之外，Qwen3也是国内首款同时整合“快思考”和“慢思考”的混合推理模型，大幅降低了推理成本和算力消耗，在进行推理前可进行选择，对简单需求可低算力「秒回」答案，对复杂问题可多步骤「深度思考」，大大节省算力消耗。 性能方面，千问3在推理、指令遵循、工具调用、多语言能力等方面均大幅增强。在奥数水平的AIME25测评中，千问3斩获81.5分，刷新开源纪录；在考察代码能力的LiveCodeBench评测中，千问3突破70分大关，表现甚至超过Grok3；在评估模型人类偏好对齐的ArenaHard测评中，千问3以95.6分超越OpenAI-o1及DeepSeek-R1。 性能大幅提升的同时，千问3的部署成本还大幅下降，仅需4张H20即可部署千问3满血版。同时，其还还提供了丰富的模型版本，包含2款30B、235B的MoE模型，以及0.6B、1.7B、4B、8B、14B、32B等6款密集模型，每款模型均斩获同尺寸开源模型SOTA（最佳性能）。 而在应用上，千问3原生支持MCP协议，大大降低编码复杂性，实现高效的手机及电脑Agent操作等任务，首次支持119种语言和方言，全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用。 作者：杨启隆 编辑：丁力","highlighted":1,"essential":1,"paper":2,"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/429894233686184","repostId":0,"isVote":1,"tweetType":1,"viewCount":295,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":1161,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/429894233686184"}