GP黑白熊
09-24
用了下 api太慢了 国内网络环境下比gemini还慢。
阿里巴巴正式推出其迄今为止规模最大、能力最强的模型Qwen3-Max
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。
分享至
微信
复制链接
精彩评论
我们需要你的真知灼见来填补这片空白
打开APP,发表看法
APP内打开
发表看法
2
{"i18n":{"language":"zh_CN"},"detailType":1,"isChannel":false,"data":{"magic":2,"id":481930455740672,"tweetId":"481930455740672","gmtCreate":1758683014830,"gmtModify":1758683017123,"author":{"id":3539928148899666,"idStr":"3539928148899666","authorId":3539928148899666,"authorIdStr":"3539928148899666","name":"GP黑白熊","avatar":"https://static.laohu8.com/default-avatar.jpg","vip":1,"userType":1,"introduction":"","boolIsFan":false,"boolIsHead":false,"crmLevel":3,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":5,"starInvestorFlag":false},"themes":[],"images":[],"coverImages":[],"html":"<html><head></head><body>用了下 api太慢了 国内网络环境下比gemini还慢。</body></html>","htmlText":"<html><head></head><body>用了下 api太慢了 国内网络环境下比gemini还慢。</body></html>","text":"用了下 api太慢了 国内网络环境下比gemini还慢。","highlighted":1,"essential":1,"paper":1,"likeSize":2,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/481930455740672","repostId":1119571798,"repostType":2,"repost":{"id":"1119571798","kind":"news","weMediaInfo":{"introduction":"为用户提供金融资讯、行情、数据,旨在帮助投资者理解世界,做投资决策。","home_visible":1,"media_name":"老虎资讯综合","id":"102","head_image":"https://static.tigerbbs.com/8274c5b9d4c2852bfb1c4d6ce16c68ba"},"pubTimestamp":1758682065,"share":"https://www.laohu8.com/m/news/1119571798?lang=&edition=full","pubTime":"2025-09-24 10:47","market":"us","language":"zh","title":"阿里巴巴正式推出其迄今为止规模最大、能力最强的模型Qwen3-Max","url":"https://stock-news.laohu8.com/highlight/detail?id=1119571798","media":"老虎资讯综合","summary":"继 Qwen3-2507 系列发布之后,我们非常高兴地推出 Qwen3-Max —— 我们迄今为止规模最大、能力最强的模型。我们诚邀您通过阿里云 API 体验 Qwen3-Max-Instruct,或直接在 Qwen Chat 上进行试用。与此同时,仍在训练中的 Qwen3-Max-Thinking 已展现出非凡潜力。训练稳定性:得益于Qwen3的MoE模型结构设计,Qwen3-Max的预训练loss稳定平滑。目前,我们正在全力推进 Qwen3-Max-Thinking 的训练,期待尽快能让用户体验。同时,该模型的 API也已开放使用。","content":"<html><head></head><body><p>9月24日,阿里巴巴美股夜盘、H股均涨超7%!正式推出其迄今为止规模最大、能力最强的模型 Qwen3-Max。</p><p>据通义千问Qwen公众号消息:继 Qwen3-2507 系列发布之后,我们非常高兴地推出 Qwen3-Max —— 我们迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。</p><p style=\"text-align: justify;\">我们诚邀您通过阿里云 API 体验 Qwen3-Max-Instruct,或直接在 Qwen Chat 上进行试用。与此同时,仍在训练中的 Qwen3-Max-Thinking 已展现出非凡潜力。在结合工具使用并增加测试时计算资源的情况下,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得 100% 的准确率。我们期待在不久的将来向公众正式发布这一版本。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/54b7562832415c0eba46ed00e40b838a\" title=\"\" tg-width=\"1080\" tg-height=\"638\"/></p><p style=\"text-align: justify;\"><strong>Qwen3-Max-Base</strong></p><p style=\"text-align: justify;\">Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了我们提出的global-batch load balancing loss。</p><ul style=\"list-style-type: square;\"><li><p><strong>训练稳定性:</strong>得益于Qwen3的MoE模型结构设计,Qwen3-Max的预训练loss稳定平滑。训练过程一气呵成,没有任何loss尖刺,也没有使用训练回退、改变数据分布等调整策略。</p></li><li><p><strong>训练高效性:</strong>在PAI-FlashMoE的高效多级流水并行策略优化下,Qwen3-Max-Base训练效率显著提升,其MFU相比Qwen2.5-Max-Base相对提升30%。在长序列训练场景中,我们进一步使用ChunkFlow策略获得了相比序列并行方案提升3倍的吞吐收益,支持Qwen3-Max 1M长上下文的训练。同时,通过SanityCheck、EasyCheckpoint、调度链路优化等多种手段,Qwen3-Max在超大规模集群上因硬件故障造成的时间损失下降为Qwen2.5-Max的五分之一。</p></li></ul><p style=\"text-align: justify;\"><strong>Qwen3-Max-Instruct</strong></p><p style=\"text-align: justify;\">Qwen3-Max-Instruct的预览版已在 LMArena 文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,Qwen3-Max-Instruct 更是实现了突破性表现,以74.8分超越 Claude Opus 4与 DeepSeek-V3.1。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b7107a4ebd3aaf887d34cb3c3f82c396\" title=\"\" tg-width=\"1080\" tg-height=\"637\"/></p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/79019d90d26ce62fb88fb29358d21fcf\" title=\"\" tg-width=\"1080\" tg-height=\"665\"/></p><p style=\"text-align: justify;\"><strong>Qwen3-Max-Thinking(Heavy)</strong></p><p style=\"text-align: justify;\">Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking,通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力,尤其在极具挑战性的数学推理基准测试 AIME 25 和 HMMT 上,均取得了满分。目前,我们正在全力推进 Qwen3-Max-Thinking 的训练,期待尽快能让用户体验。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/4cf4c8b48ef3ee2cfa0c82e494bfb396\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p style=\"text-align: justify;\"><strong>使用Qwen3-Max进行开发</strong></p><p style=\"text-align: justify;\">现在,您可以在 Qwen Chat 官网(chat.qwen.ai)直接与强大的 Qwen3-Max-Instruct 模型对话,体验其卓越能力。同时,该模型的 API(模型名称为 qwen3-max)也已开放使用。</p><p>您只需按以下步骤操作,即可快速接入API:</p><p><strong>注册阿里云账号:</strong>前往阿里云官网。</p><p><strong>开通服务:</strong>激活阿里云 Model Studio。</p><p><strong>获取密钥:</strong>登录控制台,创建您的专属 APIKey。</p></body></html>","collect":0,"html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>阿里巴巴正式推出其迄今为止规模最大、能力最强的模型Qwen3-Max</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n阿里巴巴正式推出其迄今为止规模最大、能力最强的模型Qwen3-Max\n</h2>\n\n<h4 class=\"meta\">\n\n\n<a class=\"head\" href=\"https://laohu8.com/wemedia/102\">\n\n\n<div class=\"h-thumb\" style=\"background-image:url(https://static.tigerbbs.com/8274c5b9d4c2852bfb1c4d6ce16c68ba);background-size:cover;\"></div>\n\n<div class=\"h-content\">\n<p class=\"h-name\">老虎资讯综合 </p>\n<p class=\"h-time\">2025-09-24 10:47</p>\n</div>\n\n</a>\n\n\n</h4>\n\n</header>\n<article>\n<html><head></head><body><p>9月24日,阿里巴巴美股夜盘、H股均涨超7%!正式推出其迄今为止规模最大、能力最强的模型 Qwen3-Max。</p><p>据通义千问Qwen公众号消息:继 Qwen3-2507 系列发布之后,我们非常高兴地推出 Qwen3-Max —— 我们迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。</p><p style=\"text-align: justify;\">我们诚邀您通过阿里云 API 体验 Qwen3-Max-Instruct,或直接在 Qwen Chat 上进行试用。与此同时,仍在训练中的 Qwen3-Max-Thinking 已展现出非凡潜力。在结合工具使用并增加测试时计算资源的情况下,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得 100% 的准确率。我们期待在不久的将来向公众正式发布这一版本。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/54b7562832415c0eba46ed00e40b838a\" title=\"\" tg-width=\"1080\" tg-height=\"638\"/></p><p style=\"text-align: justify;\"><strong>Qwen3-Max-Base</strong></p><p style=\"text-align: justify;\">Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了我们提出的global-batch load balancing loss。</p><ul style=\"list-style-type: square;\"><li><p><strong>训练稳定性:</strong>得益于Qwen3的MoE模型结构设计,Qwen3-Max的预训练loss稳定平滑。训练过程一气呵成,没有任何loss尖刺,也没有使用训练回退、改变数据分布等调整策略。</p></li><li><p><strong>训练高效性:</strong>在PAI-FlashMoE的高效多级流水并行策略优化下,Qwen3-Max-Base训练效率显著提升,其MFU相比Qwen2.5-Max-Base相对提升30%。在长序列训练场景中,我们进一步使用ChunkFlow策略获得了相比序列并行方案提升3倍的吞吐收益,支持Qwen3-Max 1M长上下文的训练。同时,通过SanityCheck、EasyCheckpoint、调度链路优化等多种手段,Qwen3-Max在超大规模集群上因硬件故障造成的时间损失下降为Qwen2.5-Max的五分之一。</p></li></ul><p style=\"text-align: justify;\"><strong>Qwen3-Max-Instruct</strong></p><p style=\"text-align: justify;\">Qwen3-Max-Instruct的预览版已在 LMArena 文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,Qwen3-Max-Instruct 更是实现了突破性表现,以74.8分超越 Claude Opus 4与 DeepSeek-V3.1。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/b7107a4ebd3aaf887d34cb3c3f82c396\" title=\"\" tg-width=\"1080\" tg-height=\"637\"/></p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/79019d90d26ce62fb88fb29358d21fcf\" title=\"\" tg-width=\"1080\" tg-height=\"665\"/></p><p style=\"text-align: justify;\"><strong>Qwen3-Max-Thinking(Heavy)</strong></p><p style=\"text-align: justify;\">Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking,通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力,尤其在极具挑战性的数学推理基准测试 AIME 25 和 HMMT 上,均取得了满分。目前,我们正在全力推进 Qwen3-Max-Thinking 的训练,期待尽快能让用户体验。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/4cf4c8b48ef3ee2cfa0c82e494bfb396\" title=\"\" tg-width=\"1080\" tg-height=\"608\"/></p><p style=\"text-align: justify;\"><strong>使用Qwen3-Max进行开发</strong></p><p style=\"text-align: justify;\">现在,您可以在 Qwen Chat 官网(chat.qwen.ai)直接与强大的 Qwen3-Max-Instruct 模型对话,体验其卓越能力。同时,该模型的 API(模型名称为 qwen3-max)也已开放使用。</p><p>您只需按以下步骤操作,即可快速接入API:</p><p><strong>注册阿里云账号:</strong>前往阿里云官网。</p><p><strong>开通服务:</strong>激活阿里云 Model Studio。</p><p><strong>获取密钥:</strong>登录控制台,创建您的专属 APIKey。</p></body></html>\n\n</article>\n</div>\n</body>\n</html>\n","type":0,"thumbnail":"https://static.tigerbbs.com/7064c4d7d0e0e65c6e1138157a714384","relate_stocks":{"BABA":"阿里巴巴","09988":"阿里巴巴-W"},"source_url":"https://mp.weixin.qq.com/s?__biz=Mzk0ODg4NDI5NA==&mid=2247485995&idx=1&sn=f5b5e198569a7d77812acebb1d5d520b&chksm=c2f02603a0e134d71cba76575fbfa3d41352e2af452d59d7280898b5b15c7da416a8a7c341ff&scene=0&xtrack=1#rd","is_english":false,"share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","article_id":"1119571798","content_text":"9月24日,阿里巴巴美股夜盘、H股均涨超7%!正式推出其迄今为止规模最大、能力最强的模型 Qwen3-Max。据通义千问Qwen公众号消息:继 Qwen3-2507 系列发布之后,我们非常高兴地推出 Qwen3-Max —— 我们迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。我们诚邀您通过阿里云 API 体验 Qwen3-Max-Instruct,或直接在 Qwen Chat 上进行试用。与此同时,仍在训练中的 Qwen3-Max-Thinking 已展现出非凡潜力。在结合工具使用并增加测试时计算资源的情况下,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得 100% 的准确率。我们期待在不久的将来向公众正式发布这一版本。Qwen3-Max-BaseQwen3-Max模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了我们提出的global-batch load balancing loss。训练稳定性:得益于Qwen3的MoE模型结构设计,Qwen3-Max的预训练loss稳定平滑。训练过程一气呵成,没有任何loss尖刺,也没有使用训练回退、改变数据分布等调整策略。训练高效性:在PAI-FlashMoE的高效多级流水并行策略优化下,Qwen3-Max-Base训练效率显著提升,其MFU相比Qwen2.5-Max-Base相对提升30%。在长序列训练场景中,我们进一步使用ChunkFlow策略获得了相比序列并行方案提升3倍的吞吐收益,支持Qwen3-Max 1M长上下文的训练。同时,通过SanityCheck、EasyCheckpoint、调度链路优化等多种手段,Qwen3-Max在超大规模集群上因硬件故障造成的时间损失下降为Qwen2.5-Max的五分之一。Qwen3-Max-InstructQwen3-Max-Instruct的预览版已在 LMArena 文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上,Qwen3-Max-Instruct 取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,Qwen3-Max-Instruct 更是实现了突破性表现,以74.8分超越 Claude Opus 4与 DeepSeek-V3.1。Qwen3-Max-Thinking(Heavy)Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking,通过集成代码解释器并运用并行测试时计算技术,展现了前所未有的推理能力,尤其在极具挑战性的数学推理基准测试 AIME 25 和 HMMT 上,均取得了满分。目前,我们正在全力推进 Qwen3-Max-Thinking 的训练,期待尽快能让用户体验。使用Qwen3-Max进行开发现在,您可以在 Qwen Chat 官网(chat.qwen.ai)直接与强大的 Qwen3-Max-Instruct 模型对话,体验其卓越能力。同时,该模型的 API(模型名称为 qwen3-max)也已开放使用。您只需按以下步骤操作,即可快速接入API:注册阿里云账号:前往阿里云官网。开通服务:激活阿里云 Model Studio。获取密钥:登录控制台,创建您的专属 APIKey。","news_type":1,"symbols_score_info":{"09988":1.1,"BABA":1.1}},"isVote":1,"tweetType":1,"viewCount":95,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":[],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":42,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"isCommentEnd":true,"isTiger":false,"isWeiXinMini":false,"url":"/m/post/481930455740672"}
精彩评论