4月2日,阿里千问发布新一代大语言模型Qwen3.6-Plus。千问3.6整体性能较3.5进步显著,并且涌现出极强的智能体编程能力,在系列编程能力权威评测中,千问3.6编程表现超越2倍乃至3倍参数量的GLM-5、Kimi-K2.5等模型,成为当下编程能力最强的国产模型,接近全球最强编程模型 Claude 系列。 相较于上一代模型,千问3.6整体性能提升明显,尤其是编程Coding能力、智能体Agent能力和工具调用能力都实现了全面跃升。在SWE-bench系列真实编程任务测试、考察终端编程的Terminal-Bench2.0、长程编程任务NL2Repo,以及Claw-Eval、QwenClawBench等真实世界Agent能力评测中,Qwen3.6-Plus表现可完全匹敌Claude Opus 4.5,并显著超越了2倍乃至3倍其参数的GLM-5、Kimi-K2.5等国产模型。 随着编程能力的大幅提升,大模型能更好发挥AI智能体的潜力,使得代理式编程(Agentic Coding)真正可行。在前端网页开发、仓库级复杂任务等实测场景中,千问3.6可自主拆解任务、规划路径、测试修改直至任务完成。Qwen3.6-Plus 展现出卓越的工程落地能力,不仅能实现高质量代码修复,而且擅长复杂的终端操作与自动化任务执行,取得了多个高难度的长程规划任务中的最优成绩。 基于原生多模态数据训练,千问3.6发展出更敏锐的理解感知能力和更强大的多模态推理能力。同时,Qwen3.6-Plus面向真实任务持续迭代优化,具备更强的指令遵循、文本和物体识别能力,在实际场景中表现更稳健。Qwen3.6-Plus的原生多模态能力,打开了视觉智能体编程新的想象空间:模型可基于界面截图、设计稿或自然图文描述,完成前端页面生成、代码补全、交互修改等任务,逐步打通从“看懂界面”到“生成代码”再到“调用工具完成修改”的完