ITCOW牛新网 4月2日消息,阿里今日推出全新的 Qwen3.6-Plus 大模型,该模型现已通过阿里云百炼 API 开放调用,相较于前代产品实现了全方位的能力升级,尤其在编码智能体领域表现亮眼,成为国内同尺寸模型中的佼佼者,同时还具备高性价比优势,为开发者提供了更可靠的技术支持。

Qwen3.6-Plus 的更新核心围绕开发者核心诉求展开,重点实现了编码智能体能力的显著提升,在前端页面生成、代码修复、终端自动化等实际开发场景中,任务执行能力更稳定,代码任务端到端成功率大幅提高,Coding Agent 的代码生成、修复及工具调用能力也更可靠。
该模型默认支持 100 万上下文窗口,能更精准地完成长文档、多轮对话中的信息提取工作,多模态感知与推理能力也同步优化,视觉理解、指令遵循的稳定性显著增强。此外,该模型在性价比上极具优势,模型尺寸不到 K2.5、GLM5 的 1/2,成为其核心竞争力之一。

据 ITCOW 牛新网了解,在各项权威评测基准中,Qwen3.6-Plus 交出了优异的成绩单,在代码智能体、通用智能体、工具调用等多个维度全面跃升。代码智能体领域,其在 Terminal-Bench 2.0 等评测中拿下 61.6 的高分,在复杂终端操作与自动化任务执行中表现突出,主流代码修复基准成绩紧追行业标杆;通用智能体与工具使用方面,在 DeepPlanning 等高难度长程规划任务中取得最优成绩,各类工具调用基准测试中全面领先;通用能力上,无论是 STEM 推理、超长上下文信息提取,还是多语言环境适配,均在 MMLU-Pro、HMMT 等多项关键评测中刷新最佳表现,多语言处理、数学推理等能力均实现显著提升。

Qwen3.6-Plus 的多模态能力也完成进一步升级,围绕推理能力增强、指令模式实用性提升、复杂任务执行能力拓展三大方向持续演进。多模态推理上,在复杂文档理解、物理世界视觉理解、视频推理和视觉编程等任务中表现稳步提升,能更高效整合跨模态信息完成复杂分析与决策;指令模式实用性方面,结合真实业务场景优化后,在指令遵循、疑难文字识别、细粒度图像感知等方面的实用性和稳定性大幅增强,在 OmniDocBench1.5 文档识别、RealWorldQA 图像推理等评测中均取得高分。阿里还透露,Qwen3.6 系列将推出更多版本,性能更强的 Qwen3.6-Max 以及小尺寸开源模型将于近期发布,届时将为市场带来更多选择,进一步丰富千问大模型的产品生态。
