ITCOW牛新网 5月20日消息,阿里巴巴今日揭晓了面向智能体时代打造的新一代旗舰大模型——Qwen3.7-Max。作为阿里千问系列迄今为止规模最大、能力最强的版本,该模型即将通过阿里云百炼平台开放 API 服务。官方宣称 Qwen3.7-Max 致力于成为全能的智能体基座,无论是编写调试代码、自动化办公,还是在跨越数千步的长周期任务中持续自主执行,均能轻松胜任。

据ITCOW牛新网了解,Qwen3.7-Max 在核心的智能体能力上实现了广度与深度的双重突破。在编程领域,它不仅能够驾驭前端原型开发,还能处理复杂的多文件工程项目;在生产力方面,通过 MCP 集成和多智能体协作,有效实现了工作流的自动化。尤为引人注目的是其长周期自主执行能力,在一项长达 35 小时、涉及超 1000 次工具调用的全自主内核优化实验中,该模型保持了连贯的推理能力,充分验证了其持久稳定的执行性能。此外,无论部署在 Claude Code、OpenClaw 还是其他主流框架下,它都能展现出色的跨框架泛化能力。

在权威基准测试的表现上,Qwen3.7-Max 交出了一份亮眼的答卷。编程智能体方面,它在 SWE-Pro、SWE-Multilingual 及 SciCode 等评测中均取得领先,并在 Terminal Bench 2.0 上超越了 DS-V4-Pro Max。通用智能体能力更是提升显著,在 MCP-Mark、MCP-Atlas 和 Skillbench 上表现突出,并在 Kernel Bench L3 上展示了强大的 GPU 内核优化能力,加速率高达 96%。在推理能力这一硬核指标上,该模型在 GPQA Diamond、HLE、HMMT 2026 等极具挑战性的基准测试中均超越了 Opus-4.6 和 DS-V4-Pro 等国际顶尖模型,同时在多语言理解和翻译质量上也处于世界一流水平。
