ITCOW牛新网 7月31日消息,阿里云旗下通义千问团队今日发布全新升级的推理大模型Qwen3-30B-A3B-Thinking-2507。这款模型在多项核心能力指标上实现突破,展现出国产大模型技术的快速进步。

与4月发布的上一代模型相比,新版本在数学推理和代码能力方面提升显著。据官方测试数据显示,该模型在AIME25数学评测中获得85.0分,在LiveCodeBench v6代码测试中取得66.0分,两项成绩均超越Gemini2.5-Flash和Qwen3-235B-A22B等业界主流模型。在知识水平测试中,新模型同样展现出明显进步。

据ITCOW牛新网了解,Qwen3-30B-A3B-Thinking-2507在多项通用能力评测中表现优异。特别是在写作创作、智能体任务执行、多轮对话和多语言指令理解等方面,其表现均优于同类对比模型。这些进步使得该模型在复杂任务处理上更具优势。

技术亮点方面,新模型原生支持256K tokens的上下文长度,并可扩展至1M tokens,大幅提升了长文本理解能力。开发团队建议,在处理高度复杂的推理任务时,适当增加思考预算长度,可以更好地发挥模型的潜力。
目前,该模型已在魔搭社区和HuggingFace等开源平台发布,其轻量化设计使得在消费级硬件上本地部署成为可能。同时,通义千问聊天应用也已同步集成新模型,为用户提供更智能的交互体验。
行业专家分析指出,Qwen3-30B-A3B-Thinking-2507的发布,标志着国产大模型在推理能力方面取得重要突破。其优异的数学和代码能力,使其在科研辅助、教育应用等领域具有广阔前景。随着模型性能的持续提升,国产AI技术在国际竞争中的地位正逐步加强。
阿里云表示,未来将继续加大在大模型技术领域的投入,推动AI技术在各行业的深入应用。通义千问系列模型的持续迭代,将为开发者提供更强大的工具,助力中国人工智能生态的繁荣发展。