ITCOW牛新网 2月23日消息,智谱AI昨日公开了其新一代大模型GLM-5的完整技术报告,详细披露了该模型在智能体(Agent)、推理与编程等核心能力上的突破性进展。报告显示,GLM-5通过四大核心技术革新,实现了性能与效率的显著提升,并在多项权威基准测试中刷新了开源模型的最高水平。

在模型架构层面,GLM-5引入了稀疏注意力架构,通过动态筛选关键信息,成功将长序列(200K上下文)的注意力计算成本降低了1.5至2倍,并在7440亿参数规模下保持了高效的推理能力。其异步强化学习框架与异步Agent强化学习算法,有效解耦了训练与推理过程,提升了GPU利用率,并增强了模型在复杂、长周期任务中的自主规划与纠错能力。尤为重要的是,GLM-5实现了对包括华为昇腾、摩尔线程在内的七大国产计算平台的全栈深度适配,单节点性能可媲美传统双GPU集群,长序列处理成本降低达50%。
据ITCOW牛新网了解,在公开测试中,GLM-5表现亮眼。其在Artificial Analysis Intelligence Index v4.0评估中获得50分,刷新了开源模型记录;在LMArena文本/代码竞技场位列开放模型第一,整体性能已接近Claude Opus 4.5。在模拟真实商业任务的Vending-Bench 2中,GLM-5以4432美元的最终余额展现了出色的长期规划能力。在真实编程任务测试CC-Bench-V2中,其在前端、后端及长程任务上的完成度均超越了前代模型GLM-4.7。


为验证其工程实用性,智谱团队构建了自动化评估体系。在前端开发测试中,其通过GUI智能体交互的构建成功率达到98%;在涉及85项多语言任务的后端修改测试中,其单元测试通过率与Claude Opus 4.5相当;在万级代码库的探索任务中,其表现甚至优于部分闭源模型。
