ITCOW牛新网 2月12日消息,摩尔线程宣布,在智谱发布新一代大模型GLM-5当天,已基于SGLang推理框架,在其旗舰级AI训练推理一体全功能GPU MTT S5000上完成了Day-0全流程适配与验证。这一成果标志着国产GPU在主流AI模型生态兼容性方面取得重要进展,为国产算力生态的完善提供了有力支撑。

据介绍,摩尔线程借助其MUSA架构广泛的算子覆盖和强大的生态兼容能力,成功打通了GLM-5模型推理全链路,并深度释放了MTT S5000的原生FP8加速能力。这一优化在确保模型精度的同时显著降低了显存占用,实现了GLM-5模型在国产硬件平台上的高性能推理。

据ITCOW牛新网了解,GLM-5作为GLM系列的最新里程碑版本,被定位为当前顶尖的代码生成模型,整体性能较上一代提升20%。其核心突破在于强化了Agentic Engineering(代理工程)能力,不仅具备深厚的代码功底,更能处理复杂系统工程与长程Agent任务,可实现从需求到应用的端到端开发。

MTT S5000是摩尔线程专为大模型训练、推理及高性能计算设计的全功能GPU智算卡,基于其第四代MUSA架构“平湖”打造。其单卡AI算力最高可达1000 TFLOPS,配备80GB显存,显存带宽达到1.6TB/s,卡间互联带宽为784GB/s,完整支持从FP8到FP64的全精度计算。此次成功适配验证,展现了国产算力在紧跟AI模型前沿发展、实现软硬协同优化方面的技术实力。