ITCOW牛新网 12月20日消息,摩尔线程今日在北京中关村国际创新中心举办首届MUSA开发者大会(MDC 2025)。作为国内首个专注于全功能GPU的技术盛会,本次大会全面展示了摩尔线程基于自主MUSA统一架构的全栈技术成果。公司创始人、董事长兼CEO张建中在会上推出了夸娥万卡智算集群。

摩尔线程夸娥万卡集群

夸娥万卡集群具备全精度和全功能的通用计算能力,能够在万卡规模下实现高效稳定的AI训练与推理。该集群在多项关键指标上表现突出:浮点运算能力达到10Exa-Flops,训练算力利用率在Dense大模型上达到60%,在MOE大模型上为40%,有效训练时间占比超过90%,训练线性扩展效率高达95%。此外,该集群与国际主流生态高度兼容,并在能效方面具备显著优势。

摩尔线程夸娥万卡集群

据ITCOW牛新网了解,在训练方面,摩尔线程利用原生FP8能力完整复现了顶尖大模型的训练流程,并在多项关键精度指标上达到国际主流水平。技术优化方面,Flash Attention算力利用率超过95%,并突破了FP8累加精度等关键技术瓶颈,充分释放了国产GPU在大模型训练中的性能潜力。

摩尔线程夸娥万卡集群

在推理侧,摩尔线程与硅基流动合作,通过系统级工程优化和FP8精度加速,在DeepSeek R1 671B全量模型上实现了性能突破:MTT S5000单卡Prefill吞吐量突破4000 tokens/s,Decode吞吐量突破1000 tokens/s,为国产推理性能树立了新标杆。

摩尔线程夸娥万卡集群

面向未来,摩尔线程还发布了基于MTT S5000的MTT C256超节点架构规划。该产品采用计算与交换一体化的高密设计,旨在系统性提升万卡集群的训练效能与推理能力,为下一代超大规模智算中心构建兼具超高密度与极致能效的硬件基础。这一创新设计有望进一步推动国产GPU技术在AI计算领域的发展。