ITCOW牛新网 1月26日消息,AMD公司近日正式推出开源计算平台ROCm的7.2.0版本。该版本新增对多款显卡和处理器的官方支持,并针对Instinct MI350系列与MI300X加速器的AI计算性能进行了专项优化。

AMD发布ROCm 7.2.0计算平台

此次更新扩展了硬件兼容性列表,新增支持的设备包括AMD Radeon AI PRO R9600D独立显卡、Radeon RX 9060 XT LP低功耗版显卡以及Radeon RX 7700显卡。同时,平台还加入了对最新发布的锐龙AI 400系列处理器的支持。在AI计算性能方面,新版本特别优化了Instinct MI355X加速器运行Meta Llama 3.1 405B大模型的推理表现,通过内核级调优和内存带宽提升实现了吞吐量增加和延迟降低。

据ITCOW牛新网了解,ROCm 7.2.0还针对多款大模型进行了专项优化。在MI355X和MI350X加速器上提升了Llama 3 70B和Llama 2 70B模型的运行效率,同时在MI300X上优化了智谱GLM-4.6的GEMM算子性能以及DeepSeek的DeepEP开源通信库表现。此外,新版本还包含多项系统级改进,包括提升HIP运行时性能、增加对多GPU节点的节点电源管理功能等。

ROCm作为AMD推出的开源软件平台,旨在为高性能计算和人工智能工作负载提供全面的软件支持。此次7.2.0版本的发布,进一步丰富了AMD在AI计算领域的软件生态,为开发者和研究人员提供了更强大的工具支持。