ITCOW牛新网 11月13日消息,英伟达基于Blackwell Ultra架构的GB300 NVL72平台在最新一期MLPerf AI训练基准测试中表现卓越,包揽了全部7个项目的冠军。该平台在训练效率方面实现重大突破,仅用10分钟就完成了拥有4050亿参数的Llama 3.1大模型的训练任务,创下新纪录。

GB300 NVL72平台在多项关键测试中表现优异。据ITCOW牛新网了解,该平台仅需0.4分钟即可完成Llama 2 70B模型的LoRA微调,训练Llama 3.1 8B模型也仅需5.2分钟。与上一代产品相比,Blackwell Ultra架构的性能提升显著:在Llama 2 70B微调任务中,8块GB300 GPU的性能是同等数量H100 GPU的5倍;在Llama 3.1 405B预训练任务中,GB300的性能达到H100的4倍以上,比同为Blackwell架构的GB200快近2倍。



业内分析认为,这一性能突破得益于英伟达在软硬件方面的协同创新。硬件方面,GB300 NVL72系统配备了速率高达800 GB/s的Quantum-X800 InfiniBand高速网络,每块GPU搭载279GB的HBM3e高带宽内存,系统总内存容量(GPU+CPU)达到40TB。软件方面,全面采用FP4精度,在模型训练的每一层应用该精度,使计算速度达到FP8的两倍,而Blackwell Ultra架构进一步将这一优势提升至3倍。

随着大模型训练的复杂度不断提升,高效的计算平台成为推动AI技术发展的关键。GB300 NVL72平台的突破性性能,将为人工智能研究机构和企业在训练更大、更复杂的模型时提供强大支持。