ITCOW牛新网 3月19日消息,在今天举行的GTC开发者大会上,英伟达揭开了其最新、最强大的AI加速卡——Blackwell GB200的神秘面纱,并计划在今年晚些时候将其推向市场。这款加速卡基于英伟达新一代AI图形处理器架构Blackwell,其AI性能高达20 petaflops,远超其前代产品H100的4 petaflops。

英伟达发布 Blackwell GB200

英伟达发布 Blackwell GB200

Blackwell GPU不仅体积庞大,而且技术先进,采用台积电的4纳米工艺制造,并整合了两个独立制造的裸晶,拥有惊人的2080亿个晶体管。这些晶体管通过NVLink 5.0技术像拉链一样将芯片紧密捆绑在一起,提供了前所未有的处理能力。

英伟达发布 Blackwell GB200

据英伟达官方表示,每个Blackwell Die的浮点运算能力比Hopper Die提高了25%,而每个封装中包含两个Blackwell芯片,使得总性能提升了2.5倍。在处理FP4八精度浮点运算时,性能甚至可以提高到5倍。此外,Blackwell complex的NVLink 5.0端口提供的带宽是Hopper GPU上NVLink 4.0端口速度的两倍,达到了惊人的1.8 TB/秒。

英伟达发布 Blackwell GB200

英伟达发布 Blackwell GB200

英伟达发布 Blackwell GB200

GB200作为Blackwell架构的代表作,包含了两个B200 Blackwell GPU和一个基于Arm的Grace CPU。在推理大语言模型方面,其性能比H100提升了30倍,同时成本和能耗降低了25倍。这意味着训练一个庞大的模型现在只需要更少的GPU和更低的电力消耗。

在GPT-3 LLM基准测试中,GB200的性能是H100的7倍,训练速度则是H100的4倍。这一显著的性能提升使得AI训练变得更加高效和快速。

英伟达发布 Blackwell GB200
NVIDIA Grace Blackwell 生产板
英伟达发布 Blackwell GB200
NVIDIA Grace Blackwell 开发板

为了满足大型企业的需求,英伟达还提供了完整的服务器解决方案。例如,GB200 NVL72服务器配备了36个CPU和72个Blackwell GPU,采用了一体水冷散热方案,确保了高性能的同时保持了良好的散热效果。这款服务器可以提供高达720 petaflops的AI训练性能或1.44 exaflops的推理性能。

英伟达发布 Blackwell GB200

此外,英伟达还计划推出DGX Superpod,它将八个DGX GB200系统合而为一,拥有288个CPU、576个GPU和240TB的内存,提供了惊人的11.5 exaflops的FP4计算能力。这一系统可以扩展至数万GB200超级芯片,并通过高速网络连接在一起,为AI训练提供了前所未有的规模和性能。

英伟达发布 Blackwell GB200

尽管英伟达目前尚未公布GB200及其整套方案的售价信息,但这一系列的发布无疑将推动AI技术的发展和应用迈向新的高峰。