ITCOW牛新网 1月6日消息,英伟达在今日举行的CES 2026展会上推出了DGX Spark和DGX Station两款桌面级AI超级计算机,标志着本地AI开发迈入“超算时代”。这两款设备基于最新的NVIDIA Grace Blackwell架构,具备大容量统一内存和Petaflop级别的AI性能,旨在让开发者、研究人员和数据科学家无需依赖云端集群,即可在本地桌面上开发、微调并运行从1000亿到1万亿参数的开源及前沿AI模型,从而打通从本地原型设计到云端大规模扩展的通道。

英伟达DGX Station与DGX Spark桌面AI超算
英伟达DGX Station与DGX Spark桌面AI超算

DGX Spark作为入门级旗舰产品,专为1000亿参数级别的模型设计。该系统引入了NVFP4数据格式,能将AI模型压缩高达70%且不损失智能表现。在实际应用中,DGX Spark展现了显著性能优势:例如,在运行Black Forest Labs的FLUX.2等视频生成模型时,其速度比搭载M4 Max芯片的顶级MacBook Pro快了8倍。

此外,通过与开源社区(如llama.cpp)的深度合作,该系统在运行SOTA模型时平均性能提升了35%,并大幅加快了LLM的加载速度。

英伟达DGX Station与DGX Spark桌面AI超算

据ITCOW牛新网了解,面向企业级和前沿实验室的DGX Station则是一款性能标杆设备。它搭载GB300 Grace Blackwell Ultra超级芯片,配备高达775 GB的FP4精度一致性内存,使其能够本地运行高达1万亿参数的巨型模型。

英伟达DGX Station与DGX Spark桌面AI超算

一致性内存架构通过NVLink-C2C或PCIe Gen6/7互连技术,实现CPU和GPU间的硬件级数据同步,无需显式内存拷贝,显著降低延迟。FP4精度作为一种4位浮点格式,专为Blackwell及后续Rubin架构优化,能在保持模型精度的前提下,将显存占用降至FP16的四分之一,吞吐量提升高达2-3倍。

英伟达DGX Station与DGX Spark桌面AI超算

英伟达明确列出了支持的前沿模型,包括Kimi-K2 Thinking、DeepSeek-V3.2、Mistral Large 3、Meta Llama 4 Maverick以及OpenAI gpt-oss-120b。vLLM核心维护者Kaichao You表示:“DGX Station改变了开发动态,让团队能以极低成本在本地测试GB300专属特性。”

为构建完整的本地AI生态,NVIDIA宣布了多项软件与合作伙伴计划。DGX Spark现已支持NVIDIA AI Enterprise软件栈,并提供了针对机器人(如Hugging Face Reachy Mini)、基因组学和金融分析的全新开发手册。在硬件供应方面,DGX Spark及合作伙伴推出的GB10系统即日起通过戴尔、惠普、联想、华硕等厂商发售,而旗舰级DGX Station将于今年晚些时候正式上市。