英伟达发布DGX Station与DGX Spark桌面AI超算，支持本地运行万亿参数模型

ITCOW牛新网 1月6日消息，英伟达在今日举行的CES 2026展会上推出了DGX Spark和DGX Station两款桌面级AI超级计算机，标志着本地AI开发迈入“超算时代”。这两款设备基于最新的NVIDIA Grace Blackwell架构，具备大容量统一内存和Petaflop级别的AI性能，旨在让开发者、研究人员和数据科学家无需依赖云端集群，即可在本地桌面上开发、微调并运行从1000亿到1万亿参数的开源及前沿AI模型，从而打通从本地原型设计到云端大规模扩展的通道。

DGX Spark作为入门级旗舰产品，专为1000亿参数级别的模型设计。该系统引入了NVFP4数据格式，能将AI模型压缩高达70%且不损失智能表现。在实际应用中，DGX Spark展现了显著性能优势：例如，在运行Black Forest Labs的FLUX.2等视频生成模型时，其速度比搭载M4 Max芯片的顶级MacBook Pro快了8倍。

此外，通过与开源社区（如llama.cpp）的深度合作，该系统在运行SOTA模型时平均性能提升了35%，并大幅加快了LLM的加载速度。

据ITCOW牛新网了解，面向企业级和前沿实验室的DGX Station则是一款性能标杆设备。它搭载GB300 Grace Blackwell Ultra超级芯片，配备高达775 GB的FP4精度一致性内存，使其能够本地运行高达1万亿参数的巨型模型。

一致性内存架构通过NVLink-C2C或PCIe Gen6/7互连技术，实现CPU和GPU间的硬件级数据同步，无需显式内存拷贝，显著降低延迟。FP4精度作为一种4位浮点格式，专为Blackwell及后续Rubin架构优化，能在保持模型精度的前提下，将显存占用降至FP16的四分之一，吞吐量提升高达2-3倍。

英伟达明确列出了支持的前沿模型，包括Kimi-K2 Thinking、DeepSeek-V3.2、Mistral Large 3、Meta Llama 4 Maverick以及OpenAI gpt-oss-120b。vLLM核心维护者Kaichao You表示：“DGX Station改变了开发动态，让团队能以极低成本在本地测试GB300专属特性。”

为构建完整的本地AI生态，NVIDIA宣布了多项软件与合作伙伴计划。DGX Spark现已支持NVIDIA AI Enterprise软件栈，并提供了针对机器人（如Hugging Face Reachy Mini）、基因组学和金融分析的全新开发手册。在硬件供应方面，DGX Spark及合作伙伴推出的GB10系统即日起通过戴尔、惠普、联想、华硕等厂商发售，而旗舰级DGX Station将于今年晚些时候正式上市。

英伟达发布DGX Station与DGX Spark桌面AI超算，支持本地运行万亿参数模型

相关文章

三星承认 Galaxy S26 Ultra 3 倍变焦模糊，正开发修复补丁

小米宣布Redmi多款机型售价调整，上游存储成本激增是主因

Omdia：2025Q4 中国 PC 市场出货持平台式机增长平板表现亮眼

更多资讯

顺丰上线城市迷你仓自助仓储服务 24 小时自助存取覆盖多类存储场景

Anthropic 启动 ProjectGlasswing 计划投 1 亿美元模型额度守护全球软件基础设施安全

DeepSeek 推出全新专家模式聚焦复杂问题深度推理

携程推“无理由事假”新政：6000人样本测试45天自由离岗，灵活办公再进阶