ITCOW牛新网 4月29日消息,英伟达于当地时间 4 月 28 日推出Nemotron 3 Nano Omni开源全模态推理模型,面向企业级 AI Agent 提供一体化基础底座。

该模型采用30B‑A3B 混合 MoE 架构,融合 Mamba 与 Transformer 层,统一处理文本、图像、音频、视频输入,可替代多模型拆分链路,降低推理复杂度与成本。在多项基准测试中表现领先,视频推理吞吐量较同类开源模型最高提升9.2 倍,多文档推理最高提升7.4 倍,推理成本显著降低。



模型权重、数据集与训练方案完全开源,已上线 Hugging Face,即将作为 NVIDIA NIM 微服务推出,适配本地、云端及企业级部署。
