ITCOW牛新网 6月1日消息,在今日的台北国际电脑展上,英伟达正式揭晓了NVIDIA Alpamayo 2 Super。这款拥有320亿参数的视觉-语言-动作(VLA)模型,是英伟达迄今为止功能最强的开源驾驶基础大模型。该模型专为L4级自动驾驶出租车(Robotaxi)量身打造,标志着汽车从单纯的“行驶”迈向了具备“自主推理”能力的全新时代。

英伟达发布Alpamayo 2 Super

Alpamayo 2 Super的参数规模较此前的100亿版本提升了3倍,基于NVIDIA Cosmos世界基础模型构建。它不仅限于生成行驶轨迹,更能在整套驾驶系统中完成推理、规划与执行。新模型将感知范围从传统的前置摄像头升级为360度全景环视,覆盖车辆前、侧、后方视野,为变道、并线等操作提供完整的环境信息。此外,该模型新增了元动作输出能力,支持礼让、变道、停车等高层级驾驶决策预判,并能输出因果链溯源信息,极大地提升了行驶安全性与决策的可解释性。

据ITCOW牛新网了解,为了打通从数据采集到车载部署的全流程,英伟达还同步推出了一系列配套工具。其中包括开源的闭环强化学习框架NVIDIA AlpaGym,以及用于生成逼真驾驶场景的世界模型NVIDIA OmniDreams。依托Omniverse NuRec打造的神经重建能力,开发者可以基于真实车队数据开展仿真并批量生成合成数据。英伟达CEO黄仁勋表示,唯有英伟达能同步提供开源模型、仿真工具、真实数据与智能体能力,助力全球生态打造可规模化部署的L4级自动驾驶能力。

在应用层面,Alpamayo 2 Super定位为“教师模型”,企业可通过知识蒸馏技术将其压缩为轻量化模型,部署在NVIDIA DRIVE AGX Thor车载芯片上。这一流程将自动标注周期从数月缩短至数日,大幅优化了研发成本。目前,比亚迪、吉利、极氪、小米以及小马智行等中国主流车企和自动驾驶公司,均已采用或正在基于NVIDIA Hyperion平台开发智驾系统。该模型的推理代码预计将于今年夏季上线GitHub,模型权重也将同步发布在Hugging Face平台。