ITCOW牛新网 9月21日消息,在近日举办的华为全联接大会2025上,华为技术有限公司与浙江大学共同揭晓了DeepSeek-R1-Safe基础大模型,这一模型基于昇腾千卡算力平台构建。

该模型的核心创新在于其全流程安全后训练框架,覆盖了从高质量安全语料准备到平衡优化的训练过程,以及全链路自主创新的软硬件支持。研发团队首次实现了基于昇腾平台的千亿级参数大模型安全训练,系统解决了训练环境中的关键技术难题,并开发了包括服务器间环境同步、数据与权重共享及协同训练推理在内的一系列工具。

据ITCOW牛新网了解,测试数据显示,DeepSeek-R1-Safe在14个维度的有害内容防御上整体成功率接近100%,针对越狱攻击模式的防御成功率超过40%。其综合安全防御能力达到83%,较同期其他主流模型提升8%至15%。同时,在MMLU、GSM8K等通用能力基准测试中,该模型相比前代产品的性能损耗控制在1%以内,有效实现了安全与性能的平衡。

浙江大学计算机科学与技术学院院长任奎及中国工程院院士陈纯均强调,此次合作依托昇腾生态,成功组建了涵盖海内外青年人才的科研团队,并完成了国内首次千卡集群大模型安全训练。陈纯院士表示,希望未来与华为展开更深入合作,共同推动我国AI技术的安全发展与产业应用。
华为昇腾计算业务总裁张迪煊进一步透露,华为在大会期间推出了新一代AI硬件及全系列软件开源战略,覆盖编译器、运行时驱动等核心组件,旨在通过开放协作促进基础软件创新与AI安全能力建设。
目前,DeepSeek-R1-Safe模型已在ModelZoo、GitCode、GitHub、Gitee及ModelScope等主流开源社区全面开放,供广大开发者与研究机构使用。