ITCOW牛新网 11月27日消息,DeepSeek今日发布了DeepSeekMath-V2数学模型,该模型突破性地引入了自验证推理训练框架,能够对自身生成的数学证明进行自动审查,显著提升推理过程的严谨性。这一技术突破使模型在多项国际顶级数学竞赛中达到金牌水平。

DeepSeek Math-V2数学模型

据ITCOW牛新网了解,DeepSeekMath-V2基于DeepSeek-V3.2-Exp-Base架构开发,其核心创新在于构建了基于大语言模型的验证器系统。该验证器不仅能自动审查模型生成的数学证明,还能通过扩展验证计算持续生成高难度训练样本,形成自我优化的闭环学习机制。这种设计有效解决了传统数学模型仅关注答案正确率而忽视推理链条严谨性的问题。

DeepSeek Math-V2数学模型

在权威测试中,该模型展现出卓越性能:在2025年国际数学奥林匹克竞赛和2024年中国数学奥林匹克竞赛中均达到金牌水准,在2024年普特南数学竞赛中更是获得118分(满分120分)的近乎满分成绩。DeepSeek团队表示,虽然仍有大量工作待推进,但当前成果证明自验证数学推理是可行的技术路径,为构建更可靠数学智能系统奠定基础。

分析认为,这一突破对自动定理证明、数学教育智能化等领域具有重要价值。模型已开源发布,用户可通过Hugging Face和GitHub平台获取相关资源。