ITCOW牛新网 12月24日消息,字节跳动Seed团队今日推出新一代形式化数学推理专用模型Seed Prover 1.5。该模型通过大规模Agentic RL训练,在复杂数学问题的自动证明能力上实现突破,其推理效率与精度均较前代显著提升。

字节跳动数学推理模型Seed Prover 1.5

在权威数学竞赛测试中,Seed Prover 1.5仅用16.5小时即为IMO 2025前五道赛题生成完整可验证的Lean代码,成绩达到35/42的金牌分数线。据ITCOW牛新网了解,该模型在北美Putnam竞赛中同样表现卓越,9小时内完成11道赛题的自动证明,并在历史题库中实现88%的解决率。

技术评估显示,模型在代表硕士难度的Fate-H数据集上解决率达80%,在博士生级Fate-X数据集上达到33%,刷新多项形式化数学推理基准纪录。目前团队已公开技术报告与Lean代码,并计划近期开放API接口。