字节跳动 Seed 团队发布新一代形式化数学推理模型 Seed Prover 1.5

AI资讯 3小时前 硕雀
2 0

字节跳动 Seed 团队发布的 Seed Prover 1.5 概览


1. 产品定位与核心价值

Seed Prover 1.5 是字节跳动 Seed 团队在 2025 年 12 月 24 日正式推出的 新一代形式化数学推理模型。它面向数学研究、教育与 AI 辅助证明等场景,旨在提升自动化数学证明的效率与可靠性,使得复杂定理的形式化验证更加可行。


2. 技术创新

关键技术 说明
Agentic Prover 架构 将 Lean 语言视作可调用工具,模型在证明过程中能够动态检索 Mathlib 定理、调用 Python 进行数值验证、增量保存与复用引理等,实现“边推理边修正”的灵活路径,而非传统的线性生成或一次成型方式
大规模 Agentic RL 训练 采用强化学习框架对模型进行数十万步的迭代训练,使证明成功率从前代的约 50% 提升至接近 90%,并在算力消耗上相对前代降低约 30%
多模态工具链 支持 Lean 与外部计算环境(如 Python)交互,能够在证明中直接进行数值实验或图形计算,提升对高难度、跨领域问题的处理能力
Sketch Model 模拟人类数学家的工作流程,先生成问题的“草稿”结构,再细化为完整证明,进一步提升生成质量与效率

3. 性能表现(主要评测)

评测 结果 说明
IMO 2025(前 5 题) 16.5 小时完成全部 Lean 证明,得分 35/42,达到金牌分数线
Putnam 竞赛 9 小时完成 11 题,解题率 88%
Fate‑H 解决率 80%,刷新 SOTA 纪录
Fate‑X 解决率 33%,同样刷新纪录

这些成绩表明 Seed Prover 1.5 在多个公开数学评测中均实现了 显著的突破,在高难度证明任务上已接近或超过人类顶尖选手的水平。


4. 产品形态与使用方式

  1. 技术报告与代码:模型的技术报告已对外公开,代码同步发布在 GitHub,方便研究者复现与二次开发。
  2. API 计划:官方宣布将在后续开放 RESTful API,面向数学与 AI 研究者提供在线调用服务。
  3. 生态集成:目前已在字节跳动内部的 即梦 AI 与 豆包 两大平台完成接入,创作者可以直接体验“一键生成有声视频”之外的 数学证明自动化 功能。

5. 与前代(Seed Prover 1.0/1.2)对比

对比维度 前代 1.5 版
证明成功率 -50% -90%
算力消耗 基准 降低约 30%
多工具调用 限制较多 支持 Lean、Mathlib 检索、Python 计算、引理复用等
评测成绩 低于金牌线 多项评测达金牌或 SOTA 纪录

6. 未来发展方向

  • 持续迭代:Seed 团队计划进一步扩展模型对更大规模数学库的兼容性,提升对高阶抽象理论(如范畴论、同调代数)的支持。
  • 跨模态融合:探索将 形式化数学推理 与 多模态内容生成(如音视频)结合的可能性,打造“一站式 AI 学术创作平台”。
  • 社区生态:通过开放 API 与开源代码,鼓励学术界、教育机构以及企业共同构建 数学 AI 生态,推动 AI 在数学研究中的实际落地。

7. 小结

Seed Prover 1.5 通过 Agentic Prover 架构 与 大规模强化学习,在形式化数学推理领域实现了显著的技术跃升。它不仅在国际数学竞赛评测中取得金牌级成绩,还提供了灵活的工具调用机制和即将开放的 API,具备 高成功率、低算力、可扩展 的优势。随着代码和技术报告的公开,Seed Prover 1.5 有望成为学术研究、教育培训以及 AI 辅助数学工作的核心平台。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!