上海 AI 实验室发布科学多模态模型书生Intern-S1-Pro

AI资讯 2小时前 硕雀
2 0

上海人工智能实验室(Shanghai AI Laboratory)发布的书生 Intern-S1-Pro 是当前全球开源社区中规模最大、科学能力最强的科学多模态大模型。该模型于2026年2月4日正式对外开源,标志着上海AI实验室在开源AI领域的又一重大突破。

以下是关于书生 Intern-S1-Pro 的详细介绍:

1. 核心定位与意义

Intern-S1-Pro 是基于上海AI实验室首创的“通专融合”(通用能力 + 专业科学能力)技术架构 SAGE 打造的旗舰级模型。

  • 规模巨头:Intern-S1-Pro 是全球开源社区中参数规模最大的科学多模态模型,参数规模达万亿级(Trillion-Scale)。
  • 科学能力领跑:它在复杂数理逻辑推理能力上达到了奥赛金牌水平,在高难度综合学科评测中稳居AI for ScienceAI4S)领域的国际领先地位。
  • 智能体能力:在面向真实科研流程的智能体能力方面,Intern-S1-Pro 位居开源模型第一梯队,具备了更强的“可用性”。

2. 技术架构与创新点

Intern-S1-Pro 采用了多项技术创新,特别是其“通专融合”技术架构 SAGE(Science and General Embedding)是核心竞争力:

  • 通专融合技术(SAGE)‍:这是一个融合通用语言推理能力与专业科学数据解析能力的技术架构。它通过混合专家(Mixture of Experts)和跨模态科学解析引擎,实现了通用推理与专业技能的高效融合。
  • 跨模态科学解析引擎:Intern-S1-Pro 首创了“跨模态科学解析引擎”,能够精准解读化学分子式、蛋白质结构、地震波信号等复杂的科学数据,并能够进行科学数据的可视化分析。
  • 高效训练技术:在强化学习(RL)训练阶段,Intern-S1-Pro 引入了 Mixture-of-Rewards 框架和 FP8 精度训练技术,实现了极高的算力效率。其训练算力消耗仅为同类闭源模型(如 Grok-4)的约1%,但性能毫不逊色。

3. 能力评测与优势

Intern-S1-Pro 在多个维度上展示了强大的能力:

  • 多模态能力:在多模态理解能力(如图文理解、科学图表解读)上,Intern-S1-Pro 超越了当前主流的开源模型(如 InternVL、Qwen-VL)。
  • 科学推理能力:在化学、材料、地球科学等专业任务基准测试中,它超越了当时最强的闭源模型(如 Grok-4),表现出了顶级的科学推理能力。
  • 全能型特质:Intern-S1-Pro 兼具“全能高手”(Generalist)与“科学明星”(Scientist)的特质,能够同时处理日常对话、复杂的学术研究和专业的数据分析任务。

4. 开源生态与应用

上海AI实验室不仅发布了模型,还同步推出了完整的工具链和应用平台:

  • 书生科学发现平台(Intern-Discovery)‍:基于 Intern-S1-Pro,实验室推出了“书生”科学发现平台,旨在帮助全球科研人员从假设到验证实现全流程协作。
  • 全链路工具体系:Intern-S1-Pro 已形成了从数据处理、模型预训练到微调部署的全链路开源工具体系,支持免费商用,旨在推动AI助手更懂科学。

5. 关键数据速览

参数 细节
参数规模 万亿参数(Trillion-Scale)
模型家族 书生大模型(Intern)系列(基于 InternLM 和 InternVL)
发布时间 2026年2月4日正式开源
核心技术 通专融合(SAGE)、跨模态科学解析引擎、FP8 低精度训练

总的来说,书生 Intern-S1-Pro 是一款专为科学研究和高阶推理设计的顶级开源模型,它通过巨大的参数规模和独特的技术架构,填补了开源模型在科学领域的能力空白,为全球科研人员提供了强大的AI工具。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!