上海AI Lab推出科研智能体FlowSearch助力科研探索

AI资讯 8小时前 硕雀
3 0

上海AI Lab FlowSearch 科研智能体概览


1. 背景与定位

  • 研发单位:上海人工智能实验室(Shanghai AI Lab)
  • 首次发布:2023 年9 月正式对外公布,随后在 2025 年持续迭代并推出新版功能
  • 核心目标:把科研过程中的“脏活累活”交给 AI,让研究者专注于创新思考。它把科研任务视为一个开放、长期且高度复杂的认知过程,提供从问题提出、实验设计、证据收集到结论形成的全链路智能支持

2. 技术架构

关键概念 说明 参考
动态结构化知识流(Dynamic Structured Knowledge Flow) 采用有向无环图DAG)将科研任务、子任务及其知识依赖可视化。每个节点携带任务类型(检索、求解、回答)、描述和上下文,边定义信息流向,实现多路径并行探索与全程可追溯。
多智能体框架 FlowSearch 由多个专职智能体协同工作,分别负责规划、信息收集、推理与流程优化。智能体之间可以并行执行子任务,并在中间结果出现偏差时进行自我纠正。
核心模块 1. KnowledgeFlowPlanner – 负责依据研究目标递归式拆解任务,生成知识流结构。
2. KnowledgeCollector – 自动检索文献、数据库、网页等多源信息,并将结果注入对应节点。
3. KnowledgeFlowRefiner – 对已生成的知识流进行反思、优化,动态调整路径以适应新证据。
自适应优化与反馈 当系统检测到证据链不完整或推理偏离目标时,会主动提示研究者补充信息或自动重新规划任务,保持全局一致性。

3. 关键能力

  1. 全链路科研协作:从提出科研问题、设计实验方案、收集多源证据,到生成可解释的结论报告,全部在同一知识流中闭环。
  2. 并行探索:利用 DAG 与多智能体并行执行,显著缩短传统科研的迭代周期。
  3. 可解释性与可追溯性:每一步都有节点记录,研究者可以随时查看任务进展、数据来源和推理路径。
  4. 主动自适应:系统会在发现新信息或出现冲突时主动调整计划,避免“死胡同”。

4. 性能表现(基准测试

基准 说明 FlowSearch 成绩
GAIA(通用助理能力基准) 包含 466 题,覆盖推理、检索、工具使用等多维任务 在 GAIA 上全面超越现有方法,取得最高分
GPQA‑diamond(高难度科学问答) 侧重深度科学推理 获得领先成绩,显著优于单模型方案
HLE(高层次推理) 评估跨步骤推理与知识整合能力 同样实现全方位突破
TRQA(生物领域专业问答) 专业科研基准,聚焦生物医学 依托通用工具链超越多领域专用模型,展示强大专业问题解决能力

这些结果表明 FlowSearch 已从“被动工具”转向“主动探索伙伴”,在跨学科科研任务中具备显著优势。


5. 应用场景

  • 学术研究:帮助科研团队快速梳理文献、生成实验方案、自动化数据分析报告。
  • 企业研发:在新产品概念验证、专利检索、技术趋势预测等环节提供全流程智能支持。
  • 政府与公共科研平台:用于重大科技项目的前期可行性评估与跨部门协同。

6. 开源与生态

  • 代码开源:FlowSearch 的实现已在 GitHub 上公开,社区可基于其多智能体框架进行二次开发与定制。
  • 生态合作:上海AI Lab 正在与高校、科研院所及企业共建生态,推动科研智能体在实际项目中的落地。

7. 未来展望

  • 自演化科研系统:进一步提升知识流的自我进化能力,使系统能够在长期科研项目中持续学习、自动发现新研究方向。
  • 跨模态融合:结合图像、实验数据等多模态信息,扩展到实验室自动化与材料发现等更复杂场景。
  • 可解释科研 AI 标准:通过可视化知识流和节点审计,推动科研 AI 的透明度与可信度标准化

总结
FlowSearch 通过动态结构化知识流和多智能体协同,实现了科研任务的全链路自动化、并行探索和自适应优化。其在 GAIA、GPQA‑diamond、HLE、TRQA 等权威基准上取得领先成绩,标志着科研智能体从“工具”向“科研伙伴”的重要转变。随着开源生态的完善和跨模态能力的提升,FlowSearch 有望在学术、企业和公共科研领域发挥更大作用,推动科学发现进入新的智能化时代。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!