Skywork AI 研究团队发布 Matrix-Game 2.0

AI资讯 2个月前 硕雀
34 0

Skywork AI 研究团队与 Matrix‑Game 2.0 概览

1. 团队背景

Skywork AI 是昆仑万维旗下的前沿人工智能实验室,专注于多模态生成、交互式世界模型以及具身智能等方向。2025 年 8 月 11 日至 15 日,团队举办了为期五天的 SkyWork AI 技术发布周,每日发布一款新模型,系统性展示了在视频生成、世界模型、统一多模态、智能体和 AI 音乐创作等五大技术领域的最新成果。

2. Matrix‑Game 2.0 的定位

Matrix‑Game 2.0 是该系列中针对 交互式实时长序列生成 的核心模型,被誉为业内首个在通用场景下实现 实时、流式、分钟级视频生成 的开源世界模型。它的发布标志着交互式世界模型从离线、低帧率的实验阶段跃升至可直接用于游戏、虚拟现实、影视创作等实际生产环境的水平。

3. 技术架构与核心创新

关键技术 说明
视觉驱动交互方案 通过 3D 因果变分自编码器(3D‑CVA)捕捉空间因果关系,实现对物理规律和场景语义的精准理解。
多模态扩散 Transformer 将视觉、文本、动作指令统一映射到扩散过程,支持低延迟、高帧率的连续生成。
流式生成引擎 采用 25 FPS 的实时渲染管线,能够在用户输入指令后即时反馈,生成时长可扩展至 分钟级,保持动作与视觉的时序一致性。
跨场景长序列一致性 通过因果建模和时序约束,确保跨场景切换时的视觉连贯性和动作自然流畅。
开放源码与模型权重 完全开源,代码、模型权重、Demo 均在 GitHub 与 Hugging Face 上公开,便于社区二次开发与评测。

4. 性能指标

  • 帧率:25 FPS(实时交互)
  • 生成时长:单次可生成 分钟级 连续视频(相较于前代模型提升数十倍)
  • 硬件需求:单张 16 GB 显存的 RTX 4090 即可流畅运行,普通工作站即可部署
  • 延迟:低于 200 ms 的指令响应时间,实现“即时操控”体验

5. 主要应用场景

  1. 游戏开发:实时生成游戏关卡、角色动作和环境特效,降低美术资源制作成本。
  2. 虚拟现实 / 元宇宙:用户通过自然语言或手势指令即时构建、修改虚拟空间,实现沉浸式交互。
  3. 影视创作:快速预览长镜头、特效场景,辅助导演与特效团队进行创意迭代。
  4. 具身智能研究:为机器人或虚拟代理提供可视化的交互式环境,推动空间智能与动作规划的实验。

6. 开源生态与资源获取

  • 代码仓库GitHub SkyworkAI/Matrix-Game(包含 Matrix‑Game‑2 分支)
  • 模型权重:Hugging Face 页面 Skywork/Matrix-Game-2.0(可直接下载)
  • 技术报告:PDF 版报告详细阐述模型结构、训练数据与实验结果,位于仓库 assets/pdf/report.pdf
  • 项目官网https://matrix-game-v2.github.io/  提供在线 Demo 与使用文档。
  • 论文:https://arxiv.org/abs/2508.13009
  • 主页:https://matrix-game-v2.github.io
  • 代码:https://github.com/skyworkai/matrix-game
  • 试用:https://huggingface.co/Skywork/Matrix-Game-2.0

7. 业界与学术影响

  • 技术突破:实现了 实时 与 长序列 的统一,填补了交互式世界模型在帧率、时序一致性上的空白。
  • 开源意义:作为首个在通用场景下开源的实时交互模型,Matrix‑Game 2.0 为全球研究者提供了可直接复现的基准,促进了从 离线生成 向 实时交互 的转变。
  • 后续路线:团队计划在 Matrix‑Game 系列中进一步提升 3D 重建精度、跨模态控制灵活性,并与 Skywork UniPic、Skywork Deep Research Agent 等模型深度融合,构建更完整的 多模态生成与检索 生态。

8. 小结

Matrix‑Game 2.0 代表了 Skywork AI 在交互式世界模型领域的最新里程碑。它通过 高帧率实时流式生成跨场景长序列一致性 与 完全开源 三大特性,为游戏、VR、影视以及具身智能等多个行业提供了可落地的技术底座,也为学术界提供了重要的实验平台。随着后续模型的迭代与生态的完善,Matrix‑Game 2.0 有望在生成式 AI 与虚拟世界构建的交叉领域发挥更大影响。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!