Skywork AI 发布 Matrix-Game 3.0:实现 720p 40 帧实时高清"世界生成"

AI资讯 4小时前 硕雀
2 0

Skywork AI 发布 Matrix-Game 3.0:实现 720p 40 帧实时高清"世界生成"

发布背景

2026年4月,中国人工智能公司Skywork AI(昆仑天工AI)‍ 正式发布其最新研发的 Matrix-Game 3.0 系统,在交互式世界模型领域取得重大突破。该系统首次实现了 720p高清分辨率下每秒40帧(FPS)的实时视频生成,标志着AI从"生成片段"迈向了"实时构建可交互世界"的新阶段。


核心技术突破

1. 实时视频生成能力

参数 数值
分辨率 720p 高清
帧率 40 FPS
响应速度 实时流式生成

这一性能表现远超以往AI视频生成工具,后者通常需要数秒至数分钟才能生成几秒钟的短片。

2. 长效记忆机制

传统AI视频生成工具在长序列互动中会出现"失忆"问题——无法记住之前生成的内容,导致场景和风格不稳定。Matrix-Game 3.0通过以下技术解决了这一难题:

  • 相机感知记忆检索机制:使系统能够记住并引用之前生成的场景内容
  • 统一的自注意力架构:保持时空一致性
  • 长时一致性训练框架:通过预测残差和重新注入不完美帧,实现模型自我修正

3. 数据工厂与模型训练

Skywork AI构建了包含多种数据源的"数据工厂":

  • 虚拟现实生成数据
  • 3A游戏数据
  • 真实场景视频数据

训练出了 5B参数模型,同时通过剪枝(保留75%参数)和量化技术,使推理速度提升5倍以上。此外,团队还展示了28B参数的MoE混合专家)模型,进一步提升了动态模拟和泛化能力


关键技术亮点

1. 多段自回归蒸馏策略

通过分布匹配蒸馏技术,实现了高效实时的推理流程,大幅提升了视频生成速度。

2. VAE解码器剪枝技术

对VAE解码器进行剪枝优化,在保证画质的前提下大幅降低计算开销。

3. Unreal-Gen平台

基于虚幻引擎5开发的生成平台,能够生成电影级交互视频内容,为游戏、VR/AR等应用提供了强大支持。

4. 统一双向扩散Transformer架构

模型采用统一的架构设计,结合误差缓冲和注入机制,实现自我修正和多视角长时一致的交互视频生成。在8块GPU或1块GPU支持下,均可实现720p@40FPS实时生成。


应用场景

Matrix-Game 3.0的应用潜力非常广阔:

应用领域 具体用途
 游戏开发 实时生成游戏场景、NPC互动
机器人训练 构建虚拟训练环境
XR扩展现实 沉浸式虚拟体验
电影制作 快速生成影视素材
 虚拟现实 构建可交互的3D世界

技术意义

Skywork AI的Matrix-Game 3.0代表了AI视频生成技术的重要里程碑:

  1. 从"造片段"到"造世界":不再是生成几秒钟的孤立视频片段,而是构建可长期交互的连续世界
  2. 实时性与记忆力的平衡:解决了长期以来实时生成与长期一致性难以兼顾的技术难题
  3. 工业级部署可行:通过模型优化和剪枝技术,使大规模世界模型部署成为可能

 


相关资源


总结

Skywork AI的Matrix-Game 3.0通过720p 40帧实时高清"世界生成"能力,配合长效记忆机制,为交互式AI应用开辟了新的可能性。这一技术突破不仅展示了中国AI研究的前沿实力,也为游戏、VR/AR、机器人等领域带来了革命性的解决方案。随着该技术的进一步成熟和广泛应用,AI构建真实、可交互世界的目标正逐步变为现实。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!