什么是Camera Clone数据集

Camera Clone 数据集概览

项目 说明 关键来源
数据集名称 Camera Clone Dataset(亦称 Camera Clone 数据集)
数据来源 使用 Unreal Engine 5 渲染的合成视频
场景数量 40 个多样化 3D 场景(室内/室外、昼夜等)
拍摄位置 39.1 K 个不同地点
视频总量 391 K 条视觉真实视频(每条分辨率 576 × 1008,154 帧)
数据对/三元组 1 155 K 组三元组(相机参考 + 内容参考 + 目标视频)
相机轨迹 97.75 K 条多样化轨迹,覆盖从基础平移、旋转到复杂组合路径
数据对规模 超过 115 万 对(用于训练)
视频分辨率 & 帧率 最高可达 4K,30 fps(得益于 UE5 的 Nanite 与 Lumen)
公开方式 论文中声明 将公开发布,并提供下载链接(详见论文附录)
适用任务 - 图像‑到‑视频(I2V)
- 视频‑到‑视频(V2V)
- 相机运动克隆学习
评估基准 RealEstate10K 与精选电影片段上进行定量与用户研究,展示出在相机准确性、视觉质量和动态一致性方面的领先表现

数据集的核心特点

  1. 大规模合成:通过 UE5 自动生成,保证了高质量渲染与统一的相机参数标注,避免了真实拍摄中难以获取的配对视频。
  2. 多样化轨迹:设计了从简单平移/旋转到复杂路径的 97 K 条轨迹,覆盖电影级运镜需求。
  3. 三元组结构:每组包含(相机运动参考 + 内容参考 + 目标视频),为 reference‑based camera control 提供了完整监督信号。
  4. 高分辨率:利用 UE5 的 Nanite 微多边形和 Lumen 全局光照,视频可达 4K,保证了细节保真。
  5. 统一评估:在 RealEstate10K 与经典电影片段上进行 PSNRSSIMLPIPS、FVD、相机姿态误差等多项指标的对比,验证了数据集对模型学习相机克隆的有效性。

获取方式

如需最新的下载链接,建议直接访问上述 arXiv PDF 的 ‍Dataset Release”‍ 部分,或在论文发布的项目主页上查找。

适用场景示例

  • 电影后期:使用参考镜头克隆相机运动,对已有素材重新拍摄不同内容。
  • 虚拟制作:在游戏或虚拟现实中,快速生成符合指定相机轨迹的动画视频。
  • 研究:用于评估相机控制的生成模型、相机姿态估计或视频‑到‑视频迁移学习

小结

Camera Clone 数据集是目前规模最大、质量最高的专用于 相机运动克隆 的合成视频集合,涵盖 40 种场景、数十万条轨迹和上百万对配对视频,为参考‑based 视频生成提供了坚实的数据支撑。通过论文(arXiv 2506.03140)可获取完整的下载链接和使用说明。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!