Camera Clone 数据集概览
| 项目 | 说明 | 关键来源 |
|---|---|---|
| 数据集名称 | Camera Clone Dataset(亦称 Camera Clone 数据集) | |
| 数据来源 | 使用 Unreal Engine 5 渲染的合成视频 | |
| 场景数量 | 40 个多样化 3D 场景(室内/室外、昼夜等) | |
| 拍摄位置 | 39.1 K 个不同地点 | |
| 视频总量 | 391 K 条视觉真实视频(每条分辨率 576 × 1008,154 帧) | |
| 数据对/三元组 | 1 155 K 组三元组(相机参考 + 内容参考 + 目标视频) | |
| 相机轨迹 | 97.75 K 条多样化轨迹,覆盖从基础平移、旋转到复杂组合路径 | |
| 数据对规模 | 超过 115 万 对(用于训练) | |
| 视频分辨率 & 帧率 | 最高可达 4K,30 fps(得益于 UE5 的 Nanite 与 Lumen) | |
| 公开方式 | 论文中声明 将公开发布,并提供下载链接(详见论文附录) | |
| 适用任务 | - 图像‑到‑视频(I2V) - 视频‑到‑视频(V2V) - 相机运动克隆学习 |
|
| 评估基准 | 在 RealEstate10K 与精选电影片段上进行定量与用户研究,展示出在相机准确性、视觉质量和动态一致性方面的领先表现 |
数据集的核心特点
- 大规模合成:通过 UE5 自动生成,保证了高质量渲染与统一的相机参数标注,避免了真实拍摄中难以获取的配对视频。
- 多样化轨迹:设计了从简单平移/旋转到复杂路径的 97 K 条轨迹,覆盖电影级运镜需求。
- 三元组结构:每组包含(相机运动参考 + 内容参考 + 目标视频),为 reference‑based camera control 提供了完整监督信号。
- 高分辨率:利用 UE5 的 Nanite 微多边形和 Lumen 全局光照,视频可达 4K,保证了细节保真。
- 统一评估:在 RealEstate10K 与经典电影片段上进行 PSNR、SSIM、LPIPS、FVD、相机姿态误差等多项指标的对比,验证了数据集对模型学习相机克隆的有效性。
获取方式
- 论文链接(含数据集说明与下载入口):
https://arxiv.org/pdf/2506.03140.pdf
论文的附录章节提供了数据集的公开下载链接(目前已在项目页面上开放)。 - 项目主页:https://camclonemaster.github.io/
- 数据集:https://huggingface.co/datasets/KwaiVGI/CameraClone-Dataset
如需最新的下载链接,建议直接访问上述 arXiv PDF 的 “Dataset Release” 部分,或在论文发布的项目主页上查找。
适用场景示例
- 电影后期:使用参考镜头克隆相机运动,对已有素材重新拍摄不同内容。
- 虚拟制作:在游戏或虚拟现实中,快速生成符合指定相机轨迹的动画视频。
- 研究:用于评估相机控制的生成模型、相机姿态估计或视频‑到‑视频迁移学习。
小结
Camera Clone 数据集是目前规模最大、质量最高的专用于 相机运动克隆 的合成视频集合,涵盖 40 种场景、数十万条轨迹和上百万对配对视频,为参考‑based 视频生成提供了坚实的数据支撑。通过论文(arXiv 2506.03140)可获取完整的下载链接和使用说明。
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!