Vimeo25M - 是一个全面且多样化的视频数据集，包含2500万个文本-视频对 | AIUG

Vimeo25M

AI开源项目 AI开源项目 AI数据集数据集机器视觉处理

Vimeo25M

Vimeo25M是一个全面且多样化的视频数据集，包含2500万个文本-视频对

标签：AI视频数据集 Vimeo25M

链接直达手机查看

一键轻松打造你的专属AI应用

无需代码，最快5分钟，一键即可体验DeepSeek满血版、Qwen-max

什么是Vimeo25M

Vimeo25M是一个全面且多样化的视频数据集，包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源，这个数据集的目的是为了提高LaVie模型的性能，并且已经被广泛应用于LaVie模型的训练中，以实现高质量的文本到视频（T2V）生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力，这些特点使其在视频生成任务中表现出色。

该数据集不仅支持长篇视频生成，还适用于个性化视频合成等多种应用场景

Vimeo25M相关链接

相关导航

LAION-5B是一个大规模的多模态数据集，用于研究目的，包含约58.5亿个图像-文本对。这些数据对是通过CLIP模型过滤的，其中23亿对包含英语文本，22亿对来自超过100种其他语言，其余12.7亿对则包含无法明确归类于某一语言的文本。

FaceScape数据集

FaceScape是一个由南京大学计算机科学与技术系开发的大型高质量三维面部数据集，旨在推动单视图3D人脸重建技术的发展。

MNIST是一个手写数字数据集，包含一个60,000个样本的训练集和一个10,000个样本的测试集。

DPED数据集

DPED数据集（Deep Photo Enhancement Dataset）是一个大型的图像数据集，主要用于深度学习模型的训练和验证。该数据集包含从不同设备拍摄的真实照片，包括三部不同的手机和一台高端反光相机。

DIS5K数据集

DIS5K是一个用于二分图像分割（DIS）任务的数据集，包含5,470张高分辨率图像。

SkyReels-V2

SkyReels-V2是昆仑万维团队于2025年4月21日发布的一款创新性视频生成模型，其核心特点在于支持无限[…]