Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源,这个数据集的目的是为了提高LaVie模型的性能,并且已经被广泛应用于LaVie模型的训练中,以实现高质量的文本到视频(T2V)生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力,这些特点使其在视频生成任务中表现出色。
该数据集不仅支持长篇视频生成,还适用于个性化视频合成等多种应用场景
LAION-5B是一个大规模的多模态数据集,用于研究目的,包含约58.5亿个图像-文本对。这些数据对是通过CLIP模型过滤的,其中23亿对包含英语文本,22亿对来自超过100种其他语言,其余12.7亿对则包含无法明确归类于某一语言的文本。
FaceScape是一个由南京大学计算机科学与技术系开发的大型高质量三维面部数据集,旨在推动单视图3D人脸重建技术的发展。
MNIST是一个手写数字数据集,包含一个60,000个样本的训练集和一个10,000个样本的测试集。
DPED数据集(Deep Photo Enhancement Dataset)是一个大型的图像数据集,主要用于深度学习模型的训练和验证。该数据集包含从不同设备拍摄的真实照片,包括三部不同的手机和一台高端反光相机。
DIS5K是一个用于二分图像分割(DIS)任务的数据集,包含5,470张高分辨率图像。
SkyReels-V2是昆仑万维团队于2025年4月21日发布的一款创新性视频生成模型,其核心特点在于支持无限[…]