Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源,这个数据集的目的是为了提高LaVie模型的性能,并且已经被广泛应用于LaVie模型的训练中,以实现高质量的文本到视频(T2V)生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力,这些特点使其在视频生成任务中表现出色。
该数据集不仅支持长篇视频生成,还适用于个性化视频合成等多种应用场景
什么是3D-FRONT数据集3D-FRONT数据集是一个大规模且综合性的合成室内场景数据集,旨在提供高质量的[…]
Label Studio是一款开源的数据标注工具,广泛应用于机器学习和数据科学领域。它支持多种类型的数据,包括图像、音频、文本、视频和时间序列等。
LabelMe是MIT开源的数据标注平台,这是一个由麻省理工学院(MIT)的计算机科学和人工智能实验室(CSAIL)研发的图像标注工具,旨在帮助用户为图像、视频等数据添加标签,以供机器学习模型训练使用。
Caltech-256是一个由加利福尼亚理工学院收集整理的图像物体识别数据集,包含30,607张不同大小的真实世界图像,跨越257个类别(256个对象类别和一个额外的杂波类别)。每个类别至少由80张图像表示,确保了对象识别任务中有足够的样本来进行训练。
InsightFace 是一个开源的 2D&3D 深度人脸分析库,通过深度卷积神经网络和大规模数据集进行训练,它提供了高性能和准确性的人脸识别模型。
GarDiff是一种创新的虚拟试穿技术,旨在通过生成高保真且细节丰富的试穿图像来提升在线试穿体验。