Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源,这个数据集的目的是为了提高LaVie模型的性能,并且已经被广泛应用于LaVie模型的训练中,以实现高质量的文本到视频(T2V)生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力,这些特点使其在视频生成任务中表现出色。
该数据集不仅支持长篇视频生成,还适用于个性化视频合成等多种应用场景
SICE数据集(Single Image Contrast Enhancement)是一个专门用于单张图像对比度增强的数据集。该数据集包含多个部分,其中Part1和Part2是主要的部分,Lowlight_img文件夹内为低照度图像,Lowlight_img_label文件夹内为对应的正常光图像。
Places2数据集是一个大规模的场景图像数据集,广泛用于场景识别、图像修复和超分辨率等计算机视觉任务。
Stable Diffusion是stability.ai开源的图像生成模型。Stable Diffusion能够从文本描述中生成详细的图像,它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。
“万卷·丝路”多语言预训练语料库是由上海人工智能实验室联合大模型语料数据联盟成员共同发布的一个高质量多语言预训[…]
Stable Diffusion 3.5是Stability AI最新发布的AI图像生成模型,相较于前代产品SD3,它在图像生成的逼真度、提示响应和文本渲染方面都有显著提升。
InternVL简介InternVL是一个具有6亿参数的视觉变换器(ViT),它与大型语言模型(LLM)相结[…]