Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源,这个数据集的目的是为了提高LaVie模型的性能,并且已经被广泛应用于LaVie模型的训练中,以实现高质量的文本到视频(T2V)生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力,这些特点使其在视频生成任务中表现出色。
该数据集不仅支持长篇视频生成,还适用于个性化视频合成等多种应用场景
HelpSteer2数据集是由NVIDIA发布的一个开源数据集,旨在训练能够与人类偏好对齐的先进奖励模型,以便将大型语言模型(LLMs)与人类偏好对齐。该数据集包含10,681个提示-响应对,这些对在五个属性上使用李克特量表进行了标注。
“万卷·丝路”多语言预训练语料库是由上海人工智能实验室联合大模型语料数据联盟成员共同发布的一个高质量多语言预训[…]
FinGPT是一个开源的金融领域大型语言模型,旨在提供一个适用于金融数据的训练和微调平台。它通过最新的调整方法如LoRA增强模型的适应性和准确性,支持多任务处理,如情感分析和市场数据分析。
什么是DataFormulatorDataFormulator是由微软雷德蒙研究院深度学习组开发的一款A[…]
DPED数据集(Deep Photo Enhancement Dataset)是一个大型的图像数据集,主要用于深度学习模型的训练和验证。该数据集包含从不同设备拍摄的真实照片,包括三部不同的手机和一台高端反光相机。
SICE数据集(Single Image Contrast Enhancement)是一个专门用于单张图像对比度增强的数据集。该数据集包含多个部分,其中Part1和Part2是主要的部分,Lowlight_img文件夹内为低照度图像,Lowlight_img_label文件夹内为对应的正常光图像。