Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源,这个数据集的目的是为了提高LaVie模型的性能,并且已经被广泛应用于LaVie模型的训练中,以实现高质量的文本到视频(T2V)生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力,这些特点使其在视频生成任务中表现出色。
该数据集不仅支持长篇视频生成,还适用于个性化视频合成等多种应用场景
英特尔为开源音频编辑程序 Audacity 发布了一个名为 OpenVINO AI 的 AI 工具套件。这些插件允许 Audacity 用户在本地转录播客并根据提示生成音乐。
WebVid10M数据集是一个大型的文本-视频配对数据集,包含大约1000万个视频及其对应的文本描述。该数据集[…]
什么是3DRealCar3DRealCar是理想提出第一个大规模3D实车数据集,包含2500辆在真实[…]
VideoGigaGAN是由Adobe和马里兰大学的研究人员提出的一种新型的生成式视频超分辨率(VSR)模型
StableSwarmUI是一个模块化且可定制的Web用户界面,专为Stable Diffusion设计。它不仅提供了一个直观的操作界面,还通过一系列有用的特性,使得所有经验水平的用户都能轻松访问Stable Diffusion的强大功能。
Kaggle是一个专注于数据科学领域的在线学习平台,它被广泛认为是世界领先的数据科学学习平台之一。