Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源,这个数据集的目的是为了提高LaVie模型的性能,并且已经被广泛应用于LaVie模型的训练中,以实现高质量的文本到视频(T2V)生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力,这些特点使其在视频生成任务中表现出色。
该数据集不仅支持长篇视频生成,还适用于个性化视频合成等多种应用场景
天池数据集平台是由阿里云推出的,旨在为科研人员和开发者提供高质量、脱敏后的数据集和计算资源的开放平台。
CelebV-Text数据集是一个大规模、高质量、多样化的人脸文本-视频数据集,旨在促进人脸文本到视频生成任务的研究。该数据集包含70,000个野外面部视频剪辑,每个视频剪辑都配有20个文本描述。
LobeChat 是一个开源的、可扩展的高性能聊天机器人框架。它支持一键免费部署私人 ChatGPT/LLM 网页应用程序。经过精心设计的界面,具有优雅的外观和流畅的交互效果,支持亮暗色主题,适配移动端。支持 PWA,提供更加接近原生应用的体验,会话支持插件扩展,用户可以安装和使用各种插件,例如搜索引擎、网页提取等,同时也支持自定义插件的开发,满足自定义需求。
一个拥有27亿参数的仅解码器语言模型
X-LLM是中国科学院自动化研究所和中国科学院大学联合推出一种先进的大型语言模型,通过引入多模态数据和自监督学习来提升其理解和生成自然语言的能力。
The Pile是一个由EleutherAI提供的825 GiB大小的多样化、开源语言建模数据集,它由22个较小的、高质量的数据集组合而成。这些子集包括书籍、新闻、维基百科、GitHub代码、科学论文和对话记录等,每个子集都具有其独特性。