Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对
Vimeo25M是一个全面且多样化的视频数据集,包含2500万个文本-视频对。Vimeo25M数据集由上海人工智能实验室开源,这个数据集的目的是为了提高LaVie模型的性能,并且已经被广泛应用于LaVie模型的训练中,以实现高质量的文本到视频(T2V)生成。确保模型能够处理各种事件和内容类型。Vimeo25M特别重视质量、多样性和美学吸引力,这些特点使其在视频生成任务中表现出色。
该数据集不仅支持长篇视频生成,还适用于个性化视频合成等多种应用场景
XAgent是一个开源的基于大型语言模型(LLM)的自主智能体,可以自动解决各种任务。它被设计为一个通用的智能体,可以应用于各种任务。作为一个开源实验性大型语言模型(LLM)驱动的自主代理,其核心是利用先进的自然语言处理和机器学习技术,使其能够理解和生成人类语言,从而自动解决各种任务。
FinGPT是一个开源的金融领域大型语言模型,旨在提供一个适用于金融数据的训练和微调平台。它通过最新的调整方法如LoRA增强模型的适应性和准确性,支持多任务处理,如情感分析和市场数据分析。
Perplexica是一个开源的AI驱动搜索引擎,它不仅能够深入互联网寻找答案,而且能够理解用户的查询。
Flash-VStream是一种基于记忆机制的视频-语言模型,旨在实时处理和理解长视频流,并能够同时响应用户查询。
MultimodalC4的数据集是一个开放的、10亿规模的、与文本交错的图像语料库,其中包含了585M[…]
MEAD数据集是一个专注于情感谈话头部视频的大规模、高质量视听数据集。它包含了带有情绪类别和强度注释的高质量谈话头部视频,