开源的AI语音生成社区
Uberduck 功能:开源的AI语音生成社区,5000多种不同的声音,可使用自己的自定义语音克隆进行合成 。
Sonauto是一个AI音乐创作平台,它能够将文本描述转化为动听的音乐作品。无论是业余爱好者还是专业音乐人,都可以通过简单的文本输入来指导AI创作出符合自己想法的音乐。
EmotiVoice是一款由网易有道开发的开源文本到语音(TTS)引擎,支持中英文双语,并包含超过2000种不同的音色。其最显著的功能是情感合成功能,能够根据文本内容生成具有快乐、兴奋、悲伤、愤怒等多种情感的语音。
EmotiVoice-Plus是升级版文本转语音引擎,在原有网易有道EmotiVoice的基础上,增加了支持生成多人故事剧本的功能。
MooER是摩尔线程公司开发的一款音频理解大模型,是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型。
FunAudioLLM是一款致力于提升人类与大型语言模型(LLMs)之间自然语音交互的先进模型。它正以前所未有的方式,重塑着人与机器之间的语音交互。
Audiobox 是一款Meta推出的AI声音生成模型,Audiobox是基于Meta推出的Voicebox AI模型,能生成各种环境音、自然对话语音能够同时接收语音及文字输入,并整合了音频生成和编辑能力,用户可同时使用语音及文字描述,让这款模型生成所需的音频。