开源的AI语音生成社区
Uberduck 功能:开源的AI语音生成社区,5000多种不同的声音,可使用自己的自定义语音克隆进行合成 。
FunAudioLLM是一款致力于提升人类与大型语言模型(LLMs)之间自然语音交互的先进模型。它正以前所未有的方式,重塑着人与机器之间的语音交互。
V2A(Video-to-Audio)是由谷歌DeepMind发布的一项视频转音频技术,旨在自动为视频生成同步的音频。
RVC变声器创始人 (GitHub昵称:RVC-Boss)开源了一款跨语言音色克隆项目 GPT-SoVITS。支持少量语音转换、文本到语音的音色克隆模型,支持中文、英文、日文的语音推理。
MARS5-TTS是一款由CAMB.AI公司开发的开源语音合成模型,能够将文本转化为逼真的语音
VideoLingo 是一款一站式视频翻译本地化配音工具,旨在生成 Netflix 级别的高质量字幕,告别生硬机翻,告别多行字幕,还能加上高质量的配音,让全世界的知识能够跨越语言的障碍共享。
可以将文本转换为不同格式的语音