开源的AI语音生成社区
Uberduck 功能:开源的AI语音生成社区,5000多种不同的声音,可使用自己的自定义语音克隆进行合成 。
V2A(Video-to-Audio)是由谷歌DeepMind发布的一项视频转音频技术,旨在自动为视频生成同步的音频。
CosyVoice是一个由阿里通义实验室开源的语音生成模型,专注于自然语音生成。它支持多语言、音色和情感控制,能够生成多种语言的自然流畅语音。
Parler-TTS是一个高质量文本到语音(TTS)模型,它能够生成高质量且听起来非常自然的语音。
闪剪是一款基于人工智能技术的智能视频剪辑工具,旨在帮助用户和企业高效、便捷地制作和发布短视频内容。它通过AI技[…]
可以将文本转换为不同格式的语音
天工SkyMusic是昆仑万维推出的一款AI音乐生成大模型,它是基于昆仑万维的「天工3.0」超级大模型打造。