语音合成编辑器
高拟真度、灵活配置的语音合成产品,打通人机交互的闭环,让应用逼真发声。多种音色可供选择,并提供调节语速、语调、音量等功能
FoleyCrafter是一个基于文本的视频到音频生成框架,可以生成与输入视频在语义上相关并且在时间上同步的高质量音频。
Udio简介Udio是一款由前GoogleDeepMind工程师开发的革命性的AI音乐创作工具,通过文本提[…]
ClearerVoice-Studio是阿里达摩院开源的一个音频处理工具,集成了语音增强、语音分离和音视频说话人提取等功能的开源语音处理框架。
多语言语音合成、声音克隆、文本和音频处理技术,可以把任意一段音频或者视频,快速翻译为包括中文、葡萄牙语、日语等在内的29种语言,同时保留原语音者的音色特征和情感
Seed-TTS是字节跳动团队推出的新型语音生成模型。该模型基于自回归Transformer架构,能够生成接近人类语音的自然且富有表现力的语音。Seed-TTS支持语音内容和说话速度的编辑,用户可以灵活调整生成的语音,以适应不同的应用场景。
OpenVoice是一个由MyShell开发的即时语音克隆AI工具,它使用短音频片段来复制声音,并支持多语言。用户可以精确控制声音风格和情感,包括口音、节奏、停顿和语调等方面。