阿里云语音 | AIUG

AI音频工具 AI配音合成（文转音，语音克隆） AI音频工具

阿里云语音

语音合成编辑器

链接直达手机查看

高拟真度、灵活配置的语音合成产品，打通人机交互的闭环，让应用逼真发声。多种音色可供选择，并提供调节语速、语调、音量等功能

FoleyCrafter是一个基于文本的视频到音频生成框架，可以生成与输入视频在语义上相关并且在时间上同步的高质量音频。

Udio简介Udio是一款由前GoogleDeepMind工程师开发的革命性的AI音乐创作工具，通过文本提[…]

ClearerVoice-Studio是阿里达摩院开源的一个音频处理工具，集成了语音增强、语音分离和音视频说话人提取等功能的开源语音处理框架。

多语言语音合成、声音克隆、文本和音频处理技术，可以把任意一段音频或者视频，快速翻译为包括中文、葡萄牙语、日语等在内的29种语言，同时保留原语音者的音色特征和情感

Seed-TTS是字节跳动团队推出的新型语音生成模型。该模型基于自回归Transformer架构，能够生成接近人类语音的自然且富有表现力的语音。Seed-TTS支持语音内容和说话速度的编辑，用户可以灵活调整生成的语音，以适应不同的应用场景。

OpenVoice是一个由MyShell开发的即时语音克隆AI工具，它使用短音频片段来复制声音，并支持多语言。用户可以精确控制声音风格和情感，包括口音、节奏、停顿和语调等方面。