语音合成编辑器
高拟真度、灵活配置的语音合成产品,打通人机交互的闭环,让应用逼真发声。多种音色可供选择,并提供调节语速、语调、音量等功能
SenseVoice是由阿里开源的具有音频理解能力的音频基础模型
OpenVoice是一个由MyShell开发的即时语音克隆AI工具,它使用短音频片段来复制声音,并支持多语言。用户可以精确控制声音风格和情感,包括口音、节奏、停顿和语调等方面。
Azure AI TTS是微软开发的生成自然发音的应用和服务。通过自定义真实 AI 语音生成器让你的品牌独具特色,并使用具有不同说话风格和情感语调的语音来搭配你的用例(从文本阅读器和讲述者到客户支持聊天机器人)。
Easy-Voice-Toolkit 是一个功能丰富的开源音频处理项目,它集成了多种音频处理技术,为用户提供一站式的音频解决方案。
Seed-Music是一个由字节跳动研发的音乐生成模型,用户可以通过输入多模态数据(如文本描述、音频参考、乐谱、声音提示等)来生成音乐,并且提供了方便的后期编辑功能,比如修改歌词或旋律。
腾讯智影集素材搜集、智能配音、数字人播报、在线剪辑、协作审片等视频生产全链路于一体,引领智能创作新方式。