语音合成编辑器
高拟真度、灵活配置的语音合成产品,打通人机交互的闭环,让应用逼真发声。多种音色可供选择,并提供调节语速、语调、音量等功能
AI人声生成工具
MooER是摩尔线程公司开发的一款音频理解大模型,是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型。
闪剪是一款基于人工智能技术的智能视频剪辑工具,旨在帮助用户和企业高效、便捷地制作和发布短视频内容。它通过AI技[…]
FoleyCrafter是一个基于文本的视频到音频生成框架,可以生成与输入视频在语义上相关并且在时间上同步的高质量音频。
Tango 2是一款新型文本到音频生成模型,它通过直接偏好优化(Direct Preference Optimization, DPO),显著提升了音频输出与输入文本的匹配度。
TTSMarker是一个免费的、用户友好的文本转语音工具,可以让用户轻松地将文字转换成语音。用户可以自定义语音的风格、速度、音量和情感,并免费下载音频文件。