语音合成编辑器
高拟真度、灵活配置的语音合成产品,打通人机交互的闭环,让应用逼真发声。多种音色可供选择,并提供调节语速、语调、音量等功能
FunAudioLLM是一款致力于提升人类与大型语言模型(LLMs)之间自然语音交互的先进模型。它正以前所未有的方式,重塑着人与机器之间的语音交互。
MooER是摩尔线程公司开发的一款音频理解大模型,是业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型。
FluxMusic是一种基于扩散模型和Transformer架构(DiT)的开源音乐生成模型,该模型能够很好地遵循提示词生成音乐,并且生成的音乐更加自然流畅。
FoleyCrafter是一个基于文本的视频到音频生成框架,可以生成与输入视频在语义上相关并且在时间上同步的高质量音频。
BeatBot是一个AI歌曲制作工具
MuseNet是由OpenAI开发的一款基于深度神经网络的音乐生成工具,它能够使用多达10种不同的乐器生成4分钟的音乐作品。