输入文字转语音,40多位智能主播ai 配音
讯飞ai 配音,输入文字转语音,40多位智能主播ai 配音,支持男女声/童声,支持英文/方言,文字转语音ai 配音广泛应用于广告ai 配音,产品介绍,车站播报,课程讲解等行业
GroqNotes是一个基于Streamlit的应用程序,它利用Groq的Whisper和Llama3技术,将音频内容快速转换成有组织的笔记。这个项目通过结合Groq的高速处理能力和先进的AI模型,实现了音频到文本的快速转换。
Auffusion 模型是由北京邮电大学的研究团队提出的一种基于扩散模型和大语言模型的文本到音频(Text-to-Audio,TTA) 系统,
ClearerVoice-Studio是阿里达摩院开源的一个音频处理工具,集成了语音增强、语音分离和音视频说话人提取等功能的开源语音处理框架。
Audiobox 是一款Meta推出的AI声音生成模型,Audiobox是基于Meta推出的Voicebox AI模型,能生成各种环境音、自然对话语音能够同时接收语音及文字输入,并整合了音频生成和编辑能力,用户可同时使用语音及文字描述,让这款模型生成所需的音频。
EmotiVoice-Plus是升级版文本转语音引擎,在原有网易有道EmotiVoice的基础上,增加了支持生成多人故事剧本的功能。
MusicLM是Google研究小组开发的一个从文本生成音乐模型。MusicLM采用了层次化的序列到序列的方法,这使得它能够生成几分钟内一致的音乐。