昆仑万维于2025年8月15日正式上线了其最新的AI音乐模型Mureka V7.5,并推出了MoE-TTS语音模型。这一系列技术发布标志着昆仑万维在AI音乐创作和语音合成领域的重大突破。
Mureka V7.5模型
Mureka V7.5是昆仑万维在AI音乐创作领域的重要成果。该模型在中文音乐生成方面表现出色,能够深刻理解并再现不同文化语境下的音乐情感与艺术表达。Mureka V7.5不仅在音色和演奏技法上有所提升,还在咬字和情感表现上取得了显著进步。该模型通过优化自动语音识别(ASR)技术,能够更精准地识别唱词,并分析真实演唱中的气息运用、情感起伏和唱法细节,从而提升生成人声的自然度和情感表达的真实性。
Mureka V7.5的发布标志着昆仑万维在AI音乐创作领域的技术实力进一步增强,其在中文音乐生成领域的核心竞争力也得到了进一步巩固。
MoE-TTS语音模型
与此同时,昆仑万维语音团队还推出了MoE-TTS——首个基于Mixture of Experts(MOE)的角色描述语音合成框架。MoE-TTS是一种面向开放描述场景的语音合成框架,允许用户通过自然语言描述(如“清澈的少年音带磁性尾韵”)精准控制声音特征与风格。该技术在仅使用开源数据的情况下,也能在角色贴合度上对标甚至超越闭源商业产品。
MoE-TTS在涵盖域内与域外描述的双测试集上,表现出色,尤其在风格表现力贴合度和整体贴合度等方面优于主流闭源TTS模型。该技术的推出为语音合成领域提供了新的研究方向,并有望推动行业从“封闭标签式控制”向“自然语言自由控制”的新范式发展。
技术背景与生态布局
昆仑万维在AI领域的布局不仅限于单一产品,而是构建了一个多模态AI生态。例如,Mureka V7.5的发布是昆仑万维“开源共建、生态共赢”战略的重要一步,旨在为开发者和创作者提供更开放的AI工具,推动AI音乐和语音技术的进一步发展。此外,昆仑万维在AI音乐、AI短剧、AI社交等多个领域均有布局,形成了多模态AI技术的闭环。
总结
昆仑万维通过Mureka V7.5和MoE-TTS的发布,展示了其在AI音乐创作和语音合成领域的技术实力与创新能力。这些技术不仅为音乐创作和语音合成带来了新的可能性,也为相关领域的研究和发展提供了新的方向和思路