昆仑万维正式推出Mureka V7.6 与 O2 模型发布,更高质量和更具创新性

AI资讯 18小时前 硕雀
5 0

一、发布概述
2025 年 11 月 28 日,昆仑万维集团同步发布了 Mureka V7.6 与 Mureka O2 两款新模型。本次发布标志着 Mureka 系列在音乐生成与音乐推理两大技术路径上实现了全方位升级,进一步巩固了公司在 AI 音乐领域的领先地位。

二、Mureka V7.6 的核心升级

升级维度 具体表现 价值意义
音乐性 & 编曲能力 在旋律流畅度、和声丰富度以及编曲层次感上实现显著提升,能够更自然地捕捉不同风格的音乐结构 生成的作品更贴近专业音乐制作人的创作水平,适用于商业配乐、短视频音乐等高质量需求。
音质质感 采用改进的声学模型和更细粒度的音频后处理,使音色更饱满、细节更清晰,尤其在人声表现上提升约 44%(相较 V7.5) 提升用户听感,扩大在广告、品牌音效、游戏配乐等对音质要求严格的场景的适用范围。
Prompt 贴合度 引入更强的语义对齐机制,模型对文字指令的理解与音乐生成的对应度提升,能够更精准地实现“情感‑风格‑节奏”等多维度需求 降低创作门槛,创作者只需提供自然语言描述即可得到符合预期的音乐作品。
响应速度 & 推理效率 通过模型结构优化与算力调度改进,单曲生成时延下降约 30%,并在高并发场景下保持系统稳定 支持实时交互式创作、在线 API 调用以及大规模商业化部署。
系统稳定性 新增容错机制与自动恢复策略,长时运行的崩溃率下降至 0.2% 以下 为企业级客户提供可靠的服务保障,降低运维成本。

三、Mureka O2 的创新亮点

  1. 音乐推理(Music‑CoT)框架
    • O2 在 O1 基础上进一步深化了 Chain‑of‑Thought(CoT)思考链路,实现“先思考‑再生成”的两阶段推理,使得旋律与歌词的匹配度、结构连贯性均有显著提升。
  2. 多模态输入
    • 支持上传参考音频或 YouTube 链接进行音色克隆与风格迁移,用户可快速定制专属音色,提升个性化创作能力。
  3. 更高的生成质量指标
    • 在官方实测中,O2 的发音清晰度、乐段准确率、文本相关度等客观指标均领先于同类开源模型,尤其在低延时生成方面表现突出。
  4. API 与微调开放
    • 同时推出全新 API 接口和模型微调功能,开发者可在自己的业务场景中进行二次训练,快速落地品牌定制音乐、游戏音效等细分应用。

四、与前代模型的对比

对比维度 V7.5(2025‑08) V7.6(2025‑11) O1(2025‑03) O2(2025‑11)
音质提升 人声真实度提升 44% 进一步提升约 10%
Prompt 对齐 基础语义匹配 多维度情感‑风格‑节奏对齐
生成时延 -1.2 s/段 -0.8 s/段 -1.5 s/段 -0.9 s/段
推理效率 约 1.0 TFLOPS 约 1.3 TFLOPS 采用 CoT 思考链 深化 CoT,提升 15% 效率
开放能力 API 初版 完整 API + 微调 基础推理模型 完整 API + 微调 + 多模态输入

五、主要应用场景

  • 内容创作:短视频平台、直播间背景音乐、社交媒体音频贴纸。
  • 游戏与交互:游戏配乐、角色主题曲、动态音效生成,实现“一键生成”游戏音轨。
  • 品牌营销:广告 jingles、品牌主题音乐、定制化音色用于企业形象塑造。
  • 个性化音乐服务:AI 歌手、歌声克隆、用户上传音频实现风格迁移,满足 K‑歌、AI 歌手等新兴需求。
  • 开发者生态:开放 API 与微调功能让第三方开发者在教育、娱乐、媒体等垂直领域快速集成 AI 音乐能力。

六、行业意义与前景

  • 技术领先:Mureka O2 通过音乐推理 CoT 实现的“思考‑生成”模式,在全球 AI 音乐模型中首创,已被业界视为新一代音乐生成范式。
  • 商业化加速:响应速度与系统稳定性的提升,使得模型能够支撑大规模在线服务,配合 API 与微调开放,帮助昆仑万维在 AI 音乐平台、游戏音效外包等业务实现收入快速增长。
  • 生态构建:从 V7.5 到 V7.6 再到 O2,昆仑万维形成了从基础模型、推理模型到应用层的完整闭环,为后续多模态(音视频)协同生成奠定了技术基础。

综合来看,Mureka V7.6 与 O2 的发布不仅在模型性能、生成质量、使用便捷性上实现了跨越式提升,也通过开放平台策略为行业生态注入了新活力,预计将在 AI 音乐、游戏音效以及品牌营销等多个细分市场产生深远影响。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!