昆仑万维正式推出Mureka V7.6 与 O2 模型发布，更高质量和更具创新性

AI资讯 3个月前硕雀

62 0 0

一、发布概述
2025 年 11 月 28 日，昆仑万维集团同步发布了 Mureka V7.6 与 Mureka O2 两款新模型。本次发布标志着 Mureka 系列在音乐生成与音乐推理两大技术路径上实现了全方位升级，进一步巩固了公司在 AI 音乐领域的领先地位。

二、Mureka V7.6 的核心升级

升级维度	具体表现	价值意义
音乐性 & 编曲能力	在旋律流畅度、和声丰富度以及编曲层次感上实现显著提升，能够更自然地捕捉不同风格的音乐结构	生成的作品更贴近专业音乐制作人的创作水平，适用于商业配乐、短视频音乐等高质量需求。
音质质感	采用改进的声学模型和更细粒度的音频后处理，使音色更饱满、细节更清晰，尤其在人声表现上提升约 44%（相较 V7.5）	提升用户听感，扩大在广告、品牌音效、游戏配乐等对音质要求严格的场景的适用范围。
Prompt 贴合度	引入更强的语义对齐机制，模型对文字指令的理解与音乐生成的对应度提升，能够更精准地实现“情感‑风格‑节奏”等多维度需求	降低创作门槛，创作者只需提供自然语言描述即可得到符合预期的音乐作品。
响应速度 & 推理效率	通过模型结构优化与算力调度改进，单曲生成时延下降约 30%，并在高并发场景下保持系统稳定	支持实时交互式创作、在线 API 调用以及大规模商业化部署。
系统稳定性	新增容错机制与自动恢复策略，长时运行的崩溃率下降至 0.2% 以下	为企业级客户提供可靠的服务保障，降低运维成本。

三、Mureka O2 的创新亮点

音乐推理（Music‑CoT）框架
- O2 在 O1 基础上进一步深化了 Chain‑of‑Thought（CoT）思考链路，实现“先思考‑再生成”的两阶段推理，使得旋律与歌词的匹配度、结构连贯性均有显著提升。
多模态输入
- 支持上传参考音频或 YouTube 链接进行音色克隆与风格迁移，用户可快速定制专属音色，提升个性化创作能力。
更高的生成质量指标
- 在官方实测中，O2 的发音清晰度、乐段准确率、文本相关度等客观指标均领先于同类开源模型，尤其在低延时生成方面表现突出。
API 与微调开放
- 同时推出全新 API 接口和模型微调功能，开发者可在自己的业务场景中进行二次训练，快速落地品牌定制音乐、游戏音效等细分应用。

四、与前代模型的对比

对比维度	V7.5（2025‑08）	V7.6（2025‑11）	O1（2025‑03）	O2（2025‑11）
音质提升	人声真实度提升 44%	进一步提升约 10%	—	—
Prompt 对齐	基础语义匹配	多维度情感‑风格‑节奏对齐	—	—
生成时延	-1.2 s/段	-0.8 s/段	-1.5 s/段	-0.9 s/段
推理效率	约 1.0 TFLOPS	约 1.3 TFLOPS	采用 CoT 思考链	深化 CoT，提升 15% 效率
开放能力	API 初版	完整 API + 微调	基础推理模型	完整 API + 微调 + 多模态输入

五、主要应用场景

六、行业意义与前景

技术领先：Mureka O2 通过音乐推理 CoT 实现的“思考‑生成”模式，在全球 AI 音乐模型中首创，已被业界视为新一代音乐生成范式。
商业化加速：响应速度与系统稳定性的提升，使得模型能够支撑大规模在线服务，配合 API 与微调开放，帮助昆仑万维在 AI 音乐平台、游戏音效外包等业务实现收入快速增长。
生态构建：从 V7.5 到 V7.6 再到 O2，昆仑万维形成了从基础模型、推理模型到应用层的完整闭环，为后续多模态（音视频）协同生成奠定了技术基础。

综合来看，Mureka V7.6 与 O2 的发布不仅在模型性能、生成质量、使用便捷性上实现了跨越式提升，也通过开放平台策略为行业生态注入了新活力，预计将在 AI 音乐、游戏音效以及品牌营销等多个细分市场产生深远影响。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！