小米 MiMo-V2.5震撼公测

AI资讯 2小时前 硕雀
2 0

2026年4月23日,小米官方正式宣布 Xiaomi MiMo-V2.5系列模型 开启公测,这是小米迄今最强大的人工智能大模型系列。


系列成员

该系列共包含 四款模型

型号 定位 特点
MiMo-V2.5-Pro 旗舰推理模型 专为长难Agent任务设计,支持百万级上下文处理
MiMo-V2.5 通用场景模型 原生全模态Agent能力,覆盖图像、音频与视频
MiMo-V2.5-TTS Series 语音合成系列 包含三种语音合成模型,支持音色克隆
MiMo-V2.5-ASR 语音识别模型 复杂场景下的语音识别能力

核心能力

1. 智能体(Agent)能力

  • 长程任务处理:可稳定完成近千轮工具调用的复杂任务
  • 编译器开发:在北大编译原理课程项目中,4.3小时完成完整编译器,取得满分(233/233)
  • 代码开发:在Rust编译器开发和视频编辑器构建中表现卓越,效率远超人类专家

2. 全模态感知

  • 支持图像、音频、视频的原生全模态理解
  • 跨模态推理、视频理解、图表分析能力全面提升
  • 在VideoMME、CharXiv、MMMU-Pro等评测中逼近或超越业界顶级闭源模型

3. 上下文处理

  • 支持百万级上下文长度
  • 上下文窗口从原生的32K可扩展至256K

性能排名

根据权威机构榜单:

  • Artificial Analysis全球排名:综合智能指数位列全球开源大模型并列第一,总排名进入前五
  • Agent专项指数:位居全球开源大模型榜首
  • 对标竞品:可与Claude Opus 4.6、GPT-5.4等顶尖Agent模型正面抗衡
  • 国内对比:与Kimi K2.6并列中国模型前二

Token效率与成本优化

小米对Token Plan进行了全面优化:

优化项目 具体说明
Token效率 MiMo-V2.5-Pro较Kimi K2.6节省42% Token
MiMo-V2.5较Muse Spark节省50% Token
API成本 相比上一代降低约50%
计费方式 取消原"1 Token=4 Credits"换算规则
夜间优惠 每日00:00-08:00 Credits消耗打8折
订阅模式 新增"连续包月""包年"选项

语音模型细节

MiMo-V2.5-TTS系列 包含三款模型:

  1. MiMo-V2.5-TTS:内置多款高质量音色,支持语速、情绪、语气精细控制
  2. MiMo-V2.5-TTS-VoiceDesign:可根据自然语言描述生成新音色
  3. MiMo-V2.5-TTS-VoiceClone:可克隆真人声音,保留原声特征

MiMo-V2.5-ASR 在多种复杂场景下语音识别表现优异。


开源计划

  • MiMo-V2.5-Pro 和 MiMo-V2.5 将全球开源
  • 开发者可通过 MiMo开放平台 接入API
  • 或在 MiMo Studio 体验相关功能
  • 相关模型已在Xiaomi MiMo API开放平台限时免费

总结

MiMo-V2.5系列的发布标志着小米在人工智能大模型领域已达到国际领先水平,尤其是在智能体能力全模态感知Token效率方面表现突出。其开源计划将进一步推动大模型生态的发展。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!