小米 MiMo-V2.5震撼公测

AI资讯 2个月前硕雀

58 0 0

2026年4月23日，小米官方正式宣布 Xiaomi MiMo-V2.5系列模型 开启公测，这是小米迄今最强大的人工智能大模型系列。

系列成员

该系列共包含 四款模型：

型号	定位	特点
MiMo-V2.5-Pro	旗舰推理模型	专为长难Agent任务设计，支持百万级上下文处理
MiMo-V2.5	通用场景模型	原生全模态Agent能力，覆盖图像、音频与视频
MiMo-V2.5-TTS Series	语音合成系列	包含三种语音合成模型，支持音色克隆
MiMo-V2.5-ASR	语音识别模型	复杂场景下的语音识别能力

核心能力

1. 智能体(Agent)能力

长程任务处理：可稳定完成近千轮工具调用的复杂任务
编译器开发：在北大编译原理课程项目中，4.3小时完成完整编译器，取得满分（233/233）
代码开发：在Rust编译器开发和视频编辑器构建中表现卓越，效率远超人类专家

2. 全模态感知

支持图像、音频、视频的原生全模态理解
跨模态推理、视频理解、图表分析能力全面提升
在VideoMME、CharXiv、MMMU-Pro等评测中逼近或超越业界顶级闭源模型

3. 上下文处理

支持百万级上下文长度
上下文窗口从原生的32K可扩展至256K

性能排名

根据权威机构榜单：

Artificial Analysis全球排名：综合智能指数位列全球开源大模型并列第一，总排名进入前五
Agent专项指数：位居全球开源大模型榜首
对标竞品：可与Claude Opus 4.6、GPT-5.4等顶尖Agent模型正面抗衡
国内对比：与Kimi K2.6并列中国模型前二

Token效率与成本优化

小米对Token Plan进行了全面优化：

优化项目	具体说明
Token效率	MiMo-V2.5-Pro较Kimi K2.6节省42% Token
	MiMo-V2.5较Muse Spark节省50% Token
API成本	相比上一代降低约50%
计费方式	取消原"1 Token=4 Credits"换算规则
夜间优惠	每日00:00-08:00 Credits消耗打8折
订阅模式	新增"连续包月""包年"选项

语音模型细节

MiMo-V2.5-TTS系列 包含三款模型：

MiMo-V2.5-TTS：内置多款高质量音色，支持语速、情绪、语气精细控制
MiMo-V2.5-TTS-VoiceDesign：可根据自然语言描述生成新音色
MiMo-V2.5-TTS-VoiceClone：可克隆真人声音，保留原声特征

MiMo-V2.5-ASR 在多种复杂场景下语音识别表现优异。

开源计划

MiMo-V2.5-Pro 和 MiMo-V2.5 将全球开源
开发者可通过 MiMo开放平台 接入API
或在 MiMo Studio 体验相关功能
相关模型已在Xiaomi MiMo API开放平台限时免费

总结

MiMo-V2.5系列的发布标志着小米在人工智能大模型领域已达到国际领先水平，尤其是在智能体能力、全模态感知和Token效率方面表现突出。其开源计划将进一步推动大模型生态的发展。

声明：文章均为AI生成，请谨慎辨别信息的真伪和可靠性！